Intuitivamente, para hacer la prueba de cointegración, porque si dos variables son cointegrated, sólo representan un "unidimensional" de la familia de puntos de datos - incluso si usted tiene un millón de puntos de datos a partir de esa muestra, que se encuentran cerca del mismo subespacio, y, en general, que significa que usted tendrá muchos de los valores de los parámetros para su regresión problema que le dará un buen ajuste (regresión espuria).
Considere la posibilidad de la regresión lineal de caso - digamos que usted tiene $ y = Ax + \varepsilon $ como problema de regresión, donde $ x $ es un vector columna, $ A $ es un vector fila y $ y $ es un número real. Digamos, además, que el "estructural" de la relación que estamos buscando es $ $ y = Bx $, donde $ B $ es también un vector de fila. Tomar un caso extremo de cointegración - $ x $ es $ 2 $-dimensional, y tenemos una relación lineal entre sus coordenadas, yo.e $ x_2 = c x_1 $ para algunas constantes $ c $. En este caso, cualquier funcional lineal $ A $, que es igual a $ B $ cuando restringida al subespacio generado por $ (1, c) $ proporcionará un ajuste perfecto, y la regresión no ser capaz de distinguir entre ellos. (Hay una dimensión de la familia de tal funcionales, yo.e vectores fila $ A $.)
Lo vecm que se encuentra el análisis que hace es tomar ventaja de las desviaciones cuando la relación no es perfecta. En real las aplicaciones econométricas, usted nunca tendrá una relación que es tan limpio como $ x_2 = c x_1 $ (o $ y = Bx $) para todo el conjunto de datos - de cointegración permite transitorio de ruido blanco en la combinación lineal $ x_2 - c x_1 $. Si la varianza del ruido blanco es relativamente pequeño, un estándar de la regresión regresará similares $ R^2 $ valores para diferentes operadores. En lugar de eso, lo que tienes que hacer es mirar en primeras diferencias: un buen ajuste también debe adaptarse a estas, yo.e debemos tener
$$ Ax_{t+1} - Ax_t \aprox y_{t+1} - y_t $$
donde los subíndices indican el momento de la observación. Correr la regresión de esta manera le permite capturar el ruido blanco en el proceso de cointegración y de utilizar a su ventaja - es una forma de captar la información que un ingenuo de regresión lineal se va a perder.