2 votos

La transformación de las Variables en la Regresión

Tengo un problema muy simple que espero que alguien me pueda ayudar o, al menos, me apunte en la dirección correcta.

Estoy probando a ver los factores que afectan el índice devuelve el que más y el que quisiera encontrar la manera correcta para transformar las variables utilizadas en el modelo de regresión múltiple. Los datos de la muestra cubre el período de 1990 a 2013 con una frecuencia trimestral (96 observaciones).

Para mi la variable dependiente, he calculado índice trimestral de la devuelve.

Para las variables independientes conjunto, he recogido los datos trimestrales para: IPC%, 3 años, 10 años, la tasa de desempleo, y un par de tipos de cambio.

Debo calcular trimestral % cambios para todos mis variables(ya que yo solía declaraciones trimestrales para mi dependiente), dejarlos intactos(y el uso de los valores del índice en lugar de devoluciones), o cambiar de una manera diferente?

Gracias,

Aquí está una captura de pantalla de mi actual conjunto de datos:

Current Data Set

2voto

shyam Puntos 4133

Reglas básicas para qué quieres seguir a tener un significativo resultado

1 All your variables should be in the same terms 
2.All your regression variables should be stationary (weak sense stationary) - check if there are long term dependencies 
3.Test for multi-collinearity / Serial correlation / Homocedasticity each variable against the predictor. 

1voto

RedFilter Puntos 333

Te sugiero que para poner en práctica todos los análisis citados anteriormente y analizar los resultados de la elección del mejor modelo en modelo de las medidas de rendimiento, como, por ejemplo, el modelo de $R^2$ valor de la AIC (BIC) de valor, etc.; esta debería ser la forma correcta de desarrollar un modelo.

En cuanto a tu pregunta en particular, la literatura sobre el tema sugieren que el modelo a desarrollar sobre la base de que el cambio en los porcentajes de todas las variables que considerar la posibilidad de desarrollar el modelo de factor.

En el asunto de la transformación de la variable dependiente, usted debe considerar la posibilidad de la transformación que en los rendimientos de cumplir con los supuestos del modelo de regresión lineal; de hecho, la logarítmica rendimientos se distribuyen de acuerdo a la distribución Normal si están en el rango [-0.04; +0.04] de acuerdo con la aproximación de Taylor, y es más probable que produzca una distribución normal de los residuos; los valores fuera de este rango deben ser considerados como valores atípicos.

Lo mismo para la variable independiente; debe transformar en cambio en el porcentaje de la variable, si aún no.

Por último, es más fácil analizar log-log modelo de regresión de los resultados de nivel de registro o registro de modelo de nivel.

Como última sugerencia, yo en primer lugar, sugieren que el desarrollo de un modelo teniendo en cuenta el modelo de regresión lineal de la asunción y la prueba de la fiabilidad de dichas hipótesis después de ejecutar el modelo de prueba para la homoschedasticity, autocorrelación, multicolinealidad,...). Por otra parte, tratar de construir un conjunto de datos fiables; utilizando datos trimestrales usted puede tener menos de la observación y obtener resultados sesgados. Así que, si es posible, el uso de datos de mayor frecuencia que el tuyo, como, por ejemplo, mensual, semanal, diaria de datos. EDIT: ya que el conjunto de datos es bastante pequeño (~96 observaciones), usted debe tratar de obtener más datos para mejorar su análisis mediante la recopilación de datos anteriores a la década de 1990 o más tarde de 2013.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X