3 votos

Qué hacer para que los puntos que faltan en el IPC de la serie de tiempo?

Estoy buscando en el IPC de los conjuntos de datos para los países en desarrollo que tienen lagunas en ellos.

Para cada país, tengo dos series de tiempo con promedios anuales para los años 2000-2013: i) General/IPC General y ii) el IPC de Alimentos. También estoy suponiendo que el IPC de Alimentos debe tener alguna relación con el General/IPC General desde la categoría de Alimentos tiene su propio peso en el IPC General.

Ahora, tengo dos tipos de casos, algunos tales como: http://imgur.com/a/9z7o8#1 donde las brechas entre los valores. Estoy suponiendo que yo pueda interpolar aquí, si es así, ¿cómo puedo seguir adelante con esto? También tengo que lidiar con los casos más complicados, tales como: http://imgur.com/a/9z7o8#0, cualquier sugerencia en este caso? Sería una simple extrapolación sentido aquí?

Una opción para mi primer caso que he leído (en BLS) está tomando la media geométrica del año inmediatamente antes y después de la falta de valor. Otras personas han sugerido que debo predecir los valores faltantes por un simple modelo de regresión de la CPI en el deflactor del PIB para ese año (que yo tengo).

También, en algunos casos, las brechas en promedios anuales existen porque los datos mensuales necesarios para el cálculo de estos promedios es incompleta. Así que decir que sólo tengo los datos de 2006 para Rusia, para los meses de enero-junio, luego que el promedio anual de punto de datos faltantes en las series de datos. Asumo que puede tomar un promedio simple de la disposición meses y imputar que para el año 2006?

Gracias de antemano

1voto

Vitalik Puntos 184

Análisis estadístico con los Datos que Faltan por Little y Rubin es el go-to de referencia para trabajar con los datos que faltan, al menos si nada el estado de la técnica es necesaria. En general, este es un problema complejo, que sigue siendo un área de investigación activa. La relativamente fácil de los casos son cuando los datos que faltan-completo-en-azar o de la falta-en-aleatorios. Incluso entre los más básicos sola métodos de imputación de que usted tiene un montón de opciones (lista de Little y Rubin):

  1. La media de imputación (reemplazar con los valores de la media)
  2. La imputación de regresión
  3. La imputación de regresión estocástica
  4. Caliente de la cubierta de la imputación (sustituir valores individuales extraídos de "similares" a las unidades de respuesta)
  5. Sustitución (no es relevante en su contexto)
  6. El frío de la cubierta de la imputación (reemplazando el valor con el valor de la constante de fuente externa, como último valor)
  7. Compuestos de los métodos anteriores

Sin embargo, si todos los del nivel general de precios es lo que es de interés y no de la dinámica del nivel de precios (por ejemplo, porque quiere un deflactor en lugar de estudiar la dinámica de la inflación) lineal interpolación / extrapolación puede ser buena. Fundamentalmente, ya que la deflación es raro, si los precios son de 100 en el tiempo t y 110 en t+2, de manera realista los precios en t+1 va a estar en algún lugar en $[100,110]$ y un montón de modelos puede llegar allí.

Puede comprobar el dentro y fuera de muestra de la calidad de predicción para evaluar si el método es un buen predictor de los precios faltantes. Dentro de la muestra de prueba podría ser tan simple como preguntar si el $R^2$ es de alta de un modelo predictivo. Obviamente, usted puede hacer mucho más rica análisis de eso. Para salir de pruebas de muestra, considere la posibilidad de dividir la muestra y calibrar el modelo sólo en la primera mitad de los datos, la evaluación de la predicción de la calidad en la segunda mitad de los datos.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X