2 votos

¿Cómo tratar los valores perdidos en una serie temporal de datos bursátiles?

He recopilado datos para el período de 2002 a 2018 para los siguientes índices Nifty (India), NASDAQ (EE.UU.), ADX (EAU) y TASI (Arabia Saudita). Después de la recopilación, he organizado los datos en una sola hoja con la fecha y el precio de cierre para los cuatro índices. Como sabemos que los días laborables difieren para los mercados de valores, hay fechas que faltan entre cada país. Por ejemplo, los viernes son festivos para las bolsas de Arabia Saudí y de los Emiratos Árabes Unidos, mientras que son días laborables para las otras dos bolsas. Por favor, indíqueme cómo tratar estos valores que faltan.

Lo que sentí es copiar y pegar el precio de cierre de los días anteriores para los períodos que faltan. ¿Es el enfoque correcto? o hay alguna otra alternativa.

7voto

Luther Baker Puntos 2656

Algunos enfoques

  • Utilice sólo los puntos comunes - Excluya todos los días festivos en cualquier índice.
    • Tamaño reducido de la muestra
    • Pérdida de información
    • No hay datos "inventados" (coherencia)
  • Rellenar hacia adelante - utilizar el día anterior como usted sugirió.
    • La cuestión es que los saltos en el mercado durante las vacaciones se registran como un cambio cero y luego como un gran cambio.
  • Interpolación lineal: interpolar linealmente el precio en función del tiempo.
    • Esto ayuda con los saltos presentes en el método de relleno hacia adelante, pero puede conducir a un aumento de la correlación serial de los rendimientos que es un artefacto puro de este método.
  • Remuestreo: dado que sólo tiene 4 índices en los que se está fijando, podría remuestrear de forma empírica la distribución conjunta de los rendimientos en una ventana en torno a la brecha que está tratando de cubrir. Básicamente, busque un día cercano que sea lo más similar posible en el que todos los índices estén disponibles en el espacio de cambio (espacio de retorno) y utilícelo como el cambio del precio anterior en su índice perdido.
    • El problema es que puede que no haya un día muy similar en su conjunto de datos
    • Además, en este punto, usted está "inventando" datos.
    • Deben mantener propiedades distributivas similares
  • Muestreo paramétrico - Ajustar la distribución conjunta de los rendimientos a partir de los datos disponibles y muestrear a partir de ella para rellenar los puntos
    • Sujeto a problemas de ajuste del modelo (por ejemplo, si se asume una distribución normal conjunta pero la muestra no es IID)
    • Estás sujeto a la aleatoriedad del universo, puedes recibir una muestra extravagante. Para combatirlo, puedes rellenar con la media, pero esto tiene el efecto de amortiguar la varianza.

Si alguien encuentra esta respuesta y está buscando ediciones de historiales de inversión que difieren en longitud, entonces puede estar interesado en Stambaugh (1997)

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X