Si modelamos la volatilidad de los rendimientos de los activos para periodos de más de uno (digamos más de un día), existe la regla de root cuadrada que se cumple bajo algunos supuestos. La situación es más complicada si nos fijamos en la función de distribución empírica.
Para hacer frente a este problema, los profesionales utilizan a veces datos rodantes y superpuestos. Tratarlos como si no estuvieran solapados me parece erróneo (es erróneo), pero ¿hasta qué punto es erróneo y cómo se puede arreglar este enfoque?
Con mal me refiero a que la distribución de $\sum_{i=1}^{180} r_i$ con $r_i$ muestreada no correlacionada será diferente de la distribución de esta muestra de datos superpuestos.
He oído hablar del siguiente enfoque de modelado: Toman una muestra de $1000$ observaciones diarias (rendimientos diarios/variaciones porcentuales) y luego construyen $180$ devoluciones de días. Por último, examinan la función de distribución empírica (FDE) y los cuantiles empíricos de estos rendimientos rodantes/sobrepuestos.
Matemáticamente tienen $(r_i)_{i=1}^{1000}$ y luego miran $$y_1 = \sum_{i=1}^{180} r_i, \quad y_2 = \sum_{i=2}^{181} r_i, \quad y_3 = \sum_{i=3}^{182} r_i, \cdots $$
La muestra del $(y_i)_{i=1}^{820}$ es un conjunto de variables aleatorias fuertemente dependientes. ¿Cuáles son las propiedades de su edf? ¿Cómo se relaciona con la edf de la muestra de $(r_i)_{i=1}^{1000}$ ? ¿Cómo podemos relacionar las estimaciones de volatilidad?
Al hablar de los rendimientos de los activos, podemos suponer que el $(r_i)_{i=1}^{1000}$ para que no estén correlacionados en serie pero no sean independientes. Esto dificulta un tratamiento riguroso.
Este es un puesto cruzado ya que la pregunta no recibió suficiente atención (después de varios días y una recompensa).
Qué se puede decir, por ejemplo, de la varianza de los datos anuales basados en datos superpuestos (por ejemplo, del 1 de enero de 2015 al 1 de enero de 2016, del 2 de enero de 2015 al 2 de enero de 2016, del 3 de enero de 2015 al 3 de enero de 2016, ... y así sucesivamente). La función de distribución empírica es quizás demasiado dura. ¿Pero qué pasa con la varianza?
En resumen, el objetivo es:
- Estimar un cuantil de la distribución de la rentabilidad/pérdida del año siguiente (utilizando los datos anuales superpuestos del pasado).
- Estimar la varianza de la rentabilidad/pérdida del año siguiente (utilizando los datos anuales superpuestos del pasado).
El resultado podría ser un conjunto de propiedades de los estimadores de las cantidades anteriores cuando sólo tenemos los datos superpuestos. Podría haber un sesgo que hay que corregir.
EDIT: Como señalan algunos usuarios una forma de verlo es como estadística bootstrap. He empezado a leer esto: Métodos Bootstrap para las finanzas: Review and Análisis y sus referencias. El punto de vista de Boostrap parece muy prometedor. Todavía no he llegado a una respuesta completa.
0 votos
Por favor @Richard, ¿puedes publicar el enlace del artículo que citaste/escuchaste?
0 votos
Lo siento... sólo comunicación personal.
0 votos
@Quantopic he iniciado una recompensa por esto... ¿tienes alguna idea? ¿Tal vez sólo sobre la estimación de la varianza?
0 votos
Para orientarse, ¿cuál es el objetivo final aquí?
0 votos
@MatthewGunn originalmente: encontrar un cuantil de la distribución de la rentabilidad/pérdida del año siguiente (utilizando los datos anuales superpuestos del pasado). Además: encontrar la varianza de la rentabilidad/pérdida del año siguiente (utilizando los datos anuales superpuestos del pasado). Voy a publicar una edición
1 votos
Reacción rápida: parece que estás describiendo un bloque de arranque en movimiento . Profesor Bryan Kelly por ejemplo, ha utilizado el bootstrap de bloque circular de Politis y Romano (1992) ¿tal vez en un entorno relacionado? Si tengo tiempo, quizás pueda ampliarlo en un comentario lo suficientemente sustancioso como para ir en la sección de respuestas.
0 votos
@MatthewGunn sí, genial, creo que el enlace de la wikipedia apunta a la dirección correcta. El uso de estos datos superpuestos es una especie de boostrapping. Sería genial si pudieras ampliar esto a una respuesta. Si revisas la web entonces verás que esta respuesta es realmente necesaria. Gracias.
0 votos
Creo que tu pregunta está esencialmente respondida en este post: quant.stackexchange.com/questions/740/ , que redirige a una pregunta sobre el CV, pero también enlaza con este documento y una citación de este documento con algunos buenos tratamientos.
0 votos
@BrianB He visto la pregunta y los papers a los que se suele hacer referencia (la mayoría en el contexto de la regresión) y no veo la conexión directa. ¿Hay alguna? De momento el aspecto de boostrap me parece prometedor. Te agradecería que escribieras una respuesta si es que se puede encontrar utilizando los enlaces. Gracias