8 votos

¿Por qué nos obsesiona normalizar los datos financieros?

Recientemente he empezado a trabajar con algunos datos financieros de alta frecuencia. Me han dicho que "normalice" los datos tanto como sea posible y que haga regresiones lineales con ellos. De hecho, los datos ya no parecen ser lineales después de haberles hecho transformaciones (box-cox/log, etc.) Entiendo lo de las regresiones lineales, pero la mayoría de los datos financieros no son normales de todos modos, así que ¿por qué molestarse en normalizarlos?

1 votos

Porque si no, no se puede comparar.

2 votos

La normalización suele significar restar la media y dividir por la desviación estándar. Esa transformación no hará que los datos no normales sean normales.

0 votos

Lo siento, lo que quise decir con normalizar es hacer que la distribución se parezca lo más posible a una distribución normal. de ahí el "normalizar

3voto

mechler Puntos 16

Respuesta corta:
Ofrece cierto grado -y en muchos casos, un grado mayor- de comparabilidad entre dos tipos de datos (diferentes activos, rendimientos, etc.)

Respuesta larga:
Puede que ya lo sepas, pero ten en cuenta que "normalización" puede significar diferentes cosas (ver esta pregunta ). Hay varios métodos y propósitos para normalizar los datos (financieros o de otro tipo), pero mantén las cosas en perspectiva. Normalice cuando sea útil para lo que está tratando de lograr, y utilice una técnica de normalización que sea apropiada. La regresión lineal tiene limitaciones, tomar el logaritmo tiene limitaciones, etc. Es genial tener una gran caja de herramientas de diferentes transformaciones de datos, pero parte de eso es saber qué usar.

Como apunte, tienes razón en que empíricamente los mercados no han mostrado rendimientos normales. De hecho, Mandelbrot explica en este artículo que el Distribución de Pareto es más realista. Se publicó en 1963, pero más recientemente habla en este libro sobre cómo los datos han seguido demostrando este patrón. La cuestión es que es posible que leas o escuches sobre técnicas de normalización que se basan en supuestos como la normalidad, que no siempre son adecuados para el problema en cuestión. A riesgo de editorializar, la suposición de normalidad se ha incorporado sutilmente a muchas investigaciones financieras y a veces puede ser engañosa, así que asegúrese de comprobar las suposiciones que subyacen a lo que se le dice.

Dicho esto, el hecho de que una suposición de este tipo pueda no ser válida con carácter general (ya sea teórica o empíricamente) no significa que no sea útil para resolver eficazmente algún problema específico desde una perspectiva matemática o computacional. Por ejemplo, si tienes un modelo que es supercargado computacionalmente, y puedes acelerarlo mucho haciendo alguna suposición simplificadora sin alterar significativamente los resultados, quizás valga la pena hacerlo. (Siempre que se compruebe rigurosamente que los resultados se mantienen dentro de un grado razonable de similitud).

0voto

Jorenko Puntos 1174

Uno de mis compañeros me ha dado una respuesta y he pensado que podría ser interesante compartirla aquí. La razón por la que a menudo utilizamos la distribución normal es porque la distribución será estable independientemente del número de muestras (teorema del límite central).

Imagina que tienes una distribución normal después de transformar x cantidad de muestras, y a través del tiempo, u obtienes más variables y querremos que se mantengan en la forma de distribución "normal" explotando el teorema del límite central.

Sin embargo, si tiene distribuciones exponenciales/Pareto (o cualquier otra), la distribución tenderá a una distribución normal una vez que el tamaño de la muestra sea lo suficientemente grande debido al teorema del límite central. De esta manera, podemos tener un modelo consistente independientemente del tiempo/tamaño de la muestra.

¡Espero que esto ayude, y si alguien tiene ideas diferentes sobre esto, por favor comente aquí!

0 votos

¡Cuidado con los supuestos que subyacen a los teoremas centrales del límite! (hay muchos CLT, el más conocido es el CLT para variables aleatorias i.i.d. [no degeneradas]) Ya no se miran las variables reales al aplicar el CLT i.i.d., sino su media (transformada, de hecho).

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X