1 votos

La minería de datos en la modelización econométrica

¿Estaría "minando los datos" en un análisis de series temporales si añado más rezagos de los que sugiere la teoría? Por ejemplo, para datos anuales se recomienda que dos rezagos sean suficientes para captar las interacciones dinámicas entre las variables y tener en cuenta las posibles correlaciones seriales. Asimismo, en los modelos que utilizan datos trimestrales El uso de cuatro rezagos es la norma. Sin embargo, en muchos casos, existe un conflicto entre lo que dice la teoría y lo que se puede observar en los datos reales.

Sólo me pregunto si se trata de una "minería de datos" cuando aumento el modelo con más de 2 rezagos de datos anuales. Supongamos que el orden de los rezagos se selecciona mediante un criterio de información.

3voto

Bernard Puntos 10700

Los puntos críticos aquí son las frases "se recomienda que...", y "usar cuatro lags es una norma". ¿"Se recomienda" y "es una norma" en base a qué? ¿En un modelo teórico específico que prevalece, o en la experiencia pasada con el tipo específico de datos? Si es esto último, no entra en conflicto con ninguna teoría económica, si prueba algo diferente.

Este es también un buen ejemplo de la necesidad de llegar a una síntesis en la que el modelo esté apoyado teóricamente y también sea estadísticamente adecuado (consulte los trabajos, especialmente los libros, del prof. Aris Spanos sobre esta importante cuestión metodológica).

2voto

AgentConundrum Puntos 10107

Si adopta una estrategia de modelización de general a específica (Gets), su búsqueda de especificaciones comienza con un modelo general no restringido (GUM), que debería contener tantos rezagos como considere relevantes. Al elegir la(s) longitud(es) inicial(es) de los rezagos, puede ser lo suficientemente generoso, ya que desea poder aprender de los datos (es decir, de la dinámica que contienen). Por supuesto, la teoría económica también guía la especificación de la GUM, pero si quiere permitir el descubrimiento (en lugar de limitarse a imponer la teoría), la teoría no debería determinar la GUM. Una vez especificada la GUM, debería reducirse a una forma parsimoniosa e interpretable, eliminando los rezagos superfluos. Una vez resuelta la dinámica, se puede transformar el modelo en su forma de largo plazo (que es la que interesa a la mayoría de los economistas). Desde este punto de vista, la introducción de rezagos adicionales en un modelo no es imprudente, sino que es deseable. Básicamente, todo depende de cómo se introduzcan los rezagos en el modelo en primer lugar. Por lo tanto, se aconseja el enfoque eficiente y sistemático que ofrece el enfoque Gets.

Por otro lado, puede adoptar una estrategia de modelización de específico a general. Al emplear esta estrategia, los modelos crecen en tamaño a medida que avanza el proceso de modelización econométrica, lo que es contrario a la reducción (los modelos se hacen más pequeños) que se produce al utilizar Gets. Una búsqueda en expansión es probablemente más susceptible a la minería de datos que una en contracción.

A la hora de elegir las longitudes de los desfases, también es importante tener en cuenta el objetivo del modelo y las características generales de los datos (el número de observaciones y la frecuencia).

Por último, es difícil responder a esta pregunta dado que las frases "extracción de datos" y "minería de datos" no están definidas. Por ejemplo, ¿deben interpretarse como términos despectivos?

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X