1 votos

En cuanto a la formación de grupos en un experimento sobre el precio del petróleo

Me gustaría tener su opinión sobre lo siguiente;

Suponiendo que estoy realizando una investigación sobre la fijación del precio óptimo de la gasolina para una empresa y mi cliente quiere que realice un estudio sobre los hábitos de compra de gasolina de los clientes cuando notan un aumento en el precio de la misma.

Tengo datos de entrenamiento sobre estas categorías:

  • Las personas que no han notado el aumento del precio de la gasolina
  • Personas que conducen coches eléctricos
  • Las personas que han notado recientemente un aumento del precio de la gasolina
  • Personas que van al trabajo en bicicleta
  • Personas que viajan en autobús

Donde voy a formar un grupo de tratamiento y otro de control. Aunque no estoy seguro de cómo elegir las categorías que voy a incluir en la prueba.

En mi opinión (definitivamente no soy un experto), ignoraría a las personas que van en bicicleta al trabajo y a las que conducen coches eléctricos, ya que simplemente están fuera del interés de la investigación. Y distribuiría aleatoriamente a los miembros de las demás categorías. Lo que no tengo claro es lo de las personas que van en autobús; ¿debo incluirlas o no?

Sin embargo, mi otra opinión es que también podría haber algunos interruptores para los vehículos eléctricos, las bicicletas o los autobuses públicos. En este caso, sería mejor incluir todas las categorías en los datos.

Gracias de antemano por cada opinión.

0 votos

¿El experimento es hipotético o real (es decir, va a limitarse a enviar encuestas a la gente, o los participantes elegidos participarían en un programa en el que tendrían que pagar por gasolina real a precios variables)?

1voto

Mythokia Puntos 129

Sin saber más sobre su proyecto concreto, es probable que quiera buscar metodologías de diferencia en diferencia. Es el pan de cada día de este tipo de psudoexperimentos.

Veo que utilizas las frases "entrenar" y "probar". Ten mucho cuidado, normalmente los enfoques de aprendizaje automático están diseñados para obtener muy buenas ˆY^Y s. Los economistas en general no se preocupan por ˆY^Y s mucho en absoluto . Nos preocupamos por tener un buen ˆβ^β 's. Me llevará algún tiempo acostumbrarme a esa idea.

El uso ingenuo de las técnicas tradicionales de ML conducirá a estimadores muy sesgados y a estimaciones muy engañosas de ˆY^Y que a menudo conducen a malas decisiones políticas.

0 votos

En otras palabras, ¿predicción frente a inferencia y el equilibrio entre sesgo y varianza?

0 votos

Yo diría que esas afirmaciones, citadas a menudo, no dan a entender correctamente lo probable que es que los datos económicos estén catastróficamente sesgados. En la práctica, si se utilizan técnicas de ML sin modificar en un área estándar de la investigación económica (al menos en cualquiera de las que conozco), es probable que se generen estimaciones deficientes de los efectos de las propias políticas que se desea comprender. Estas estimaciones ingenuas de los efectos suelen estar muy sesgadas en direcciones imprevistas y pueden dar lugar a interpretaciones catastróficas de los efectos de una política determinada. La combinación de herramientas econométricas y de ML es un nuevo campo de investigación activa.

0 votos

Hola RF, sé que esto es un poco del pasado, pero me preguntaba si podrías enviarme algo de la "investigación activa" que mencionas mezclando métricas y ML. Te lo agradecería mucho.

0voto

Alex Lehmann Puntos 177

No estoy seguro de la información que le proporcionan los datos de entrenamiento, pero en este estudio parece que quiere estimar el efecto del conocimiento de un aumento (puntual) de los precios del gas en el consumo de gasolina. A partir de esa pregunta de investigación, está claro que los dos grupos de comparación pertinentes son

  • personas que no han notado un aumento del precio de la gasolina ( controlar grupo), y
  • personas que han notado recientemente un aumento del precio de la gasolina ( tratamiento grupo).

Dependiendo de la riqueza de los datos de entrenamiento, podría ejecutar una variedad de modelos robustos. También sería importante no exagerar los resultados ante su jefe: lo ideal sería tener muchos casos de subidas de precios de la gasolina, no sólo uno: es posible que durante el periodo de tiempo en cuestión hubiera un factor externo que hiciera que un grupo fuera mucho más o mucho menos propenso a comprar gasolina, independientemente de la subida de precios. Un conjunto de paneles le permitiría controlar mejor esos factores y hacer afirmaciones más sólidas.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X