I.) 2 Los principios de la econometría pueden ser potencialmente útiles en comparación con el aprendizaje automático. (véase Hal R Varian 2014 Paper : https://pubs.aeaweb.org/doi/pdf/10.1257/jep.28.2.3 )
A.) Como sugieres la búsqueda de la causalidad es una ventaja pero a diferencia de lo que piensas, aunque la causalidad a veces pueda ser difícil de medir sigue siendo muy útil y funcional.
Pero en primer lugar, cuando sugieres que la variable instrumental es la única herramienta disponible que funciona para la mayoría de los casos y permite la inferencia causal, creo que hay algunas técnicas más que todavía podrían ser aplicables para medir la causalidad en respuesta a un tratamiento, una manipulación o una intervención y seguir siendo relevantes (a diferencia del experimento natural como tú precisas debido a su restringida aplicabilidad directa a la mayoría de los casos) en la mayoría de las situaciones como:
experimentos explícitos discontinuidad de la regresión diferencia en las diferencias estimación estructural
Por ejemplo, se puede investigar la causalidad con estas técnicas o con las variables instrumentales, ya que, aunque estas técnicas están sujetas a problemas de sesgo y correlación (sobre todo desde que existen los big data, ya que el tamaño cada vez mayor de los conjuntos de datos limita la utilidad de los métodos de variables instrumentales, dependiendo de la fuerza del instrumento y del nivel de confusión), siguen dando una pista para investigar la causalidad. Así, por ejemplo, permite detectar la contrafactualidad condicional (una cláusula "si" que es contraria a los hechos) y comprobar la existencia de un posible sesgo de selección.
Qué es un contrafactual condicional:
Si está lloviendo, entonces está dentro. : Lluvia = Variable Indicativa
Si lloviera, estaría dentro. : Lluvia = Variable condicional contrafactual
Por lo tanto, cuanto mejor sea el modelo predictivo que se tenga para el contrafactual, mejor se podrá estimar el efecto causal. Así, aunque un modelo predictivo no permita necesariamente concluir nada sobre la causalidad por sí mismo, tales modelos pueden ayudar a estimar el impacto causal de una intervención cuando ésta se produce. Porque puede poner de relieve un conjunto de contrafactuales condicionales que podrían utilizarse como posibles variables causales para realizar la prueba, con el fin de determinar finalmente la causalidad en un conjunto de datos dado para tomar una buena decisión (limpiar de problemas de confusión). Si no es así, al menos le da algunas pistas para llevar a cabo una investigación más profunda para entender el problema: ¿hay algo mal en la teoría? ¿hay algo mal en mi modelo econométrico? ¿hay algo mal en mis datos?
Para saber más sobre los pros y los contras de las diferentes técnicas de inferencia causal en econometría:
https://www.jstor.org/stable/pdf/44234997.pdf?refreqid=excelsior%3A18bacfd86299dcf19e7f1f13d9c52022
B.) Excepto la causalidad, la incertidumbre del modelo es otra ventaja de la Econometría en comparación con el ML.
Los fundamentos probabilísticos de la econometría son un punto fuerte, ya que permiten interpretar la mayoría de los modelos y sus parámetros (evitando el fenómeno de la caja negra) y dan una cuantificación de la incertidumbre (con intervalos de confianza). El objetivo suele ser demostrar que la estimación de algún parámetro interesante no es muy sensible a la especificación exacta utilizada: cómo varía un parámetro estimado a medida que se utilizan diferentes modelos. En esta época de "grandes datos", parece extraño centrarse en la incertidumbre del muestreo, que tiende a ser pequeña con grandes conjuntos de datos, mientras se ignora completamente la incertidumbre del modelo, que puede ser bastante grande. Una forma de abordar esta cuestión es examinar explícitamente cómo varían las estimaciones de los parámetros con respecto a la elección de las variables de control y los instrumentos.
II). Por el contrario, las técnicas de aprendizaje automático también podrían ser útiles para el análisis de datos en las ciencias sociales.
A.) Selección de parámetros, los métodos de validación de modelos en ML pueden mejorar los modelos econométricos tradicionales
Los investigadores del aprendizaje automático han desarrollado formas de tratar grandes conjuntos de datos y los economistas interesados en tratar esos datos harían bien en invertir en el aprendizaje de esas técnicas. Por ejemplo, los métodos de minería web podrían descubrir nuevas variables explicativas útiles. La validación cruzada debería identificar un efecto no lineal o un efecto cruzado olvidado. La validación de modelos debería detectar cuándo un modelo está mal especificado y, por tanto, permitir una mejor especificación de un modelo econométrico y, en general, reducir el sesgo y el error de las variables omitidas. Como ejemplo, la literatura reciente en finanzas se centra en los modelos Garch (modelos tradicionales de series temporales) mejorados con redes neuronales para predecir mejor la volatilidad y los precios de los activos.
Para más información sobre la utilidad del ML en la econometría, consulte este artículo de Arthur Charpentier: https://arxiv.org/pdf/1708.06992.pdf
B.) La modelización causal comenzó a ser una preocupación y un campo de investigación en el ML. Lo que significa que, a largo plazo, el ML podría superar sus propios defectos (como centrarse exclusivamente en el ajuste) y superar a la econometría.
Algunos informáticos teóricos, como Pearl (2009a, b) han realizado importantes contribuciones a la modelización causal en informática (por extensión, al aprendizaje automático):
(véase: Causal Inference in Statistics: A Primer Wiley, 2016 Judea Pearl et Al)
Pearl define los contrafactuales directamente en términos de un "modelo de ecuaciones estructurales", un conjunto de ecuaciones en las que se asigna a cada variable un valor que es una función explícita de otras variables del sistema. Con este modelo, la frase "Y sería y si X fuera x" (formalmente, X = x > Y = y ) se define como la aserción: Si sustituimos la ecuación que determina actualmente X por una constante X = x, y resolvemos el conjunto de ecuaciones para la variable Y, la solución obtenida será Y = y. Se ha demostrado que esta definición es compatible con los axiomas de la semántica del mundo posible y constituye la base de la inferencia causal en las ciencias naturales y sociales, ya que cada ecuación estructural en esos dominios corresponde a un mecanismo causal conocido que puede ser razonado con sentido por los investigadores.
Sin embargo, parece que estos avances teóricos aún no se han incorporado a la práctica del aprendizaje automático. Salvo en algún trabajo de investigación reciente:
http://www.nasonline.org/programs/sackler-colloquia/documents/athey.pdf
Como conclusión, en mi opinión y tal y como están las cosas ahora, la econometría como aportación más valiosa en las ciencias sociales que lo que podría aportar el machine learning. Así que sigue siendo adecuado utilizar la econometría para realizar el análisis de datos en lugar de las técnicas de ML.