No veo la diferencia entre los enfoques "estadístico" y "empírico".
Los enfoques estadísticos o de minería de datos o de aprendizaje automático, que en su mayoría están bajo el mismo paraguas, se basan en la inferencia inductiva. Por otra parte, el enfoque analítico, se basa en algunos axiomas previos que asumimos como verdaderos por definición, y más allá de este paso, la teoría se construye de manera deductiva - es decir, como las implicaciones del conjunto particular de axiomas sobre el comportamiento humano. Los enfoques de equilibrio se derivan de la teoría económica, o economía financiera. El CAPM está vinculado a supuestos sobre la utilidad, la hetero/homogeneidad de los agentes y sus expectativas. Hasta qué punto cualquiera de estas suposiciones es "verdadera" (o no), es algo que la prueba de las teorías tiene que responder (y hasta cierto punto qué sería "razonable" esperar del comportamiento humano).
La "ley de un precio" es algo que podemos suscribir más fácilmente que decir los alfas de una regresión CAPM de los rendimientos de las acciones sobre los rendimientos del mercado, siendo conjuntamente cero (en un sentido estadístico), siendo este último un caso particular de riesgo de covarianza del consumo, y todo el riesgo de consumo siendo sustituido por el mercado.
En este sentido, la aplicabilidad de los enfoques analíticos se limita a operar dentro de los límites de los axiomas que subyacen a la teoría - o a esperar violaciones de esos axiomas en casos particulares (que tal vez, con el tiempo, amplíen esa teoría a una más nueva).
Sin embargo, a medida que se elaboran teorías más complejas y realistas, también existe la preocupación de si la teoría misma se formó después de es decir, elaborando teorías para explicar patrones persistentes o anomalías que una teoría anterior no podía "explicar". En este contexto, el modelo de Fama-Francia no es una teoría, sino que detectó una regularidad empírica que no fue explicada por CAPM, pero no es una teoría en el sentido deductivo. Sin embargo, CAPM es una teoría - aunque una que no explica (y mucho menos predice) con precisión todos los aspectos de los mercados reales.
La aplicación de enfoques analíticos a la fijación de precios de los derivados se entiende fácilmente porque la ley de no arbitraje es más fácil de tragar como una "ley" que digamos los argumentos de equilibrio sobre el mercado. El enfoque analítico "más puro" es el que me dice que compre naranjas en el mercado A al precio "p1" y las venda en el mercado B al precio "p2", donde p2 > p1. A falta de esto, siempre estamos estimando algunos parámetros incluso para usar lo que de otra manera es una teoría deductiva.
Además, sospecho que los enfoques estadísticos y analíticos no siempre se excluyen mutuamente. Por ejemplo, si aceptamos el CAPM para sostener más o menos, la serie construida a partir de los residuos podría ser entonces sometida a tortura por los métodos de aprendizaje de la máquina para extraer una señal, si la hubiera. En este caso, las líneas son borrosas.
Si pensamos en esto como un Bayesiano, entonces los argumentos 'analíticos' o teóricos nos ayudan a formar nuestro anterior, y los datos que tenemos a mano se 'mezclan' con nuestro anterior para llegar al posterior.
En un extremo, los enfoques "puros" de estadística/minería de datos se dejan funcionar sin ninguna estructura previa que impongamos a la dinámica del mercado y únicamente a la detección de regularidades empíricas (aunque, incluso utilizar las aportaciones de un comerciante para un enfoque de minería de datos constituiría convertirse en algo "analítico", ya que esperamos que el comerciante tenga algún tipo de historia previa que justifique sus aportaciones). En el otro extremo, el ejemplo puramente analítico sería la explotación de la LOP como en el ejemplo de las naranjas - es decir, la inferencia se sostiene por la fuerza de la lógica.
Pero la cuestión de qué enfoque es el dominante - sospecho, como señaló Dirk, que estas cosas bajan y bajan, y además, las suposiciones "razonables" que dan cierta estructura "débil" a un "enfoque de minería de datos" es probablemente más rentable cuando podemos plantear alguna estructura, en lugar de ninguna estructura en absoluto.
P.D.: ¡Buenas respuestas de QuantGuy & Dirk! como era de esperar.