Supongamos que tenemos algunos datos de los puntos de $x_1, ..., x_n$ y quieres probar un modelo que especifica un proceso estocástico en el que supuestamente generan los puntos de datos. Por ejemplo, puede que quiera probar la hipótesis de que todos los $x_i$ fue generado por una distribución normal con media y varianza. En tales casos, los libros de texto nos dicen que
- Derivar la distribución de la media de la muestra bajo el supuesto de que el modelo probabilístico es correcta.
- Calcular la probabilidad de observar la observó la media de la muestra o uno que es "más extrema".
Este proceso nos da un valor de p que se pueden utilizar para evaluar el modelo probabilístico. El cálculo de los valores de p para diferentes modelos probabilísticos nos permite comparar los modelos.
Mi pregunta es simple: a la hora de calcular los valores de p, ¿por qué consideramos que la distribución de la media muestral (es decir, por qué es la media de la muestra 'nuestro estadístico de prueba')? ¿Por qué no utilizar la mediana, la moda cuartil inferior, o de cualquier otra función de los datos? Para el caso, ¿por qué no hacer la cosa natural y sólo calcular la articulación de la densidad de $f(x_1, ..., x_n)$?
Para ser claro, yo entiendo por qué podría centrarse en la media de la muestra si la hipótesis de no especificar un probabilístico proceso que generó los datos. La razón es que, independientemente de la distribución que genera los datos, uno podría esperar que la media de la muestra se distribuye aproximadamente normal (teorema del límite central). Sin embargo, a menudo la hipótesis directamente especifica el probabilístico proceso que genera los datos de uno. Me estoy preguntando si hay alguna buena razón para centrarse en la media de la muestra en este ejemplo.
Edit: dado un ejemplo ha sido solicitado, voy a explicar el problema concreto que motivó la pregunta. Yo estoy probando las predicciones de Equilibrio de Nash el uso de algunos datos experimentales. En este caso, el único de la BNE es en estrategias mixtas, entonces, el modelo que busco prueba es probabilística. Me estoy preguntando cómo proceder cuando se evalúa el modelo del 'ajuste' (y la comparación de su ajuste a la de otros modelos teóricos).