1 votos

Asegurarme de que los valores p de mis estimaciones OLS son correctos

He aprendido los fundamentos del Modelo de Regresión Lineal Clásica y también varias pruebas de diagnóstico para comprobar si se cumplen los supuestos del CLRM, como la homocedasticidad, la ausencia de multicolinealidad casi perfecta, la normalidad de los residuos, etc.

Quería saber si es posible tener un conjunto exhaustivo de cosas que necesito probar para estar razonablemente seguro de los valores p que obtengo, tanto en general como para el coeficiente de cada regresor específico (en una regresión múltiple con datos transversales).

Por ejemplo, ¿qué cosas comprobaría un investigador para asegurarse de que los valores p son técnicamente correctos (o al menos aceptables) y publicables en una revista académica (no hablo de la utilidad del tema o de si hay causalidad, etc., sólo de la inferencia estadística, si es aceptable o no)? Los diferentes libros de texto/conferencias que he visto han puesto diferentes cantidades de énfasis en diferentes cosas. Quería saber qué haría un investigador profesional.

2voto

Yacoby Puntos 603

La respuesta a su pregunta:

Quería saber si es posible tener un conjunto exhaustivo de cosas que necesito probar para estar razonablemente seguro de los valores p que obtengo, tanto en general como para el coeficiente de cada regresor específico

es "no", pero por una razón diferente a la expuesta en los comentarios.

Para empezar, permítanme explicarles lo que es y lo que no es un valor p. En primer lugar, es no una declaración de probabilidad. Es una declaración de frecuencia condicional. Está condicionada a una función de utilidad y a un modelo del mundo. Si tienes un mal modelo del mundo, entonces tus valores p son sospechosos.

Las pruebas frecuentistas, a diferencia de las bayesianas, intentan demostrar que alguna hipótesis nula es falsa. Lo hace asumiendo que la nula es verdadera. Esta afirmación no es trivial por dos razones. En primer lugar, la hipótesis nula actúa como información. Estás condicionando todas las observaciones a esa hipótesis, como si fuera cierta. Si cambiaras la nula, cambiarías la inferencia sobre tus supuestos. En segundo lugar, no hay forma de distinguir un efecto de azar de una falsa nula.

Un valor p es una afirmación de que si se repite el experimento, posiblemente un número infinito de veces, entonces la frecuencia de ver el resultado que se vio o un resultado que es más extremo no es más común que el valor p establecido si el modelo nulo es el verdadero.

Así pues, veamos qué cosas hay que hacer bien para que un valor p implique su significado abstracto.

En primer lugar, su función de utilidad debe ser correcta. Los modelos de mínimos cuadrados suponen que las pérdidas son cuadráticas, es decir $$U(\hat{\theta},\theta)=-c(\hat{\theta}-\theta)^2.$$ Si cambia su modelo, entonces cambia su estimador, lo que implica que su elección de valores p cambia.

Por ejemplo, si se supone que $U(\hat{\theta},\theta)=-c|\hat{\theta}-\theta|$ En ese caso, se acabaría con los estimadores de la mediana y se utilizarían cosas como la regresión de Theil o de los cuantiles. Los resultados son más robustos pero menos potentes.

En segundo lugar, es necesario que la especificación sea correcta. Los valores p asumen que el modelo nulo es verdadero, si tienes un modelo mal especificado, entonces tus valores p serán sospechosos, aunque no automáticamente tan alejados de la realidad como para descartarlos.

En tercer lugar, hay que hacer coincidir los supuestos correctos con el modelo nulo real. Este es el peligro de las pruebas de heteroscedasticidad. Si tiene heteroscedasticidad, pero no rechaza la nulidad, entonces tiene un mal conjunto de supuestos. Si no tiene heteroscedasticidad, pero rechaza la nula, entonces tiene un mal conjunto de supuestos.

La solución real para este tipo de problemas es plantear los supuestos de forma lógica. Por eso no hay ningún libro o conjunto de referencias para este problema.

Los precios de los diamantes son heterocedásticos, pero de una manera extraña. La simple lógica diría que probablemente son heteroskedásticos con respecto al tamaño.

Los diamantes muy pequeños sólo tienen dos propósitos, usos industriales como la perforación, y como complementos de la joyería. Como joyas, su precio es muy elevado. Como material industrial, su precio es muy bajo.

La mayoría de los diamantes de tamaño medio están cerca de su tamaño deseado para la joyería o necesitan ser cortados en piezas muy pequeñas para su uso industrial. Sin embargo, la mayor parte de su uso será para hacer diamantes de tamaño medio cortados según las especificaciones. Será más fácil estimar su valor tal cual.

Los diamantes muy grandes podrían seguir siendo muy valorados, diamantes muy grandes. Piense en el diamante Hope como ejemplo. Otros pueden fabricar cientos de diamantes pequeños para uso industrial.

El resultado es que se obtiene una versión de pajarita de la heteroskedasticidad. Los diamantes pequeños y los diamantes muy grandes tienen una enorme variabilidad de precios. Los diamantes medianos son bastante predecibles en cuanto a la talla y el valor final, por lo que su precio es mucho más reducido.

Nunca se debe hacer una prueba de heteroscedasticidad con diamantes porque hay una forma de pensar en esto. Las pruebas deben reservarse para cosas sobre las que no se tiene conocimiento de la materia.

La mayoría de los valores p son robustos porque la mayoría de los estimadores frecuentistas son estimadores minimax, es decir, el estimador minimiza la cantidad máxima de riesgo que se debe asumir bajo una función de utilidad especificada.

Como resultado, los valores p tienden a ser conservadores en el uso de la información y en cualquier inferencia resultante.

La razón por la que no hay una lista única es que si se puede afirmar que algo sobre la población es cierto, como que los precios de los diamantes son lógicamente heteroscedásticos en tamaño, entonces se puede condicionar el modelo con ese conocimiento.

Por lo tanto, si se analizan los precios de los diamantes y se comprueba que son homoscedásticos, se puede ignorar el resultado de la prueba por considerarlo irrelevante.

No hay una lista. En su lugar, hay que determinar lo que hacen los investigadores en un dominio estrecho.

Permítanme darles un ejemplo más para ver por qué es importante.

Si un minorista necesita modificar sus ingresos, puede emitir cupones. Tiene la capacidad de controlar sus ingresos y su volumen de ventas.

Las empresas eléctricas, por lo general, no pueden controlar su volumen ni su precio. Incluso si pudieran enviar por correo cupones para utilizar electricidad adicional, ¿cómo podría alguien controlar esta venta? Las compañías eléctricas controlan sus costes, no sus ingresos.

Sólo esa discusión te dice que la información contable que la dirección considera importante para la decisión marginal es diferente. Si les das una especificación común, tu modelo estará mal especificado. Sus valores p están fuera de lugar. Usted omitió una variable, el tipo de industria.

Encontrar los valores p correctos es algo más que superar los obstáculos técnicos, como la multicolinealidad y la heteroscedasticidad, se trata de comprender su ámbito de investigación.

Afortunadamente, los valores p suelen ser robustos. Si se establece $\alpha=.05$ y $p<.01$ entonces es probable que estés a salvo. Por otro lado, si $p<.04999$ y tu trabajo es un poco inestable, entonces no te sientas seguro aunque hayas seguido las reglas técnicas.

No hay un solo libro, ni una simple lista. Sólo hay ámbitos en los que los investigadores descubren cosas inesperadas y las corrigen.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X