6 votos

Precisión del lenguaje relativo a la "significación estadística" en *Introductory Econometrics* de Wooldridge (7ª ed)

He estado leyendo el libro de texto de Jeffrey Wooldridge Introducción a la econometría: Un enfoque moderno (7ª edición) para preparar una clase que voy a impartir. He apreciado el lenguaje preciso que utiliza, por ejemplo, la distinción entre un "estimador" y una "estimación", por qué "estimar un modelo OLS" es incorrecto, y que una prueba de hipótesis se utiliza para la inferencia estadística sobre el parámetro verdadero. Sin embargo, me he encontrado con un caso raro de lenguaje impreciso, y ahora no puedo averiguar cuál es el correcto. La cuestión tiene que ver con la "significación estadística". En la página 127 de su libro de texto, Wooldridge escribe

Solemos decir que x es estadísticamente significativo, o estadísticamente diferente de cero, al nivel del 5%. [El énfasis en negrita es mío]

Mi intuición me dice que deberíamos decir: $\beta$ es estadísticamente significativa o estadísticamente diferente de cero. No tiene sentido decir que x es estadísticamente diferente de cero cuando nos preocupamos por el efecto de x. Tal vez esté bien decir: x es estadísticamente significativo O $\beta$ es estadísticamente diferente de cero.

Para colmo, en la página 129, escribe:

Decimos que $\hat \beta$ es estadísticamente diferente de cero al nivel de significación adecuado.

Esto me parece muy erróneo, ya que se empeñó en decir que la prueba de hipótesis permite inferir sobre $\beta$ no $\hat \beta$ . Anteriormente, en las páginas 122-123, escribe:

No estamos probando hipótesis sobre las estimaciones de una muestra concreta. Por lo tanto, nunca tiene sentido plantear una hipótesis nula como $\hat \beta$ = 0 o, peor aún, como 0,237 = 0 cuando la estimación de un parámetro es 0,237 en la muestra.

¿Podría alguien ayudar a aclarar esta confusión? Creo que es importante, como profesión, utilizar un lenguaje preciso, como argumenta el propio Wooldridge en la página 97 (y en Twitter) respecto al uso incorrecto de la frase "estimar un modelo OLS":

El problema de utilizar un lenguaje impreciso es que conduce a la vaguedad en las consideraciones más importantes: ¿qué supuestos se están haciendo sobre el modelo lineal subyacente? La cuestión de los supuestos que estamos utilizando es conceptualmente diferente del estimador que acabamos aplicando.

2voto

Carl Puntos 2229

Sí, es importante utilizar un lenguaje preciso para aclarar los métodos y las cuestiones, especialmente en econometría, una disciplina en la que son fundamentales pero confusos los matices entre los distintos tipos de variables: unas son endógenas, otras exógenas, observadas, no observadas, aleatorias, condicionalmente aleatorias, etc. No solía encontrar esas sutilezas en las matemáticas (ni siquiera en la estadística).

En cuanto al vector de parámetros $\beta$ es fija pero desconocida, por lo que no tiene sentido preguntarse si es significativamente diferente de cero, porque $\beta$ no es aleatorio, sólo desconocido por el econometrista (a veces el $\beta$ son conocidos por los individuos o las empresas, lo que plantea interesantes cuestiones metodológicas, pero no son conocidos por el econometrista). En cambio, nuestra estimación $\widehat{\beta}$ de $\beta$ es aleatorio, porque se infiere de los datos que son aleatorios (o realizaciones de variables aleatorias). Utilizamos $\widehat{\beta}$ junto con su varianza, para construir intervalos de confianza plausibles (o elipsoides) para los valores verdaderos (pero no observados) de $\beta$ . Las hipótesis se plantean en términos de lo que realmente nos gustaría saber: el verdadero valor de $\beta$ (una vez más, $\beta$ es inobservable pero determinista). Por ejemplo, afirmamos: " $H_0: \beta_2=0$ " o, lo que es lo mismo, "el arancel sobre el acero importado no tiene ninguna repercusión en la producción nacional de acero". Como no podemos observar $\beta_2$ calculamos una estimación de la misma $\widehat{\beta}_2$ que utilizamos para preguntarnos si es plausible que $\beta_2=0$ .

En cuanto a $x_j$ en un modelo lineal en ambos $\beta_j$ y $x_j$ es equivalente a decir que $x_j$ tiene un impacto significativo en $y$ (en un umbral determinado) y que el parámetro asociado $\beta_j$ es significativamente diferente de cero. Mi impresión es que no hay ninguna ambigüedad en los libros de texto de Wooldridge, donde se pone mucho cuidado en la elección de la redacción adecuada. Por desgracia, a menudo somos descuidados y decimos cosas ambiguas como " $x$ es estadísticamente significativa, o estadísticamente diferente de cero, al nivel del 5%" mientras que en realidad queremos decir "el efecto de $x$ es estadísticamente significativa" y no $x$ mismo. Wooldridge escribe correctamente "Solemos decir...", lo que no significa que sea la mejor práctica.

EDITAR: Las dos reclamaciones:
(i) " $X_j$ es estadísticamente diferente de cero"
(ii) " $X_j$ tiene un impacto que es estadísticamente diferente de cero"
son lógicamente independientes, en el sentido de que en un proceso de generación de datos pueden darse los 4 casos posiblesr: es posible que

  • (i) y (ii) se cumplen,
  • se cumplen los puntos (i) o (ii),
  • no se cumplen ni (i) ni (ii)

Así que sí, en una regresión lineal, es incorrecto decir que " $x_j$ es estadísticamente significativo" en lugar de " $\widehat{\beta}_j$ es estadísticamente significativo", pero este abuso del lenguaje es tan común, que incluso los académicos más respetados pueden utilizarlo de vez en cuando. Sin embargo, en nuestras clases debemos hacer todo lo posible y luchar contra este hábito.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X