10 votos

Regresión sobre el conjunto de la población

¿Cuál es el significado del error estándar de un coeficiente de regresión cuando toda la población está incluido?

He estado tan desconcertado por esta pregunta. Porque a mí me parece, los errores estándar no tienen sentido cuando toda la población está incluido -- no hay necesidad de la inferencia estadística, ya que usted ya tiene el conjunto de la población.

Pero es tan ampliamente utilizado incluso por muchos de los artículos publicados en las mejores revistas. Por ejemplo, si yo soy el examen de la relación entre el PIB de un país la tasa de crecimiento y su densidad de población, ejecutar la regresión:

$$ GDP_i = \alpha + \beta Pop_i + \gamma \mathbf{X}_i + \epsilon_i$$

con todos los 195 países del mundo. En el caso, todos los países (de la población) están incluidos. Pero toda la literatura todavía hablar de la significación estadística de los coeficientes.

Podría alguien explicar que es un mal uso de la inferencia estadística, cuando la regresión de la población entera?

5voto

Ben Puntos 129

Es importante tener en cuenta qué es exactamente la población acerca de que una inferencia es que se está dibujando. Es fácil pasar por alto el aspecto del tiempo, en este contexto.

Supongamos por ejemplo que el objetivo es la previsión de los próximos dos años el PIB de cada país en el mundo. A continuación, la población de interés es un conjunto de pares de la forma "país del año". No es simplemente "todos los países", y aunque un modelo de predicción ha sido estimado por la regresión en la actual y en los últimos años los datos de cada país, eso no significa que toda la población de interés ha sido incluido.

Si uno realmente comienza a partir de un conjunto de datos completo para el conjunto de la población de interés, entonces todo lo que uno puede hacer es calcular las estadísticas de resumen. Que podría incluir desviaciones estándar, pero sería inapropiado llamar a estos errores estándar, ya que ese término se refiere a una distribución de muestreo, mientras que el solo de "ejemplo" en este caso es el conjunto de la población.

4voto

Bernard Puntos 10700

Yo inicialmente había marcado esta pregunta para los moderadores para examinar si sería mejor para migrar más de las estadísticas de que SE sitio de la Cruz Validado. Pero dado que el OP introdujo una forma muy específica de la econometría ejemplo, creo que el (muy profundo) concepto de "población/muestra" pueden analizarse para los fines de este ejemplo.

Una primera cuestión es la que comenta en @AdamBailey respuesta: si uno considera que "todos los países del mundo" para un determinado año o años, y que las etiquetas de los datos como "población", entonces el próximo año, en caso de pertenecer a una población diferente. Si pertenece a una población diferente, entonces ¿cómo vamos a utilizar los resultados de una población para hacer inferencia para otra población? De hecho, aquí nuestra "población" es de dos dimensiones, el país y el período de tiempo-y en ese sentido, con el horizonte de tiempo de composición abierta, sólo tenemos un ejemplo en nuestras manos.

La segunda cuestión (en parte implícita en @luchonacho respuesta) es la siguiente: nuestra población no es la realidad observada realizaciones de las variables aleatorias "$GDP_i, i=1,..n$. Esta es la base de datos. Nuestra población es la colección de variables aleatorias sí mismos, que son funciones, no los valores.

Así, nuestros datos es sólo uno de los posibles combinado realizaciones de estas variables aleatorias. Estas realizaciones surgió no sólo como resultado de determinista/ingeniería en relaciones de causalidad (que se reflejan en los coeficientes), sino también bajo el efecto de los inherentemente factores aleatorios. En ese sentido, los datos no es un "puro/típica" imagen de la "población" -contiene ruido, no alteraciones estructurales, uno de los choques etc.

A continuación, esta incertidumbre se trasladarán a la estimación de los coeficientes estamos tratando de estimar, porque se supone que estos coeficientes describir la causalidad o co-movimiento antes de los elementos aleatorios que afectan el valor final de la variable dependiente.

Debido a los dos aspectos anteriores, hablando sobre "el error estándar de las estimaciones" es totalmente válido, en este caso también, y, a continuación, aplicar pruebas estadísticas como de costumbre.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X