Supongamos que queremos estimar un modelo:
$Y_i = \beta_0 + \beta_1X_i + \epsilon_i\tag{1}$
donde el $Y_i$ son promedios o tasas per cápita para regiones o zonas geográficas, de modo que si $Z_i$ es la variable agregada regional de interés y $P_i$ es la población:
$Y_i = Z_i / P_i\tag{2}$
Si todas las variables se miden con precisión, y si existen $_0^*$ y $_1^*$ tal que para todo i
$E[Y_i - \beta_0^* - \beta_1^*X_i] = E[\epsilon_i] = 0\tag{3}$
entonces la estimación OLS del modelo (1) debería producir una estimación insesgada de $\beta_1$ .
Supongamos, sin embargo, que las estimaciones de $P_i$ son sólo aproximados. En la práctica, esto es probable ya que los valores de $P_i$ casi seguro que se obtendrá o derivará de los datos del censo, lo que conlleva varias fuentes de error posibles:
- error en los datos originales del censo;
- extrapolación a partir de los datos del censo utilizando hipótesis sobre la población tendencias de la población cuando se necesitan datos para una fecha posterior;
- las regiones utilizadas en el modelo pueden no corresponder a las zonas censales, por ejemplo anillos concéntricos alrededor de un punto central. Un ejemplo es un estudio de valoración de los costes de viaje recogido en Herath (1999) (1) en el que poblaciones en el rango de 5.000 a 35.000 para zonas de anillos concéntricos se expresan en múltiplos exactos de 5.000, lo que sugiere que las cifras son muy aproximadas.
Los errores en $P_i$ obviamente "infectará" los valores de $Y_i$ pero no de forma directa, ya que el efecto absoluto sobre $Y_i$ de un determinado error en $P_i$ dependerá del tamaño de $Z_i$ (y si $Z_i = 0$ no habrá ningún error en $Y_i$ ).
Pregunta : Dados los errores en $P_i$ la estimación OLS del modelo (1) producirá una estimación insesgada de $\beta_1$ y, si no es así, ¿en qué condiciones adicionales sería insesgada la estimación?
Referencia
- Herath, G (1999) Estimación de los valores comunitarios de los lagos: Un estudio del lago Mokoan en Victoria, Australia Análisis y política económica 29(1) Tabla 1 p 37