¿El método de regresión OLS (mínimos cuadrados ordinarios) considera solo un valor de muestra al calcular la función de regresión de muestra (SRF)? Si no es así, ¿cómo se crea el SRF cuando hay más de una observación por$X_{i}$?
Respuestas
¿Demasiados anuncios?No está muy claro lo que estás preguntando, pero si el modelo es de la forma
$$ y_i = \ beta_0 + \ beta_1 x_i + \ epsilon_i \ tag {1} $$
Luego, la función de regresión muestral (SRF)
$$ \ hat {y} _i = \ beta_0 + \ beta_1 x_i \ tag {2} $$
de hecho, solo considera un valor de$x_i$ en ese momento. Si tiene una situación en la que varias observaciones$y$ están asociadas con el mismo valor$x_i$, entonces un modelo lineal quizás no sea apropiado para describir sus datos
OLS considera todos los valores. Al método no le importa si algunas muestras tienen el mismo valor X siempre que no todas lo tengan.
En muchos casos, no hay controversia en tener múltiples muestras con el mismo Xi pero diferente Yi.
Por ejemplo, si grafica el volumen de negocios de la empresa (Y) frente al número de empleados (X) para una muestra de empresas, puede haber empresas que tengan exactamente el mismo número de empleados.
Suponga que usa OLS para estimar el modelo:
PS
Tenga en cuenta que los índices$$Y_i = \beta_1 + \beta_2X_i + \varepsilon_i$ no son valores de$i$ sino unidades (por ejemplo, individuos, países) dentro de la población de interés.
Dados los datos de muestra para las unidades$X$, OLS encontrará los valores de$i=1,...,N$ y$\beta_1$ que minimizan$\beta_2$. No importa en absoluto si algunos de los$\Sigma(Y_i - \beta_1 - \beta_2X_i)^2$ tienen el mismo valor. La suma a minimizar se calcula sobre todas las unidades de muestra.