Supongamos que hacemos una regresión de una variable $Y$ en dos variables independientes $X_1$ y $X_2$ . Como hemos incluido $X_2$ en la regresión, los resultados obtenidos $\hat{\beta_1}$ Se suele decir que el coeficiente es el efecto de $X_1$ en $Y$ 'holding' $X_2$ fijo" o "controlando por $X_2$ '. Se dice entonces que esto elimina cualquier sesgo de variable omitida que se deba a $X_2$ .
Para investigar esto más de cerca, observe que podemos mantener $X_2$ fijada en una variedad de valores diferentes. Restringir la atención a los valores que reaparecen al menos una vez en el conjunto de datos (por ejemplo, porque hay dos puntos de datos para los que $X_{2i} = 5$ ). En estos casos, podemos realizar una simple regresión de $Y$ en $X_1$ utilizando únicamente los puntos de datos para los que (digamos) $X_{2i} = 5$ . Podemos entonces repetir esta regresión para todos los posibles $X_2$ valores (se supone que reaparecen al menos una vez). Es natural conjeturar que nuestro $\beta_2$ debe ser similar (¿idéntica?) a la media de los $\beta_2$ coeficientes obtenidos de nuestras regresiones simples. ¿Es este el caso?