Supongamos que tenemos un panel de datos en el que observamos $N$ personas para $T$ periodos de tiempo. Queremos estimar: $$y_{it}= \delta y_{it-1}+x_{it}'\beta +\alpha_i +v_{it} $$
donde $\alpha_i$ es un error no observado e invariable en el tiempo y $v_{it}$ es un choque i.i.d. independiente de todos los regresores.
La transformación de efectos fijos consistiría en restar las medias de cada variable. Es decir, para estimar
$$y_{it} -\bar{y_i}= \delta y_{it-1}-\bar{y_i}+x_{it}'\beta-\bar{x_i}'\beta +v_{it}-\bar{v_i} $$
Debido al desfase de la variable dependiente, sólo podemos utilizar las observaciones en los momentos $2$ a través de $T$ . Así, cuando restamos la media del resultado, hay cierta ambigüedad. ¿Debemos promediar el resultado sólo para los resultados realmente utilizados, es decir, $\bar{y_i}=\frac{1}{T-1}\sum_{t=2}^Ty_{it}$ ¿o por el contrario utilizar todos los datos, incluso el resultado del tiempo 1? Es decir, $\bar{y_i}=\frac{1}{T}\sum_{t=1}^Ty_{it}$ .
¿Existe una norma estándar para esto?
Hay una cuestión análoga en relación con la sustracción de la media de la variable dependiente retardada en el lado derecho.
Además, para eliminar de forma preventiva una respuesta que aborde este punto, de hecho sé que el estimador de EF está sesgado en esta configuración.