De Nick Huntington-Klein, El efecto :
Los efectos fijos son un método para controlar todas las variables, ya sean observadas o no, siempre que se mantengan constantes dentro de alguna categoría mayor. ¿Cómo podemos hacerlo? Muy sencillo. Simplemente controlamos la categoría categoría mayor, y al hacerlo controlamos todo lo que es constante dentro de esa categoría.11 Si lo prefiere, estamos controlando una variable más arriba en la jerarquía de nuestros datos jerárquicos.
¿Qué significa que una variable sea "constante dentro de una categoría mayor"? categoría"? Por ejemplo, digamos que estamos analizando el efecto de que las ciudades rurales pueblos rurales que reciben electricidad en su productividad. Una puerta trasera obvia es la geografía. Los pueblos rurales situados en las laderas de las montañas serán más difícil de electrificar, y también podrían ser diferentes en su productividad por otras razones.
Supongamos que tengo un conjunto de datos en el que tengo efectos fijos que entran de forma multiplicativa y aditiva.
Por ejemplo, digamos que intento ver la relación entre las manzanas consumidas y los ingresos. Observo las manzanas del hogar, y sospecho que Bob informa mal de sus manzanas consumidas. El valor es siempre 0,5 veces las manzanas reales. Mientras que, por otro lado, los datos de la encuesta de Alice son siempre precisos, sin error de medición. Esto es multiplicativamente constante en toda la categoría "individual".
Además, para los años posteriores al 2000, salió una nueva encuesta, y sospecho que ahora a todas las medidas de manzanas de las encuestas de hogares se les añadió un 0,3 a cada medida. Esto es aditivamente constante a través de la categoría "año".
Si conociera estos números (+0,3 y 0,5x), podría restarlos de mis datos. Pero, digamos que no conocer estos números, y sólo tengo la sospecha de que algunos de mis datos tienen tanto multiplicativo y aditivo efectos que pueden confundir cualquier estimación.
Además, digamos que la verdadera relación entre los ingresos y las manzanas consumidas viene dada por
$$\log(\text{income}) = 0.3 \log(\text{apples})$$
¿Cómo puedo estimar la verdadera relación, dado que observo $$\text{observed apples} = \left(\text{apples} + 0.3 * \text{I}(\text{year}>=2000)\right)*\begin{cases}0.5 & ID = Bob\\1 & ID \ne Bob\end{cases}$$
Si el efecto fuera multiplicativo, entonces podría utilizar una regresión de efecto fijo típica. Si el efecto fijo fuera aditivo, entonces podría simplemente desproporcionar las observaciones y ejecutar la regresión de esa manera. Pero como esto tiene ambos, si utilizo un modelo log-log con efectos fijos, entonces el efecto aditivo constante ya no es constante en el tiempo.
Este es el código que he utilizado. ¡Muchas gracias de antemano!
library(data.table)
library(fixest)
library(modelsummary)
DT <- CJ(ID = c("Bob", "Alice"),
year = 1992:2020)
# make observations
DT[, truth := runif(nrow(DT))]
# create fixed effects
DT[, ID_FE := ifelse(ID == "Bob", 0.5, 1)]
DT[, year_FE := ifelse(year >= 2000, 0.3, 0)]
# create observed variable:
DT[, observed := (truth + year_FE) * ID_FE]
# create additive means
DT[, ID_mean := mean(observed), by = .(ID)]
DT[, year_mean := mean(observed), by = .(year)]
# create multiplicative means
DT[, ID_log_mean := mean(log(observed)), by = .(ID)]
DT[, year_log_mean := mean(log(observed)), by = .(year)]
DT[, ln_observed := log(observed)]
# create differences for manual FE estimation
DT[, diff_ln_observed := ln_observed - ID_log_mean - year_log_mean]
DT[, diff_observed := observed - ID_mean - year_mean]
# get actual Y
DT[, Y := truth ^ 0.3]
DT[, ln_Y := log(Y)]
# run regression
true_relationship <- lm(ln_Y~log(truth),data = DT)
m1 <- lm(ln_Y ~ diff_ln_observed, data = DT)
twfe <-feols(ln_Y ~ log(observed) |as.factor(ID) + as.factor(year),data = DT)
msummary(list(true_relationship, m1, twfe))