Normalmente, controlamos los efectos fijos de la empresa y el año, pero en algunos casos vi a personas controlar los efectos fijos de la empresa junto con año por industria o empresa y año por región. ¿Podrías darme una pista de por qué necesitan hacerlo?
Respuesta
¿Demasiados anuncios?Cuando controlas no solo los efectos fijos del año, sino en cambio el de año-región o año-industria, se agrega flexibilidad.
Los efectos fijos del año controlan de manera flexible la tendencia temporal y son más flexibles, menos restrictivos, que por ejemplo asumir que la tendencia temporal es lineal $a \cdot t$, polinómica de segundo orden $at + bt^2$, exponencial $exp(at)$, etc.
No obstante, los efectos fijos del año siguen siendo restrictivos en comparación con los de año-región o año-industria, porque asumen que la tendencia temporal es la misma para todas las regiones o para todas las industrias en lugar de permitir que las distintas regiones sigan diferentes tendencias o las distintas industrias.
Considera por ejemplo este gráfico aquí
y asume que muestra el salario promedio de las mujeres (rojo) y los hombres (negro) a lo largo del tiempo.
Concluimos entonces que la brecha salarial de género se está cerrando. Sin embargo, alguien señala que esto no es realmente así porque aunque las trabajadoras a lo largo del tiempo ganan lo mismo en promedio que los trabajadores, esto se debe simplemente a que las trabajadoras han pasado de trabajar predominantemente en la industria de salarios bajos a trabajar en la industria de salarios altos.
Por supuesto, eres perspicaz y ejecutas una regresión controlando por industria
$$\log y_{it} = \beta_0 + \alpha \cdot \text{male}_{it} + \lambda \cdot \text{industry}_{it} + \delta_t + \epsilon_{it}$$
lo cual es una buena idea y para los datos simulados utilizados para generar el gráfico anterior obtienes una estimación $\hat \alpha = 3.05$, demostrando claramente que a los trabajadores hombres se les paga más en salario que a las trabajadoras.
Sin embargo, el verdadero $\alpha$ es en realidad aún mayor y es igual a $4$, por lo que aún estás subestimando el grado en que las trabajadoras son discriminadas en el mercado laboral.
En este ejemplo esto sucede porque:
Con el tiempo, el salario en el sector de salarios altos aumenta más rápido que en el sector de salarios bajos. Por lo tanto, aunque las mujeres a lo largo del tiempo pasaron al sector de salarios altos, estás subcontrolando el efecto del sector porque los primeros años con una pequeña diferencia entre los sectores sesgan el efecto del sector hacia abajo.
En este caso, lo que deberías haber hecho para obtener una estimación imparcial era ejecutar la regresión
$$\log y_{it} = \beta_0 + \alpha \cdot \text{male}_{it} + \lambda_{st} + \epsilon_{it}$$
donde $\lambda_{st}$ es el efecto fijo de sector-tiempo.
Puedes simular este ejemplo en R utilizando el siguiente código
library(data.table)
library(lfe)
N1 <- 1000
N2 <- 1000
N <- N1+N2
T <- 10
b0 <- 1
# a1 is the true gender effect
a1 <- 4
gender <- rep(c(rep(0,N1),rep(1,N2)),T)
a2 <- rep(1:T * 2,N)
dt <- data.table(id=rep(1:N,each=T),time=rep(1:T,N),gender=gender)
setkey(dt,time,gender)
industry <- c()
for (t in 1:T)
{
temp1 <- sample(c(0,1),N1,replace=TRUE,prob=c(0.5,t/T))
temp2 <- sample(c(0,1),N1,replace=TRUE,prob=c(0.5,0.5))
industry <- c(industry,temp1,temp2)
}
dt$industry <- industry
setkey(dt,id,time)
dt$log_y <- b0 + a1*dt$gender + a2*dt$industry + 0.3*dt$time + rnorm(N*T)
foo <- dt[,.(m_wage=mean(log_y)),by=.(time,gender)]
plot(1:T,foo[gender==0,]$m_wage,ylim=c(0,20),col="red",type="l")
points(1:T,foo[gender==1,]$m_wage,type="l")
dt$i_time <- interaction(dt$time,dt$industry)
# Regresión con indicador de industria
summary(felm(log_y ~ gender+industry|time,data=dt))
# Estimate Std. Error t value Pr(>|t|)
# gender 3.05645 0.04164 73.41 <2e-16 ***
# industry 11.13346 0.04215 264.12 <2e-16 ***
# Regresión con efectos fijos de tiempo e industria
summary(felm(log_y ~ gender |i_time,data=dt))
# Estimate Std. Error t value Pr(>|t|)
# gender 4.00873 0.01443 277.7 <2e-16 ***
savePlot("male_female.jpg",type="jpg")