Buena pregunta.
Usted observa $y_{ijt}$ ( $i$ firme, $j$ : país, $t$ : tiempo). No consideremos los efectos temporales, ya que son irrelevantes para nuestra discusión. Usted está considerando identificar los "efectos país" utilizando dos enfoques.
En resumen, los dos son tan diferentes como RE vs FE en los modelos de panel 2D estándar, con la principal diferencia en lo que se asume sobre la correlación de las variables explicativas y los efectos de la empresa dentro de los grupos de países. (i) Si se eliminan los efectos de las empresas y se utilizan variables ficticias de país, se obtiene coherencia si las empresas del mismo país no tienen efectos fijos [1]. (ii) Definir los efectos de los países por los promedios de los efectos fijos de las empresas permite tener efectos fijos a nivel de empresa [1] correlacionados con los niveles de los regresores.
A continuación, se analizan con más detalle.
Su primer enfoque (de tener variables de país y no efectos de empresa) está representado por el modelo $y_{ijt} = c_j + X_{ijt}\beta + v_{ijt}$ con $E(v_{ijt})=0$ y $X_{ijt}$ que no está relacionado con $v_{ijt}$ . Si no hay correlación a nivel de empresa de $X$ y $v$ dentro de los grupos de países (es decir, si $X_{ijt}$ es exógena al error $v_{ijt}$ ), la regresión de efectos aleatorios (POLS o FGLS o lo que sea) de este modelo da estimadores consistentes. Sin embargo, si $v_{ijt}$ contiene efectos fijos a nivel de empresa (por ejemplo, $\mu_{ij}$ ) que se correlacionan con el nivel de $X_{ijt}$ Este enfoque conduce a la incoherencia.
El modelo correspondiente a su segundo enfoque es $y_{it} = c_j + \mu_{ij} + X_{ijt}\beta + e_{ijt}$ , donde $E(e_{ijt} | X_{ij1}, \ldots, X_{ijT})=0$ para todos $t$ . Lo importante aquí es que $c_j$ y $\mu_{ij}$ no se identifican por separado sin más restricciones incluso bajo esta estricta exogeneidad de $X_{ijt}$ (porque se puede añadir una constante a $\mu_j$ y restar la misma constante a $\mu_{ij}$ ). Usted propone definir $c_j$ mediante la restricción adicional de que $n_j^{-1} \sum_{i=1}^{n_j} \mu_{ij}=0$ , lo cual está bien.
¿Cuál es la verdadera diferencia entre ambos enfoques? Para el modelo $y_{it} = c_j + \mu_{ij} + X_{ijt}\beta + e_{ijt}$ La diferencia es que el primero asume que $X_{ijt}$ es exógena a $\mu_{ij} + e_{ijt}$ mientras que el segundo supone que $X_{ijt}$ es exógena a $e_{ijt}$ . Bajo el supuesto de que $X_{ijt}$ es estrictamente exógena a $e_{ijt}$ la diferencia se reduce a si $X_{ijt}$ está correlacionada con $\mu_{ij}$ . Si, dentro de un país, una empresa con alta $X_{ijt}$ nivel tiene mayor $\mu_{ij}$ entonces sólo el segundo enfoque da un estimador consistente. Es lo mismo que cualquier consideración de RE frente a FE en modelos de datos de panel estándar (2D).
[1] Por "efectos fijos" se entienden los efectos invariables en el tiempo que pueden estar correlacionados con los niveles de las variables explicativas.