1 votos

¿Por qué la interceptación excluyente es peligrosa si no hay respaldo bibliográfico en el entorno de la DID?

Recientemente, he realizado la regresión para el DID generalizado siguiente este documento :

$Y_{it}$ = $\alpha$ + $\beta$ $(Leniency Law)_{kt}$ + $\delta$$ X_{ikt}$ + $\theta$$ _t$ + $\gamma$$ _i$ + $\epsilon$$ _{it}$ (1)

Accidentalmente ejecuté la regresión sin intercepción ( $\alpha$ ), y mi amigo mayor me dijo que es realmente peligroso cuando se ejecuta una ecuación de este tipo sin interceptar si no hay un buen respaldo bibliográfico. Me pregunto por qué es tan peligroso en este caso.

Actualización : Añadiendo el resultado de la regresión para la sospecha de colinealidad de @chan1142

enter image description here

3 votos

¿Usaste xtreg, fe ? O, ¿cuál fue su comando (stata o R)? Por favor, explique exactamente cómo ejecutó la regresión sin $\alpha$ .

1 votos

@chan1142 sí, debería ser xtreg y x1 x2 i.año, fe o areg y x1 x2 i.año, a(tipo) donde tipo es la identificación de la empresa

2 votos

Si usted corrió xtreg, fe No es un problema. Lo has hecho correctamente. (En su modelo, $\alpha$ y $\gamma_i$ no se identifican por separado y Stata informa $\hat\alpha$ como la media muestral de las estimaciones de $\alpha+\gamma_i$ . Stata lo hace todo correctamente).

4voto

user10775 Puntos 121
  1. Los resultados de Stata dicen que no se ha omitido el intercepto. No se preocupe por el intercepto. El _cons La fila es para la intercepción.

  2. Como sabes, Stat's xtreg ..., fe le dará estimaciones de coeficientes idénticas, excepto el intercepto. Los términos constantes son diferentes entre areg y xtreg . Eso es porque areg impone la restricción de que $\gamma_1 = 0$ y xtreg, fe que $n^{-1} \sum_{i=1}^n \gamma_i = 0$ es decir, que areg 's $\alpha$ es $\alpha_1$ y xtreg, fe 's $\alpha$ es $n^{-1} \sum_{i=1}^n \alpha_i$ , donde $\alpha_i = \alpha + \gamma_i$ .

  3. Las estadísticas del pri_ove_run variable no se muestran de forma agradable; $1.04\times 10^{-12}$ y $5.17\times 10^{-12}$ son difíciles de leer. Puede dividir la variable por, por ejemplo, $10^{12}$ (lo que significa que la unidad se ha multiplicado por el factor de un billón, ¿tiene sentido?). Entonces, la estimación notificada será de 1,04XXXX y el error estándar notificado será de 5,17XXXX, lo que parece más bonito. Aunque sólo es una cuestión de cosmética, yo también lo considero importante. Por cierto, al principio pensé que podría haber problemas de colinealidad, pero ahora creo que sólo se trata de la unidad de medida (porque el $t$ es razonable); aun así, sería una buena idea investigar la variable en su conjunto de datos.

  4. (Sobre la exclusión del intercepto) En general, no es una buena idea excluir el intercepto utilizando la función de Stata nocons a menos que sepa lo que está haciendo (ver 6 más abajo para un ejemplo). Para el modelo $y=\beta_0 + \beta_1 x_1 + \beta_2 x_2 + u$ (con todos los buenos supuestos), por ejemplo, si se hace reg y x1 x2, nocons significa que está imponiendo la restricción de que $\beta_0=0$ lo que significa que $E(y)=\beta_1 E(x_1) + \beta_2 E(x_2)$ . Si todo el mundo está de acuerdo en que $E(y)=\beta_1 E(x_1) + \beta_2 E(x_2)$ (por ejemplo, usted sabe que $E(y)= E(x_1)= E(x_2)=0$ ), esta restricción es aceptable, pero de lo contrario su regresión producirá un estimador de la pendiente inconsistente. Incluso si $\beta_0$ es realmente 0, la ganancia de imponer la restricción (es decir, de excluir el intercepto) suele ser trivial.

  5. Las cosas pueden ser bastante complicadas para los modelos con muchas variables ficticias (y términos de interacción). En su modelo, tiene las variables ficticias de período y los efectos fijos individuales. Si algunas de las $X$ Las variables muestran poca variabilidad a lo largo de $i$ o sobre $t$ Entonces pueden ocurrir cosas extrañas. Siempre hay que tener cuidado con la colinealidad, aunque a menudo está bien de todos modos.

  6. Hay algunos casos en los que se debe excluir la interceptación. Por ejemplo, para el modelo de panel $y_{it} = \alpha_i + \beta x_{it} + u_{it}$ (sin variables de período), la regresión en primera diferencia (FD) es OLS del modelo $\Delta y_{it} = \beta \Delta x_{it} + \Delta u_{it}$ , donde $\Delta y_{it} = y_{it} - y_{it-1}$ etc., y $\Delta \alpha_i = 0$ . La ecuación diferenciada no tiene intercepción, por lo que se debe hacer reg d.y d.x, nocons vce(cluster TYPE2) para la regresión FD. Si se omite el nocons significa que su modelo original contiene una tendencia temporal lineal (sí, una tendencia lineal, no variables temporales). Esto también está relacionado con la estimación de variables instrumentales de Anderson y Hsiao en modelos de datos de panel dinámicos.

0 votos

Muchas gracias, @chan1142. ¿Puedo hacer un par de preguntas? (1). ¿Qué son los $\gamma_1$ y $\alpha_1$ en su segundo punto entonces?

1 votos

En su modelo, los efectos individuales son $\alpha + \gamma_i$ (sus anotaciones). $\gamma_1$ es para $i=1$ y $\alpha_i$ se define como $\alpha + \gamma_i$ así que $\alpha_1 = \alpha + \gamma_1$ . Aquí he supuesto que el caso de referencia es $i=1$ .

0 votos

@chan1141, según tu experiencia, si incluye nocons cambiarán los coeficientes de otras variables independientes?

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X