1 votos

Interpretación de los resultados de la regresión para diferentes modelos

Soy bastante nuevo en la econometría, por lo tanto, no estoy muy familiarizado con la interpretación de los resultados de la regresión. Para mí, los recursos que he encontrado en línea son bastante confusos y no pueden darme una orientación práctica para interpretar el siguiente resultado de regresión similar a uno que he encontrado en un documento: enter image description here

Antecedentes: El análisis debe analizar el impacto de la experiencia de un determinado incidente común en la opinión de la gente a favor de la unificación. La encuesta se realizó en diferentes regiones (10 regiones). Los incidentes pueden ser únicamente de 3 tipos diferentes: A, B y C. Suponemos que no hay ningún otro tipo de incidente. Así que la forma general de la regresión es: $opinion=\alpha + \beta*incident + \epsilon$ . Tenga en cuenta que he omitido los subíndices por razones de simplicidad. Como puede ver en la tabla de resultados de la regresión, la ecuación dada es para el modelo básico(1).

Intentemos interpretar los resultados de la regresión: (1) Se comparan las personas que experimentan cualquier tipo de suceso con las que no experimentan ningún suceso. El coeficiente de la participación en cualquiera de los 3 incidentes es de 0,01. El efecto no es significativo (0,05). (2) Modelo(1) + variables de control individuales. Sigue sin ser significativo. (3) Modelo (2) + variables de control estacional. Sigue sin ser significativo. (8) Se comparan las opiniones de las personas que experimentan eventos de tipo A con las de las personas que participan en cualquier otro tipo de evento o en ninguno. El efecto no es significativo (0,18).

Preguntas: (4)(5)(6)¿Cómo interpretar los dos coeficientes de cada uno de los modelos? ¿Qué comparamos aquí? (7) ¿Cómo interpretar los 3 coeficientes de este modelo? ¿Cuál es la principal comparación?

Además:

  1. El R-cuadrado es muy bajo. ¿Significa esto que nuestro modelo no se ajusta en absoluto? He leído que para los datos observacionales, un R-cuadrado bajo es muy común y puede ser aceptado?
  2. La encuesta se realizó en 10 regiones diferentes. Por lo tanto, ajustamos los efectos fijos de los países agrupándolos por países. Para este resultado de la regresión se utilizaron errores estándar robustos. ¿Cree usted que para el SE robusto 10 regiones son demasiado pocas? He leído en alguna parte que para el SE robusto, uno debe tener tantos clusters como sea posible?
  3. ¿Tienen sentido estos modelos sucesivos en el orden en que están ahora? ¿Hay algún modelo que tenga más sentido?

Su ayuda e ideas son muy apreciadas. Gracias. También si tienes buenas fuentes donde pueda encontrar alguna orientación práctica para tales interpretaciones de los resultados de la regresión, por favor comparte.

0 votos

He deshecho las ediciones. El vandalismo de las preguntas antiguas va en contra de nuestras reglas en este sitio. Consulta nuestro centro de ayuda para más detalles.

1voto

Matthias Benkard Puntos 11264

Preguntas: (4)(5)(6)¿Cómo interpretar los dos coeficientes de cada uno de los modelos? ¿Qué comparamos aquí? (7) ¿Cómo interpretar los 3 coeficientes de este modelo? ¿Cuál es la principal comparación?

Suponiendo que el incidente $i, i=[A,B,C]$ es siempre una variable ficticia, entonces en (4) el coeficiente sobre el incidente A indica cuál es el efecto adicional del incidente A sobre la opinión de la unificación controlando el incidente. En este caso, el efecto adicional sería de 0,15, pero el efecto no es significativo, por lo que no podemos rechazar la nulidad. A continuación, (5) y (6) nos dicen lo mismo para los incidentes B y C respectivamente.

En cuanto a la 7, el incidente A es presumiblemente una variable ficticia que se pone a 1 si se produce el incidente 1 y a cero en caso contrario, por lo que te diría el efecto de que se produzca el incidente A en comparación con la situación en la que no se produce el incidente A. Lo mismo ocurre con B y C.

El R-cuadrado es muy bajo. ¿Significa esto que nuestro modelo no se ajusta en absoluto? He leído que para los datos observacionales, un R-cuadrado bajo es muy común y puede ser aceptado?

Es común tener una baja $R^2$ en los paneles, pero el 0,005 es realmente bajo. Normalmente, dependiendo del campo, entre el 1% (0,01) y el 5% (0,05) sería aceptable, pero el 0,5% es bastante bajo. Sin embargo, no es muy sorprendente que ninguno de los principales coeficientes de interés sea significativo.

La encuesta se realizó en 10 regiones diferentes. Por lo tanto, ajustamos los efectos fijos de los países agrupándolos por países. Para este resultado de la regresión, se utilizaron errores estándar robustos. ¿Cree usted que para el SE robusto 10 regiones son demasiado pocas? He leído en alguna parte que para el SE robusto, uno debe tener tantos clusters como sea posible?

Sí, lo ideal es tener aproximadamente 40 clusters, véase Angrist y Pischke Mostly Harmless Econometrics 319. En realidad, los autores recomiendan 42 clusters, pero eso es sólo un guiño a la Guía del Autoestopista Galáctico de Douglas Adams.

Deberías considerar los errores de arranque, pero francamente no creo que cambie mucho. Eso no quiere decir que debas hacerlo, pero no esperes que haga que las cosas sean significativas.

¿Tienen sentido estos modelos sucesivos en el orden en que están ahora? ¿Hay algún modelo que tenga más sentido?

Tiene sentido presentar los modelos como lo has hecho en una tabla para mostrar al lector la sensibilidad de los resultados. Es difícil decir si tendría sentido hacer más sin saber más sobre la investigación.

0 votos

Hola, muchas gracias por su exhaustiva respuesta. Me ha ayudado mucho.

0 votos

Investigaré los errores de arranque. Tengo dos preguntas de seguimiento: 1) Para mí es bastante confuso utilizar el incidente y luego otro incidente_tipo ficticio simultáneamente, ya que están correlacionados. ¿Por qué se puede utilizar así? ¿Y en (7) se omite la variable ficticia incidente?; 2) Para mi estrategia de identificación también he comprobado el equilibrio de las covariables comparando las medias de las covariables de control y tratamiento (mediante MCO; covariable sobre tratamiento). La R-cuadrado es 0. ¿Alguna opción mejor para comprobar el equilibrio?

1 votos

@randomname 1.) Sí, pero siempre y cuando la correlación no sea demasiado alta (por ejemplo, por lo general la correlación de más de 0,9-0,95) no tendrá problema de multicolinealidad (pero esto es algo que usted puede comprobar mediante el cálculo de VIF - pero desde R ^ 2 es tan bajo que no creo que haya multicolinealidad (multicolinealidad afecta t-stat pero no R ^ 2), en cualquier caso, usted puede hacer eso como una comprobación adicional. 2. Tal y como yo lo veo, simplemente no existe una relación entre las variables de interés y la opinión sobre la unificación.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X