1 votos

¿Los errores estándar agrupados son la mejor manera de realizar todas las regresiones que utilizan datos agrupados?

El uso de errores estándar agrupados supone que los coeficientes de regresión son los mismos para todas las agrupaciones de los datos, ¿verdad? ¿Y si no son iguales? Por ejemplo, he utilizado la prueba F para comparar los coeficientes de regresión entre los 3 conglomerados en el gráfico siguiente. Se rechaza la nulidad de que los coeficientes de regresión son los mismos en los tres modelos de regresión. Así que mi intuición es que no puedo hacer algo como "regresión A B, cluster(C)", por ejemplo en STATA, ¿verdad? Por lo tanto, ¿debería hacer una regresión para cada conglomerado? Leeré sobre los errores estándar agrupados más adelante, así que una pista me ayudará.

enter image description here

1voto

sunhsiv Puntos 139

El uso de errores estándar agrupados en Stata no impone ninguna restricción adicional a las estimaciones de los coeficientes. Las estimaciones de los coeficientes son independientes de la vce() opción que elijas.

Si tiene razones para creer que sus errores estándar deberían estar agrupados, significa que cree que hay alguna asociación entre la variable de agrupación y su resultado. Si ese es el caso, entonces debería incluir absolutamente la variable de agrupación en la propia regresión, al menos como efecto fijo. Normalmente, es más eficiente hacerlo utilizando xtreg o areg . Ambos permiten la vce(cluster clustvar) opción.

Si sólo incluye su variable de conglomerado como un efecto fijo, entonces está asumiendo implícitamente que los coeficientes entre conglomerados son los mismos pero permitiendo diferentes interceptos - eso no es una consecuencia de la agrupación de los errores estándar, sino del modelo paramétrico subyacente. Si quiere permitir que las estimaciones de los coeficientes varíen entre los conglomerados, podría incluir interacciones entre sus variables independientes y sus variables de grupo.

0 votos

¡Muchas gracias! Permítanme preguntar, ¿qué son las variables de clúster? ¿Como un dummy? Además, el hecho de incluir una variable de conglomerado como efecto fijo significa que los conglomerados están en niveles por supuesto, ¿no? Por lo tanto, ¿diferentes interceptos pero la misma pendiente? Por último, supongo que puedo utilizar los coeficientes de los términos de interacción para decir algo sobre las diferencias en los coeficientes de la pendiente para los tres clusters.

0 votos

La variable de agrupación es C en su pregunta. Suele ser categórica: piense en estados, municipios, empresas, etc. Y sí, el uso de efectos fijos por sí solo permite diferentes interceptos, pero asume las mismas pendientes, como usted dice. Si quiere permitir diferentes pendientes, puede hacerlo mediante interacciones. La forma más fácil de hacerlo, si se quiere tener en cuenta todas las interacciones posibles, es el factorial ## en Stata. De lo contrario, puede llamar a interacciones específicas utilizando # . He incluido un enlace a esa parte del manual de Stata en el último párrafo de la respuesta.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X