5 votos

¿Puedo realizar una regresión dividiendo la muestra en cohortes de "mujeres" y "hombres", en lugar de incluir simplemente el "sexo" como variable de control?

Digamos que quiero analizar el impacto de la educación en los ingresos:

ingresos = 0 + 1 educación + 2 edad + 3* hombre + e

También podría ejecutar esta regresión dos veces más, dividiendo la muestra en "hombres" y "mujeres":

ingresos = 0 + 1 educación + 2 edad + e si sexo=masculino

ingresos = 0 + 1 educación + 2 edad + e si sexo=femenino

El objetivo: Quiero ver si el coeficiente de la educación es diferente en magnitud para los dos grupos de género.

Sólo he utilizado el modelo de educación/ganancias porque es fácil de explicar. Esto no es algo que haya visto en documentos, así que me pregunto si es ilógico de alguna manera. Parece que sería una buena forma de ver cómo cambia el coeficiente de tu variable de interés para grupos que pueden ser diferentes (hombres/mujeres, urbano/rural, joven/viejo, etc.)

7voto

Palantir Puntos 730

Reescribamos las dos ecuaciones de tu pregunta así para evitar el uso de los mismos símbolos para diferentes parámetros:

$income = \beta_0 + \beta_1 edu + \beta_2 age + \epsilon$ , si es hombre = 0

$income = \gamma_0 + \gamma_1 edu + \gamma_2 age + \epsilon$ , si es hombre = 1

Se puede tener en cuenta la posibilidad de que los coeficientes sean diferentes añadiendo términos de interacción para la educación y el sexo, y para la edad y el sexo, y realizando después una única regresión. Así que puedes hacer esto:

$income = \beta_0 + \beta_1 edu + \beta_2 age + \beta_3 male + \beta_4 (edu * male) + \beta_5 (age * male) +\epsilon$

La ecuación con términos de interacción puede cubrir ambos casos, y también dar cuenta de los diferentes coeficientes de pendiente.

Si macho = 0, tenemos,

$income = \beta_0 + \beta_1 edu + \beta_2 age +\epsilon$

Este es exactamente su primer caso, donde el sexo $\neq$ masculino, o masculino = 0.

Ahora, si macho = 1, tenemos, a partir de la ecuación con términos de interacción,

$income = (\beta_0 + \beta_3) + (\beta_1 + \beta_4) edu + (\beta_2 + \beta_5) age + \epsilon$

Aquí, $\beta_0 + \beta_3 = \gamma_0, \beta_1 + \beta_4 = \gamma_1, \beta_2 + \beta_5 = \gamma_2$

Así que esto coincide con su segundo caso en el que el sexo = masculino, o masculino = 1. En este caso sólo tienes que hacer las sumas como se indica para encontrar los coeficientes.

En conclusión, su plan es equivalente a la ejecución de la regresión con términos de interacción descrita anteriormente. Puede calcular sus coeficientes de interés simplemente haciendo las adiciones necesarias. Como ejemplo, suponga que ha ejecutado la regresión y sus resultados son los siguientes

$income = 0.1 + 0.2 edu + 0.3 age + 0.4 male + 0.5 (edu * male) + 0.6 (age * male) +\epsilon$

Entonces tenemos, $\beta_0 = 0.1, \beta_1 = 0.2, \beta_2 = 0.3, \gamma_0 = 0.1 + 0.4 = 0.5, \gamma_1 = 0.2 + 0.5 = 0.7, \gamma_2 = 0.3 + 0.6 = 0.9$

Además, como señala @Giskard en los comentarios, se puede probar si incluir los términos de interacción (y por tanto, permitir diferentes pendientes) merece la pena. Hay varias formas de hacerlo. Puedes echar un vistazo a este para un ejemplo, ya que se trata de un caso de modelos anidados.

1 votos

Gracias por las sugerencias. Ya está hecho.

0 votos

En conclusión, su plan es equivalente a la ejecución de la regresión con términos de interacción descrita anteriormente ¿es así? Un modelo único con términos de interacción supone que la varianza del error es la misma en todos los sexos. Un modelo separado para cada sexo permite que las varianzas de error sean diferentes entre los sexos.

0voto

feklee Puntos 495

Hay una manera más fácil de hacer esto que lo que se muestra arriba. Puedes incluir variables indicadoras tanto para hombres como para mujeres. Sin embargo, tenga en cuenta que como las variables indicadoras para ambos son en combinación lineal un vector unitario (es decir, un vector de todos los unos), tiene que forzar el vector constante (es decir, $\beta_0$ en su primera ecuación: $income = \beta_0 + \beta_1 * education + \beta_2 * age + \beta_3 * male + \epsilon$ ) sea igual a cero.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X