3 votos

Utilización de márgenes tras la estimación probit para igualar las probabilidades entre individuos casi idénticos

Estoy considerando un modelo Probit para la probabilidad de que un estudiante termine el curso en función de sus horas de estudio, la edad, el sexo, la procedencia, la forma de aprobar el curso anterior y la situación del mercado laboral para los estudiantes.

probit finish hours age women inmigrant previous_courses

Ahora, con estas estimaciones, tengo que calcular el número de horas de estudio necesarias para que la probabilidad de terminar el curso de un estudiante que trabaja sea la misma que la de otro estudiante con idénticas características pero que no trabaja.

Sé que tengo que usar el comando margins pero no sé cómo. ¿Alguna pista?

Gracias de antemano.

3voto

mummey Puntos 263

Permítanme dar un ejemplo inspirado en la obra de Richard William presentación y el comando de Stata margins .

webuse nhanes2f, clear
keep if !missing(diabetes, black, female, age, age2, agegrp)
gen femage = female*age
label variable femage "female * age interaction"
probit diabetes black female age, nolog

Probit regression                               Number of obs     =     10,335
                                                LR chi2(3)        =     380.15
                                                Prob > chi2       =     0.0000
Log likelihood =  -1808.992                     Pseudo R2         =     0.0951

------------------------------------------------------------------------------
    diabetes |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       black |   .3567259   .0638644     5.59   0.000      .231554    .4818978
      female |   .0859841   .0450391     1.91   0.056    -.0022909    .1742592
         age |   .0271895   .0016318    16.66   0.000     .0239912    .0303879
       _cons |  -3.215875   .1015044   -31.68   0.000     -3.41482    -3.01693
------------------------------------------------------------------------------

Entre otras cosas, los resultados muestran que envejecer es malo para la salud (¡sorpresa!), pero ¿hasta qué punto lo es?

Las predicciones ajustadas (también conocidas como márgenes de predicción) pueden hacer más tangibles estos resultados. Con las predicciones ajustadas, se especifican los valores de cada una de las variables independientes del modelo y, a continuación, se calcula la probabilidad de que se produzca el suceso para un individuo que tenga esos valores. Utilizando los valores medios de las otras variables independientes (mujer, negro) que están en el modelo, obtenemos:

margins, at(age=(20(10)70)) atmeans

Adjusted predictions                            Number of obs     =     10,335
Model VCE    : OIM
Expression   : Pr(diabetes), predict()

1._at        : black           =    .1050798 (mean)
               female          =    .5250121 (mean)
               age             =          20
2._at        : black           =    .1050798 (mean)
               female          =    .5250121 (mean)
               age             =          30
3._at        : black           =    .1050798 (mean)
               female          =    .5250121 (mean)
               age             =          40
4._at        : black           =    .1050798 (mean)
               female          =    .5250121 (mean)
               age             =          50
5._at        : black           =    .1050798 (mean)
               female          =    .5250121 (mean)
               age             =          60
6._at        : black           =    .1050798 (mean)
               female          =    .5250121 (mean)
               age             =          70
 ------------------------------------------------------------------------------
             |            Delta-method
             |     Margin   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         _at |
          1  |   .0063084   .0009888     6.38   0.000     .0043703    .0082465
          2  |   .0113751   .0013794     8.25   0.000     .0086715    .0140786
          3  |   .0204274   .0017892    11.42   0.000     .0169206    .0239342
          4  |   .0364184   .0021437    16.99   0.000     .0322167      .04062
          5  |   .0641081   .0028498    22.50   0.000     .0585226    .0696935
          6  |   .1104379    .005868    18.82   0.000     .0989369     .121939
------------------------------------------------------------------------------

Los resultados muestran que una persona de 20 años tiene menos de un 1% de probabilidades de tener diabetes (.0063084), mientras que una persona de 70 años tiene un 11% de probabilidades (.1104379).

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X