1 votos

Uso de un modelo Logit para predecir un resultado desconocido

Normalmente, cuando se ajusta un modelo logit o probit a los datos, se tiene una variable de resultado binaria dependiente (digamos, asistencia a la universidad = [0, 1]) y el conjunto habitual de variables independientes (por ejemplo, los ingresos de los padres, el género y alguna medida de capacidad).

En mi caso, las cosas son un poco diferentes. Para ceñirme al ejemplo, para mi conjunto de datos principal no sé si las personas asistieron a la universidad. Los únicos aspectos sobre los que tengo información son los ingresos de los padres, el género y otras variables independientes. Sin embargo, pude obtener datos sobre la asistencia a la universidad para un subconjunto aleatorio de los datos. Con este subconjunto ajusté un modelo logístico, obteniendo coeficientes para todas las variables independientes.

¿Cómo puedo utilizar estos coeficientes para predecir la probabilidad de asistencia a la universidad de todos los demás?

[Tenga en cuenta que el ejemplo de la educación sólo se hace para simplificar las cosas].

3voto

user10775 Puntos 121

Si te he entendido bien, $\Lambda(x_i'\hat\beta)$ , donde $\Lambda(x) = e^x / (1+e^x)$ . Puede utilizar predict tanto en R como en Stata. Pruebe en Stata:

clear all
*** Generate data
set obs 10
set seed 1
gen x = rnormal()
gen y = 1+x+rnormal() > 0
replace y = . in 7/10
list
*** Estimate
logit y x
*** Predict
predict phat, p
list

Para aclarar, he supuesto que su variable de resultado está en $\{0,1 \}$ (no en $[0,1]$ ). Usted observa $y_i$ para algunos $i$ pero no para todos, ajustaste una regresión logit, y luego quieres predecir la probabilidad para cada $i$ . Por favor, dígame si he interpretado mal su pregunta.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X