Normalmente, cuando se ajusta un modelo logit o probit a los datos, se tiene una variable de resultado binaria dependiente (digamos, asistencia a la universidad = [0, 1]) y el conjunto habitual de variables independientes (por ejemplo, los ingresos de los padres, el género y alguna medida de capacidad).
En mi caso, las cosas son un poco diferentes. Para ceñirme al ejemplo, para mi conjunto de datos principal no sé si las personas asistieron a la universidad. Los únicos aspectos sobre los que tengo información son los ingresos de los padres, el género y otras variables independientes. Sin embargo, pude obtener datos sobre la asistencia a la universidad para un subconjunto aleatorio de los datos. Con este subconjunto ajusté un modelo logístico, obteniendo coeficientes para todas las variables independientes.
¿Cómo puedo utilizar estos coeficientes para predecir la probabilidad de asistencia a la universidad de todos los demás?
[Tenga en cuenta que el ejemplo de la educación sólo se hace para simplificar las cosas].