Bienvenido al maravilloso mundo de la econometría. En la mayoría de los cursos de introducción a la econometría se amplían los mínimos cuadrados ordinarios (MCO) mediante la consideración de modelos de resultados binarios, como el logit y el probit.
Mientras que el método OLS suele limitarse a la modelización de resultados continuos con límites entre $-\infty$ y $\infty$ Sin embargo, en la investigación, a menudo se encuentran datos en los que no es así. La extensión más elemental son los datos de resultados binarios (sí/no).
Este dato tiene la forma de un sí/no (codificado 1/0). Evidentemente, OLS se enfrenta a varios problemas. El primero y más importante (para sus fines) es el hecho de que puede predecir resultados fuera del rango $[0,1]$ . La solución más sencilla: la regresión logística.
La regresión logística estima la probabilidad de que $y=1$ condicionada a sus variables explicativas. Lo hace creando un mapa de su ecuación de regresión $\beta_0 + \beta_1 x$ en el espacio $[0,1]$ teniendo en cuenta: $$ \ln \left( \frac{P(y=1)}{1-P(y=1)} \right) = \beta_0 + \beta_1x $$ Dependiendo de los datos que pueda encontrar (y del software del que disponga; por ejemplo, EViews, R, Stata y SPSS tienen rutinas integradas para la regresión logística), esta podría ser una forma interesante de proceder.