Me parece terriblemente extraño utilizar la regresión logística, ya que los ingresos no son claramente binarios. A veces la gente utiliza la logística para explorar si la gente está en el "X% superior" u otros tipos de regresión cuantílica ad-hoc. El uso de la logística me parece subóptimo, pero quizás pasable. Yo preferiría la regresión cuantílica.
Si todo el mundo está empleado y no hay médicos en paro, entonces se tiene una amplia gama de ingresos, tiene sentido que la distribución sea aproximadamente logarítmica normal. Las distribuciones de ingresos tienen colas pesadas. Esta es una creencia común, ligada a la "Ley de Gibrats".
Aquí hay un documento interesante sobre esto - nota cuidadosamente que eligieron para argumentar más normal de logaritmo que . Confiesa implícitamente la creencia generalizada de que tanto el consumo como la renta se distribuyen normalmente. Probablemente haya más artículos básicos, pero JPE es bastante respetado y este tiene más de 100 citas y es un buen lugar para investigar.
Battistin, Erich, Richard Blundell y Arthur Lewbel. "¿Por qué el consumo es más logarítmico que la renta? La ley de Gibrat revisada". Journal of Political Economy 117.6 (2009): 1140-1154.