Ahora tengo datos de un país africano sobre i) los niveles de corrupción en los sectores públicos y ii) las percepciones de la calidad del servicio de los hogares (mala, media y alta). Los datos consisten en dos tipos de hogares: los que han utilizado los servicios públicos y los que NO lo han hecho.
He leído varios artículos de algunas revistas respetadas (World Development, Journal of Development Economics) que abordan el problema del sesgo de selectividad: los que no se han dedicado a los servicios públicos podrían hacerlo porque sabían que tendrían que sobornar (corrupción) o tenían malas experiencias del pasado, y terminarían sintiéndose mal.
Los autores de los artículos, sin embargo, no usan modelos Heckit, que he aprendido de mi título. En su lugar, argumentan que ejecutando dos regresiones: i) utilizando los datos de quienes realmente utilizaron los servicios y ii) todos los hogares de la muestra, independientemente del uso de los servicios. Creo que este enfoque no es correcto.
Deseo entender mejor cómo se debe manejar el sesgo de selección, particularmente en este ejemplo. Algunos problemas con los datos son que los datos pueden ser subjetivos, bastante pequeños (alrededor de 500 hogares) y propensos a errores de medición. ¿Tiene usted alguna sugerencia para hacer frente a los problemas?
Muchas gracias.