2 votos

¿Debo construir datos equilibrados con sólo las variables necesarias o datos desequilibrados con muchas variables potencialmente utilizables?

Cuando construyo datos de panel a partir de grandes encuestas de hogares (por ejemplo, las Encuestas de Medición del Nivel de Vida del Banco Mundial), intento construir un conjunto de datos con el mayor número posible de variables potencialmente utilizables. Esto crea un gran conjunto de datos desequilibrados y no sé cuántos datos equilibrados quedan hasta que ejecuto una regresión.

Personalmente no he encontrado ningún problema con esto, pero me pregunto qué piensan otras personas cuando tienen que utilizar el conjunto de datos que construyo. Hasta ahora no he trabajado con otros, pero me pregunto cómo debería construir un buen conjunto de datos para trabajar si tengo que hacerlo con profesores. ¿Debo construir un conjunto de datos equilibrado? ¿O un conjunto de datos desequilibrado con muchas variables con muchos valores perdidos?

0voto

user10775 Puntos 121

Puede utilizar el volumen de operaciones para los estudios de divergencia y convergencia

0voto

luchonacho Puntos 7713

La pregunta clave que hay que hacerse aquí es la siguiente: ¿los datos que faltan son una selección aleatoria de la población/muestra? Si este es el caso (una situación denominada Missing Completely At Random, MCAR), puede simplemente descartar las observaciones con valores perdidos y ejecutar su modelo en el panel equilibrado. Por el contrario, si no es así (Missing Not At Random, MNAR), una estimación del panel equilibrado estará sesgada. También existe un caso intermedio, Missing At Random (MAR), que depende de la distinción entre los datos perdidos basados en observables (en cuyo caso se puede hacer una imputación simple), o los perdidos en inobservables, en cuyo caso es necesario realizar una estimación de Heckman en dos pasos. Más información sobre los datos perdidos aquí y en este libro muy accesible.

Hay muchas pruebas que se pueden hacer para evaluar la naturaleza de los datos que faltan. Véase aquí . Estas diapositivas mostrar un ejemplo práctico de cómo tratar los conjuntos de datos de panel no equilibrados.

Una introducción muy útil a los datos panales no equilibrados es aquí , basado en el libro de texto en datos de panel por B. Baltagi.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X