¿Debo construir datos equilibrados con sólo las variables necesarias o datos desequilibrados con muchas variables potencialmente utilizables?

Question

¿Debo construir datos equilibrados con sólo las variables necesarias o datos desequilibrados con muchas variables potencialmente utilizables?

Preguntado el 22 de Septiembre, 2017: Cuando se hizo la pregunta
145 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

Cuando construyo datos de panel a partir de grandes encuestas de hogares (por ejemplo, las Encuestas de Medición del Nivel de Vida del Banco Mundial), intento construir un conjunto de datos con el mayor número posible de variables potencialmente utilizables. Esto crea un gran conjunto de datos desequilibrados y no sé cuántos datos equilibrados quedan hasta que ejecuto una regresión.

Personalmente no he encontrado ningún problema con esto, pero me pregunto qué piensan otras personas cuando tienen que utilizar el conjunto de datos que construyo. Hasta ahora no he trabajado con otros, pero me pregunto cómo debería construir un buen conjunto de datos para trabajar si tengo que hacerlo con profesores. ¿Debo construir un conjunto de datos equilibrado? ¿O un conjunto de datos desequilibrado con muchas variables con muchos valores perdidos?

Preguntado el 22 de Septiembre, 2017 por Mike Kantor

Answer 1

2 Respuestas

Answer 2

0voto

user10775 Puntos 121

Puede utilizar el volumen de operaciones para los estudios de divergencia y convergencia

Respondido el 23 de Septiembre, 2017 por user10775 (121 Puntos )

Answer 3

0voto

luchonacho Puntos 7713

La pregunta clave que hay que hacerse aquí es la siguiente: ¿los datos que faltan son una selección aleatoria de la población/muestra? Si este es el caso (una situación denominada Missing Completely At Random, MCAR), puede simplemente descartar las observaciones con valores perdidos y ejecutar su modelo en el panel equilibrado. Por el contrario, si no es así (Missing Not At Random, MNAR), una estimación del panel equilibrado estará sesgada. También existe un caso intermedio, Missing At Random (MAR), que depende de la distinción entre los datos perdidos basados en observables (en cuyo caso se puede hacer una imputación simple), o los perdidos en inobservables, en cuyo caso es necesario realizar una estimación de Heckman en dos pasos. Más información sobre los datos perdidos aquí y en este libro muy accesible.

Hay muchas pruebas que se pueden hacer para evaluar la naturaleza de los datos que faltan. Véase aquí . Estas diapositivas mostrar un ejemplo práctico de cómo tratar los conjuntos de datos de panel no equilibrados.

Una introducción muy útil a los datos panales no equilibrados es aquí , basado en el libro de texto en datos de panel por B. Baltagi.

Respondido el 23 de Septiembre, 2017 por luchonacho (7713 Puntos )

¿Debo construir datos equilibrados con sólo las variables necesarias o datos desequilibrados con muchas variables potencialmente utilizables?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

Finanhelp.com

Powered by:

¿Debo construir datos equilibrados con sólo las variables necesarias o datos desequilibrados con muchas variables potencialmente utilizables?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

Finanhelp.com

Powered by: