Amigo,
Esta situación requiere un método de imputación que debe elegir. El tratamiento de los datos que faltan es un asunto delicado. Dependiendo de la forma en que elija manejar la observación faltante, tendrá un impacto en su proyecto y en este caso (con observaciones menores a 100) podría hacer que su análisis sea deficiente/deficiente.
He aquí algunas opciones populares:
- Imputar el valor de los datos que faltan
- Elimine una variable que tenga muchos datos perdidos y utilice otras variables que midan aspectos similares de las características estudiadas.
- Podría crear un modelo de regresión para imputar los valores que faltan.
- Puede utilizar la media (tenga cuidado al utilizar este método ya que puede haber otras variables en su conjunto de datos que pueden ser dependientes).
- Duplica el valor anterior o el más cercano.
Aquí hay un sitio web con algunos consejos: http://www.real-statistics.com/descriptive-statistics/missing-data/
Aquí hay un documento de trabajo sobre el tema: liberalarts.utexas.edu/prc/_files/cs/Missing-Data.pdf
Los valores perdidos son un tema delicado. Tenga cuidado y siempre, siempre, siempre documente lo que está haciendo, porque los demás quieren saberlo y hace que su trabajo sea mucho mejor.
0 votos
Es imposible responder a esta pregunta sin conocer su objetivo exacto y la naturaleza de los datos.
0 votos
También puede ser interesante la información sobre su flexibilidad ética.
0 votos
He editado mi pregunta, ¿puede echarle un vistazo? Gracias.