Estoy trabajando en un conjunto de datos con el objetivo de predecir las calificaciones de MF. Hay columnas como, 10 años, 7 años, 5 años, etc rendimientos. También tengo la fecha de inicio de los fondos de inversión, la pregunta es que hay fondos de inversión con fechas de inicio de sólo 3 años atrás, así que ¿sería prudente imputar los rendimientos para ellos para el período de 10 y 7 años?
En mi opinión eso sería incorrecto, pero entonces uno de los requisitos para los modelos de ML es no tener valores perdidos en los datos, y añadir un 0 también sería incorrecto.
Necesito sugerencias.