Actualmente estoy trabajando en un código de matlab que se supone que debe comprobar una base de datos de acciones para cualquier error (valores que faltan, valores erróneos, etc.). La razón de esto es que después de leer este puesto He llegado a la conclusión de que probablemente tendré que escribir algún código de limpieza de datos para obtener resultados precisos y fiables al hacer backtesting con esta base de datos.
La base de datos se ha descargado de yahoo finanzas y contiene las siguientes columnas para cada acción: Fecha, Apertura, Máximo, Mínimo, Cierre, Volumen, AdjClose.
Hasta ahora el programa busca los siguientes errores triviales:
- Cierre > Alto
- Cierre < Mínimo
- Abierto > Alto
- Abierto < Bajo
- Alto < Bajo
El programa también comprueba si alguna de las columnas de datos contiene valores menores que cero o NaN.
¿Qué otros errores/fallas podría buscar en la base de datos?