Estoy construyendo un modelo simple de acciones con Pandas y parte de eso es el cálculo de las medias móviles.
Me gustaría entender cuáles son y cómo medir las implicaciones de la exactitud de utilizar un tamaño de ventana de tiempo estricto frente a uno dinámico cuando se calculan las medias móviles a largo plazo.
He aquí un ejemplo de lo que quiero decir:
Tengo un archivo csv con el historial de acciones de TLSA entre el 1.1.2000 y el 28.2.2017
df = pd.read_csv('TSLA.csv', index_col=0, parse_dates=True)
# add new col to dataframe consisting of a 100 day moving avarage
df['100ma'] = df['Adj Close'].rolling(window=100, min_periods=0).mean()
min_periods=0 me permite calcular la media móvil para los primeros 100 días donde no hay 100 días usando la primera media móvil de 0, 1, 2, 3...
Mi alternativa a esto es llamar df.dropna()
dejaría caer las primeras 100 filas que no tienen una media móvil de 100 días. La desventaja es que tendría una media exacta pero menos puntos de datos.
Estoy construyendo una herramienta que utiliza un gran número de medias móviles. ¿Cuál sería el método correcto para averiguar qué marco de datos utilizar? ¿Correlación con una media móvil de un índice bursátil representativo? También, ¿qué técnica se suele aplicar en el mundo cuántico?
Intuitivamente, creo que la versión dinámica es más representativa, pero ¿es eso cierto también con los datos de minutos y de plazos más cortos?