Sí, es esencial asegurarse de que tus series temporales exhiban al menos alguna forma de estacionaridad para modelos ML basados en series temporales predictivas.
Cuando se está estimando una Red Neuronal (NN) u otros modelos de aprendizaje automático en datos de series temporales no estacionarias, el modelo puede capturar principalmente la autocorrelación presente en los datos. En consecuencia, para una predicción de un paso adelante de $X_{t+1}|\mathcal{F}_t$, el modelo se degenera al utilizar solo $X_t$ como predictor. Esto es indeseable, ya que el modelo no aprovecha la riqueza de los datos de entrada para generar predicciones significativas. Un breve Artículo de LinkedIn explica este problema.
Es importante tener en cuenta que puedes usar datos de entrada estacionarios en tendencia y/o estacionales para tus modelos de NN. Dependiendo de la complejidad del modelo, el modelo de NN intentará capturar la tendencia + estacionalidad de la serie temporal y utilizarlas como predictores separados. Sin embargo, la investigación realizada por G.P Zhang et al. (2005) sugiere que la eliminación de la tendencia y/o estacionalidad puede reducir significativamente los errores de pronóstico para tu modelo, en lugar de utilizar datos crudos sin procesar.
En cuanto al agrupamiento, no hay requisito de que una serie temporal sea estacionaria, ya que los modelos de agrupamiento pueden agrupar puntos de datos en base a sus similitudes o distancias en el espacio de características en un momento dado $t$. Incluso con agrupamientos temporales, aunque la estacionaridad no es un requisito estricto, puede ayudar en la preprocesamiento de datos y, en algunos casos, mejorar la precisión del agrupamiento.