1 votos

¿Cómo lidiar con la construcción de un modelo lineal donde tengo datos de ventas para 5 cadenas diferentes y 117 semanas?

Tengo datos de ventas para la marca1 (tiene que ser mi variable dependiente) y para las marcas2, marca3 y marca4. Todos ellos están presentados para 5 cadenas diferentes. Los datos de cada cadena están presentados para cada semana del 1 al 117. Se ve como se presenta debajo:

ingresa la descripción de la imagen aquí

Tengo 585 filas. ¿Cómo puedo construir mi modelo para explicar la venta de la marca1? ¿Cómo puedo tratar los datos de las cadenas y las semanas? Pensé en presentar los datos de las cadenas como variables ficticias, pero ¿qué debo hacer en este caso con las semanas?

1voto

arcyqwerty Puntos 121

Con 117 semanas de datos de ventas, es probable que tus variables sean no estacionarias y tengan algún tipo de tendencia o estacionalidad. Un modelo de regresión lineal simple no te dará resultados confiables en este caso. Tendrás que aplicar un modelo de series temporales, como ARIMA o SARIMA. Yo procedería de la siguiente manera:

  1. Verifica la estacionalidad: son datos de ventas, hay una buena posibilidad de que encuentres alguna "tendencia" a medida que la marca crece y las ventas aumentan con el tiempo. Además, las ventas pueden variar hacia arriba y hacia abajo en un patrón cíclico porque podrías tener algunos períodos de altas ventas seguidos de bajas ventas. Esto se llama "estacionalidad" y dependerá de la naturaleza de los productos que estás vendiendo. Es probable que tus datos no sean estacionarios debido a estos factores.

  2. Observa los gráficos de ACF y PACF: estos gráficos mostrarán si necesitarás términos de Autoregresión (AR) o Promedio Móvil (MA) en tu modelo. También te dará una buena idea sobre la cantidad de estos términos que necesitarás. También puedes detectar la longitud del patrón/ciclo estacional y los términos estacionales de AR/MA utilizando ACF y PACF, si hay alguna estacionalidad presente.

  3. Naturaleza de la estacionalidad: si hay estacionalidad, tendrás que verificar si es aditiva o multiplicativa. Para la estacionalidad aditiva, el modelo ARIMAX debería ser suficiente al incluir términos estacionales de AR/MA o diferenciación estacional. Para la estacionalidad multiplicativa, tendrás que aplicar el modelo SARIMAX.

  4. Aplica ARIMAX/SARIMAX: el modelo tendrá las ventas de la marca1 como tu variable dependiente y todas las ventas de otras marcas como variables independientes. Junto con estos, tu modelo tendrá términos de AR, MA, AR estacional y MA estacional según sea necesario. Un modelo de este tipo se llama modelo ARIMAX. Si tienes estacionalidad multiplicativa en tus datos, entonces aplica un modelo SARIMAX. Este modelo aún tendrá términos de AR/MA y AR/MA estacionales, pero su interacción es multiplicativa.

Este procedimiento probablemente te dará buenos resultados.

0voto

Luc Puntos 166

Esto se puede ver como un problema de series temporales o un problema de regresión general.

Si es lo primero, puedes optar por un modelo SARIMAX para cada cadena. La variación estacional/cíclica/persistente a lo largo del tiempo se puede aprovechar para una mejor previsibilidad.

Alternativamente, puedes usar las ventas semanales pasadas de la marca1 como regresores: y(t), otros regresores, dummy de cadena, y(t-1), y(t-2)...

Lo mismo se puede hacer con las ventas de otras marcas también (para obtener más regresores). Y luego usar un modelo de Gradient Boosting como CatBoost para la predicción.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X