3 votos

datos de series de tiempo de modelado para el aprendizaje profundo

¿cuál es el mejor formato para alimentar a los datos de entrada, que son series de tiempo con densidad variable a lo largo del tiempo, a un aprendizaje profundo de la red, mientras que en cualquier iteración queremos alimentar a un lote de datos, incluyendo un fondo histórico?

Es mejor considerar un tamaño constante de registros de datos o una constante de tiempo de la ventana incluyendo la variable de registro de datos de tamaño? O hay una mejor manera?

3voto

John Rennie Puntos 6821

Yo no estoy seguro de entender perfectamente su pregunta, el concepto de "series de tiempo con densidad variable a lo largo del tiempo" no es muy clara.

Una cosa es segura, la forma óptima para "alimentar" una red neuronal es una función de el tipo de NNet misma y en el método de aprendizaje que usted ha elegido.

Para las series de tiempo

  • ya sea que usted cree que sus datos son iid vectores, y se puede utilizar un completamente conectado de tipo perceptrón
  • ya sea que se auto-correlación, y, probablemente, un LSTM (Largo-Corto Tiempo de Memoria) es una buena opción a considerar
  • si usted espera que ellos tienen multi-escala de los patrones de ConvNets son probablemente una buena opción.

Para el aprendizaje, la forma de alimentar a los NNet tiene que ser compatible con su opción anterior:

  • totalmente conectado perceptrones en iid observaciones deben ser entrenados a través de la Estocástico de Gradiente de la pendiente (SGD), es decir, mediante un sistema aleatorio de lotes pequeños
  • LSTM tiene que ser alimentado por los largos bloques de datos consecutivos,
  • ConvNets tiene que ser alimentado por los bloques de la preservación de la estructura de sus patrones esperados.

Aquí están algunos comentarios respecto a su último punto acerca del uso de una ventana fija en el número de observaciones frente a una observación de duración:

  • usted necesita tener un decente número de observaciones en cada lote, por lo tanto si elige una duración, tomar el tiempo suficiente
  • usted necesita para no romper el tipo de patrón que usted espera de la NNet para capturar; tomar de su tiempo (o número de puntos) el tiempo suficiente.

En esencia, para el mini-lotes de la conducción de un SGD, su composición tiene que ser elegido tal que la estimación de la pendiente (derivada de la media de la mini-lote), tiene la misma varianza de un mini-lote a otro. Fijamos en los datos y hacer la mejor elección!

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X