3 votos

La determinación de si una serie de tiempo es aleatorio

Originalmente publicado en la Ciencia de Datos de Intercambio de la Pila. Otro cartel me sugirió publicar aquí.

La idea sería la de identificar "ordenada" de los segmentos dentro de un mercado de series de tiempo y los utilizan para informar a un algoritmo de aprendizaje de máquina, ya sea por la identificación de las relaciones entre la ordenada de los segmentos (o combinaciones de los mismos) o simplemente la proyección de precio para una cierta cantidad de tiempo en el futuro. La razón de hacerlo de esta manera es que creo que los humanos vistazo a los gráficos en términos de los vectores (es decir, la longitud y el movimiento neto como se describe a continuación) con distintos grados de certeza basada en la linealidad de la red de movimiento. Así que este es un esfuerzo para aplicar la potencia de la máquina humana-estilo de pensamiento.


El post original...

Un ejemplo de series de tiempo sería el mercado de valores, el cual se describe a veces como un paseo aleatorio. A lo largo del tiempo, esto claramente no es el caso ya que, en esencia, ha ido en una dirección (hacia arriba) con sólo reveses ocasionales.

enter image description here

Estoy saliendo con varias características que podrían ser utilizados para medir el orden de un segmento específico de una serie de tiempo: 1) movimiento Neto de principio a fin 2) la Linealidad de movimiento 3) la Longitud de tiempo

En definitiva, el más grande es el valor absoluto de los movimientos relativos a la desviación estándar de la serie durante similares períodos de tiempo y los más lineal que el movimiento, el más significativo de ese segmento. Estas características también podrían formar una especie de firma de cada segmento dado.

Tal vez la respuesta a esto es simplemente que una serie de tiempo cuyos segmentos no se ajustan a una distribución normal es un no-tiempo aleatorio de la serie, pero me pregunto si hay métodos que captura el significado de un segmento de tiempo en relación a #1-3 de arriba, es decir, "¿qué tan raro es este segmento"?


EDIT: he Aquí un intento de visualizar un objetivo intermedio de esta estrategia, para simplificar un gráfico en la "lógica" de los segmentos como un ser humano haría (utilizando un gráfico logarítmico). El primer gráfico sería extremadamente insensibles método para agrupar partes de la serie y el segundo es más sensible a la versión. Múltiples análisis en distintas sensibilidades, podría llevarse a cabo simultáneamente y se utiliza para entrenar a un profundo algoritmo de aprendizaje donde creo que los patrones pueden ser reconocidos de manera similar a cómo una profunda red neuronal podría reconocer la escritura a mano.

Esta estrategia probablemente sólo tienen sentido en un breve intervalo de tiempo dado fuerzas fundamentales que tendría más probabilidades de prevalecer por encima de largo plazo.

enter image description here

enter image description here

4voto

akalenuk Puntos 1738

Así que hay varios problemas con su anuncio de que usted tendrá que resolver. La primera de ellas es su concepto de aleatoriedad y la diferencia entre un evento aleatorio y no aleatorio evento. Para comprender el problema, creo que debo contarte una historia.

De ir a su casa para una reunión familiar y ver un árbol que se utiliza para subir como un niño pequeño. Vea la rama en la que solía sentarse y decidir a trepar el árbol. Se ve tan diferente a partir de allí, tal vez porque eran tan pequeños y el mundo se sentía tan diferente.

En el borde del campo de su árbol, se sienta, se oye un alboroto. La razón por la que es un escándalo es que no quiero usar la palabra ruckus mucho. Usted ve una ardilla corriendo, siendo perseguido por un gato que, a su vez, está siendo perseguido por un perro. La ardilla se dirige directo a su árbol.

Como la ardilla scampers hasta el árbol, te das cuenta de que va a la cabeza, y el perro está directamente debajo de usted, gritando locamente. Una especie de salto con shock cuando la ardilla sube a huir, y el gato salta, garras extendidas sobre usted para coger el pequeño roedor. El temblor y el peso añadido de las causas de la rama a snap.

En el otoño, su pierna se rompe; el perro es asesinado; y, la ardilla es capturado y se come una vez que el asustado gato se da cuenta de que aterrizó bien, mientras que la ardilla se fue cayendo fuera de control. Fue el caso determinista o aleatorio?

Seguramente, usted no tendría que subió al árbol si había predicho el futuro. El gato, el perro, y la ardilla estaban respondiendo a los instintos, y sólo uno de los resultados posibles de ruta. Sin embargo, fue al azar?

De hecho, la probabilidad de que la secuencia de eventos fue muy baja. Visto como un accidente al azar, podría haber sido un Agricultor de Seguros de la publicidad.

Desde actuarios una estimación precisa de este tipo de riesgo, puede ser tratada como al azar. Sin embargo, no físicamente comportamiento aleatorio que pasó. No hay monedas fueron arrojados. No hay números aleatorios fueron generados. No aleatoriedad se produjo en el comportamiento. Cada comportamiento podría ser determinista puede predecirse con suficiente información.

Su argumento de que algunos comportamientos son al azar, y algunos no se pueden sostener. Lo que en su lugar usted debe pensar en la presencia de dos tipos distintos de comportamiento aleatorio. Un tipo de comportamiento aleatorio no generar un exceso de beneficios. El otro tipo puede generar un exceso de beneficios.

Como alternativa, se debe asumir que hay dos conjuntos de totalmente determinista de los comportamientos. Un conjunto de acciones produce resultados que no se pueden predecir, y así no hay exceso de ganancias puede hacerse de ellos. El otro conjunto es predecible, y el exceso de ganancias de existir.

Cualquiera de estas ideas habrían de trabajo como la operatividad del mismo.

Su segundo problema es que los ingresos no están distribuidos normalmente. Los economistas asume la normalidad o log-normalidad sin ningún tipo de conexión a tierra. Hay todas las razones para creer que las distribuciones involucrados falta un primer momento. En este post "de las distribuciones de los involucrados" y demás, he argumentado que la distribución de ir preocupaciones si usted tira de la quiebra, fusión, de liquidez y de dividendos efectos es $$\left[\frac{\pi}{2}+\tan^{-1}\left(\frac{\mu}{\sigma}\right)\right]^{-1}\frac{\sigma}{\sigma^2+(r-\mu)^2}.$$

Hay varios problemas con esta distribución. Los dos más importantes, para sus propósitos, es que en forma logarítmica de la distribución carece de una matriz de covarianza por lo que no puede hacer algo como mínimos cuadrados ordinarios, y que la distribución carece de una estadística suficiente. Para sus propósitos, la falta de una suficiente estadística significa que usted debe utilizar altamente eficiente Bayesiano métodos o relativamente ineficientes métodos no paramétricos, tales como Thiel la regresión o cuantil de regresión.

El tercer problema depende de la frecuencia de sus operaciones. Si usted está usando sólo al final de la jornada oficios, a continuación, todo lo que en este párrafo es irrelevante para usted. De lo contrario, no importa.

El ticker o la cinta, cualquiera que sea la forma que usted prefiere para designar el tiempo de flujo de las operaciones no es literal. Los oficios en la cinta no están en el orden en que sucedieron. Asimismo, el mercado de altas y bajas de los precios puede no ser la verdadera alta y baja. El problema es y siempre ha sido que algunos de los oficios suceder "fuera de la cinta."

Si un comercio podrían cambiar de un precio de mercado, el comercio se realiza fuera de la cinta y oculto hasta más tarde. Considere la posibilidad de un poco comercio de acciones con el fin de comprar 10.000 acciones. Que grande de un orden podría causar un gran cambio en el precio, especialmente si la gente como el día de los comerciantes o de los operadores técnicos eran conscientes de ello. Que el comercio es legal y propósito oculto en el fondo.

Si en el transcurso del día, el comercio se acumula la totalidad de sus acciones, entonces esas operaciones individuales nunca se informó. En su lugar, aparecerá como una sola operación de 10.000 acciones al precio promedio ponderado. Si el día del alta o baja fueron parte de ese comercio, a continuación, los precios no se los informó. En su lugar, el mayor y el menor del comercio observados en la cinta se informó. También, el bloque de orden comercial a menudo se retrasa hasta el momento en que el hecho de que la información acerca de que ya no impacto en el mercado.

El cuarto problema es creado por un problema que se llama coherencia. Una metodología estadística es coherente si la feria de apuestas podría ser colocado en él. Bayesiano métodos son coherentes. Estándar de métodos como el de mínimos cuadrados ordinarios de regresión son casi nunca coherente. Ni cuantil ni Theil de la regresión son coherentes métodos. Usted puede encontrar un patrón, pero los estimadores son demasiado imprecisos para su uso. Alguien como un Warren Buffett podía armar un juego en contra de usted y tomar todo su dinero.

Bayesiano métodos son métodos avanzados y requieren el uso de cálculo.

La distribución anterior es amplia. Si usted lo utiliza en la regresión, el central, el noventa y nueve por ciento de la masa es de $63.657\times{2\sigma}$ ancho, no de 6 $\sigma$ como sería el caso con una distribución normal. Usted necesita un muy buen modelo para obtener significado, porque el natural, el ruido es increíble.

Por último, las ganancias es probable que provienen de efectos de liquidez. Ignoré por encima de ellos, ya que requieren de modelado avanzado. Recomiendo leer Ashok Abbott capítulo en La Valoración Manual. Es bastante bueno.

Para resumir:

  1. La distribución anterior carece de una desviación estándar. Ni ella ni la media de existir así que usted puede utilizar para otra cosa.
  2. Si utiliza un no-método Bayesiano, entonces alguien como yo puede robar su dinero.
  3. Usted tiene un limitado conjunto de herramientas; usted tendrá que aprender de los métodos avanzados.
  4. En virtud de la transformación logarítmica, no hay dos conjuntos de devoluciones covarían a pesar de que no será independiente de cualquiera. Usted puede fácilmente recoger información sobre seguridad de la otra.
  5. La lista de operaciones intradía no está ni en el orden ni la magnitud que se produjo en. Aparente intradía los patrones son intrínsecamente espurios debido a que el orden de los acontecimientos ha sido parcialmente ocultos y parcialmente revueltos.
  6. El ruido en el sistema es enorme.
  7. Usted necesita para describir dos o más sistema del estado donde usted podría beneficiarse de un exceso de movimientos.

Así que, como telón de fondo de la siguiente aquí está la respuesta.

1) movimiento Neto de principio a fin, 2) la Linealidad de movimiento 3) la Longitud de tiempo

Para 1, todos los problemas anteriores se aplican.

Para 2, un lineal de la diferencia de la ecuación es equivalente a un crecimiento exponencial continuo de tiempo de proceso. La linealidad, por sí mismo, no es suficiente para sus propósitos como una prueba.

Para 3, debido a que las operaciones están "fuera de la cinta" no se puede saber cuánto tiempo o cuando los eventos que realmente sucedió, excepto para las acciones que se han delgada de comercio de ese día. Por desgracia, la única manera de saber si hubo delgada de comercio es después del hecho, debido a las operaciones en bloque se oculta hasta después de que se necesitaba para saber que estaban sucediendo. Así, mientras que al final del día las operaciones son válidas en cuanto a precio y, en cierta medida aproximadamente correcta en cuanto a volumen, ya que algunos de los bloques va a terminar cerca de la final, patrón de la caza por el tiempo para completar un patrón de no ayudar, porque los datos ha sido parcialmente ocultos y parcialmente revueltos.

NOTA PERSONAL Personalmente, como un ex inversionista profesional y como un investigador académico, creo que una cantidad limitada de técnicos comerciales es válido.

Sin embargo, creo que es como el surf. Que no se puede navegar casi en cualquier lugar del mundo. El surf requiere una serie de condiciones excepcionales. Tengo la sospecha de que esas condiciones existen y que el creador de mercado que les permite existir como un esquema de mitigación de riesgo. Nunca he probado esas ideas como he pescado más grande para freír.

EDITAR Hay una razón por la que una razón por la que no hay ningún libro de texto llamado "Manual Estadístico para el Análisis Técnico." No existe una solución simple. Incluso con redes neuronales, tendría que ser muy cuidadosa en cuanto a su función de pérdida.

Intradía contenido sería difícil porque intradía datos no son una serie de tiempo como los elementos que no se muestran en el orden de ocurrencia. Usted puede confiar en los pequeños oficios para la correcta presentación de la información, pero nada más.

Si usted va a utilizar una red neuronal, entonces usted necesitará agregar quiebras y fusiones en el conjunto de datos. Tienen diferentes propiedades estadísticas. Acaba de darse cuenta de que todo lo obvio o simple ya ha sido probado.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X