3 votos

Interpretación de la descripción de una determinada técnica de tratamiento de datos (basada en el momento)

Estoy tratando de preparar los datos de la misma manera que la sección 2 de este documento .

Me resulta un poco difícil. ¿Podría alguien comprobar (o mejorar) mi interpretación de las dos secciones que he destacado (más abajo)?

En la primera sección (resaltada en amarillo):

Observamos que el impulso de los precios es un fenómeno transversal con los ganadores tienen altos rendimientos pasados y los perdedores tienen bajos rendimientos pasados en relación con otros valores. Por lo tanto, normalizamos cada uno de los rendimientos acumulados de la sección transversal de todos los valores para cada mes o día. de todos los valores para cada mes o día.

... Me cuesta entender exactamente lo que se describe.

Por lo que veo, el proceso sería:

  • Para cada día...
    • para cada acción ...
      • Reúne un vector de longitud-33 de precios pasados
      • Utilice esto para calcular la media y la desviación estándar de las acciones
      • Utilice el precio de hoy $x$ para calcular los valores Valor z : $z = \frac{x-\mu}{\sigma}$ (Si he entendido bien, $z$ es una indicación básica del impulso).
    • Ahora tenemos un vector z sobre todas las acciones para este día. Normalícelo. (?)
    • Ahora tenemos un vector que indica el impulso relativo de cada acción para este día.

Y la sección (resaltada en verde):

Por último, utilizamos los rendimientos del mes siguiente, t + 1, para etiquetar el ejemplos con rendimientos inferiores a la mediana como pertenecientes a la clase 1 y los que tienen rendimientos superiores a la mediana a la clase 2.

... Creo que se traduce como:

  • obtener los rendimientos mensuales de los meses t-13 a t+1 y calcular la mediana
  • clase = 1 si la rentabilidad del mes t+1 < mediana si no 2

Por lo tanto, parece que las acciones de la clase 2 siguen su $z$ indicador de impulso, mientras que la clase 1 no.

¿Le parece correcto?


enter image description here

PS No hay etiqueta para "procesamiento de datos

1 votos

En primer lugar, creo que tu interpretación del primer apartado es errónea. Hay que tomar los rendimientos mensuales de todas las acciones de la muestra, y luego la puntuación z de cada acción es su posición relativa en esa distribución.

1 votos

El uso de la palabra transversal en el primer párrafo (en 2 lugares) es crucial: el impulso se mide comparando el acumulado de una acción x con el de todas las demás acciones consideradas. Así que $\mu,\sigma$ en el cálculo de la z se refieren a la media y a la desviación estándar del cumret en todas las acciones.

1voto

zdd Puntos 523

Para ser justos, su descripción es horrible, pero estás haciendo esto mucho más complicado de lo que es.

El autor evalúa dos señales, una a corto plazo y otra a medio plazo. Dispone de un universo de muestra del que extrae series temporales de rentabilidad y calcula un indicador ST (corto plazo) y MT (medio plazo) para cada valor, que, para abreviar, representa la rentabilidad acumulada del valor durante el periodo de referencia. En resumen, está calculando la rentabilidad acumulada de un año a partir de datos mensuales y la rentabilidad acumulada de un mes a partir de datos diarios.

El t-2 , t-3 , t-1 La porción es un poco formal. Jegadeesh y Titman establecieron que existe una reversión de la media a corto plazo para los indicadores de impulso a largo plazo a principios de los años 90 y el N-1 meses (es decir, para un indicador de 12 meses, utilizar los últimos 12 meses menos el más reciente) se ha convertido en un estándar, pero es sobre todo una fachada.

Una vez que tienes los rendimientos acumulados de tu universo de acciones para cada período, los normalizas, ya que un rendimiento del 10% en 2008 significó algo diferente que en 2009. Se utilizan las puntuaciones Z para identificar a los valores de mayor rendimiento.

Más allá de esos cálculos, parece que hacen una concesión especial para las fechas de referencia en enero (probablemente debido al efecto enero).

Y luego, a partir de la configuración, es probable que utilicen los dos indicadores a los que se hace referencia para intentar predecir los rendimientos del mes siguiente, aunque eso no está incluido en la parte del documento que has incluido.

0voto

Marcus Morrisey Puntos 625

Tentativamente, gracias a los comentarios y a la gente en el IRC (braverock, bluelou), creo que esta es la estratagema básica:

  • elija un punto en el tiempo t
  • para cada k de nuestras N acciones obtenemos los precios p(k,:) es decir p(k, 1) thru p(k, 12) para los 12 meses t-13 a t-2
  • realizar la suma acumulativa: s = cumsum(p, 2);
  • para cada uno de estos 12 puntos de datos,
    • calcular la media $\mu$ y desviación estándar $\sigma$ para cada una de nuestras N poblaciones y, por tanto, calcular $z$ para cada acción, es decir 'el número de sd-s $s$ está por encima de la media de las acciones $s$ .'
    • normalizar el vector $z$ . así que lo escalamos todo para que, por ejemplo, si todo el mercado se infla un 10% digamos, nuestro vector no cambie.

(...y luego hacemos el mismo proceso para los últimos 20 días).

Por lo tanto, creo que sólo trata de "normalizar" la posición de cada acción dentro del mercado en cada punto de referencia, es decir, reducirla a un número aproximadamente entre, por ejemplo, -3 y +3.

Aprendí que es importante que los datos de entrada tengan una media de 0.

Todavía no sé muy bien por qué no utilizan simplemente para su indicador de salida:

  • clase 1 si la acción cataratas en el próximo mes
  • clase 2 si la acción sube en el próximo mes

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X