1 votos

Precio frente a rendimientos del tronco - problemas de estacionariedad

Estoy tratando de analizar el precio de Bitcoin frente al número de publicaciones en Reddit sobre Bitcoin y el sentimiento de esas publicaciones (diariamente).

El precio es I(1), mientras que el sentimiento y el número de mensajes son I(0). Sorprendentemente, parecen cointegrados con el máximo número de relaciones de cointegración posible (Johansen). Me gustaría utilizar los precios porque las regresiones OLS simples como precio = const sent(-1) count(-1) están dando un R^2 muy alto, probablemente debido al hecho de que el precio y el número de comentarios están correlacionados en torno a 0,8. La ejecución de esta regresión también produce residuos estacionarios.

Durante toda mi carrera universitaria me enseñaron a utilizar los retornos logarítmicos (que por supuesto son I(0)), pero no consigo encontrar ninguna relación significativa con los retornos.

¿Cuáles son los problemas de mi trabajo (si los hay)? ¿Y qué podría utilizar para hacer un análisis más profesional? Esto es para mi tesis de maestría y tocamos temas como el VAR y el VECM, aunque no sé realmente cómo analizar los resultados adecuadamente.

enter image description here

0 votos

Su problema es que el uso de los precios lleva a resultados falsos . Por eso también tu R2 es tan alto (erróneamente). La razón por la que no se obtienen resultados significativos para los rendimientos es que simplemente no puede haber una relación significativa.

0 votos

@AKdemy eso podría ser muy cierto, pero ¿cómo lo detecto formalmente? Según lo que he aprendido las regresiones simples están bien con residuos estacionarios y cointegración. Es más, incluso se podría detectar esa relación a ojo, el número de posts y el precio se mueven muy bien juntos.

1voto

krunal shah Puntos 160

Depende del tamaño de su serie temporal de precios. Sospecho que si se toma la historia completa desde 2007 hasta ahora, la conexión entre el precio y el número de mensajes será significativa. Al principio ambos números eran pequeños pero con la creciente adopción de bitcoin ambos han aumentado. Sin embargo, no sería una relación significativa para predecir los precios.

Yo recomendaría consultar la diferenciación fraccionaria, que es una generalización de la diferenciación ordinaria. Supongamos que $B$ es el opresor del desplazamiento hacia atrás, por ejemplo $BX_t=X_{t-1}$ para una serie temporal $X_1,...,X_T$ . Entonces podemos representar la diferenciación numérica como sigue:

  • Primera orden: $(1-B)X_t = X_t - X_{t-1}$
  • Segunda orden: $(1-B)^2X_t = X_t - 2X_{t-1} + X_{t-2}$

Podemos generalizar ese concepto a números arbitrarios $d\geq 0$ con la fórmula binomial

$$ \begin{matrix} (1-B)^d & = & \sum_{k=0}^\infty\begin{pmatrix}d\\k\end{pmatrix}(-B)^k \\ & = & 1 - dB + \frac{d(d-1)}{2!}B^2 ... + (-1)^k\prod_{i=0}^{k-1}\frac{d-i}{i} + ... \end{matrix} $$

En caso de que no haya información significativa contenida en los retornos del registro, puede probar algún valor $0<d<1$ . Esta serie resultante compartirá las características de los rendimientos logarítmicos y los precios originales.

Nota: Para utilizar numéricamente la fórmula anterior hay que recortarla a una longitud finita fija.

0 votos

Revisaré tu sugerencia, y he editado el post principal con los gráficos de las series temporales para que puedas comentarlos si lo deseas.

0 votos

Gracias por incluir las parcelas. Parece que es lo que sospechaba. Para llegar a root también podrías calcular las correlaciones entre los valores rezagados. De este modo, se puede comprobar si un alto recuento de títulos implica precios altos en el futuro o viceversa.

0 votos

Count&prices: tengo una fuerte correlación de 0,80, que se desvanece a 0,75 en 30 días tanto para el lead como para el lag. Esto podría no tener sentido debido a que la serie no es estacionaria (?) count&returns tengo una correlación cero. sentiment&prices tengo la misma correlación fuerte (¿sin sentido?) a 0.50 pero sentiment&returns veo una pequeña ventana en la que los retornos están correlacionados a 0.10 (decayendo) con el sentimiento de los 4 días posteriores -> el precio causa el sentimiento (?) sobre la diferenciación fraccional no entendí realmente cómo debería aplicarla (¿probando múltiples ds aleatorios?) muchas gracias, todavía estoy aprendiendo

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X