Estoy tratando de analizar el precio de Bitcoin frente al número de publicaciones en Reddit sobre Bitcoin y el sentimiento de esas publicaciones (diariamente).
El precio es I(1), mientras que el sentimiento y el número de mensajes son I(0). Sorprendentemente, parecen cointegrados con el máximo número de relaciones de cointegración posible (Johansen). Me gustaría utilizar los precios porque las regresiones OLS simples como precio = const sent(-1) count(-1) están dando un R^2 muy alto, probablemente debido al hecho de que el precio y el número de comentarios están correlacionados en torno a 0,8. La ejecución de esta regresión también produce residuos estacionarios.
Durante toda mi carrera universitaria me enseñaron a utilizar los retornos logarítmicos (que por supuesto son I(0)), pero no consigo encontrar ninguna relación significativa con los retornos.
¿Cuáles son los problemas de mi trabajo (si los hay)? ¿Y qué podría utilizar para hacer un análisis más profesional? Esto es para mi tesis de maestría y tocamos temas como el VAR y el VECM, aunque no sé realmente cómo analizar los resultados adecuadamente.
0 votos
Su problema es que el uso de los precios lleva a resultados falsos . Por eso también tu R2 es tan alto (erróneamente). La razón por la que no se obtienen resultados significativos para los rendimientos es que simplemente no puede haber una relación significativa.
0 votos
@AKdemy eso podría ser muy cierto, pero ¿cómo lo detecto formalmente? Según lo que he aprendido las regresiones simples están bien con residuos estacionarios y cointegración. Es más, incluso se podría detectar esa relación a ojo, el número de posts y el precio se mueven muy bien juntos.