Es importante entender la secuencia de eventos, es decir, cómo se revela la información.
Por ejemplo, el recuento de equipos de perforación de Baker Hughes se publica a las 13:00 horas del este, normalmente un viernes. (Pero algunos no son un viernes, le recomiendo que utilice las fechas reales).
Los datos de Bloomberg para el cierre de los futuros del crudo NYMEX son el precio del crudo a las 1430 hora del Este.
La previsión más sencilla, o de "información cero", para el precio de cierre del viernes del crudo es simplemente el precio de cierre del jueves. El error de esta previsión es igual a $\sigma(P_{Fri}-P_{Th})$ que puede estimarse empíricamente.
El siguiente paso es construir un modelo de previsión algo más sofisticado que tenga en cuenta la liberación del recuento de equipos de perforación. Este modelo podría ser del tipo $P_{Fri}=P_{Th}+\alpha+\beta *RIG\_INFO_{Fri}$ donde alfa y beta se estiman por regresión lineal. En teoría, RIG_INFO debería ser la diferencia entre los datos del recuento de plataformas y la expectativa del mercado sobre el recuento de plataformas justo antes del anuncio. Si no se dispone del valor esperado, se podría utilizar la diferencia entre el recuento de plataformas anunciado y el recuento de plataformas de la semana anterior como aproximación a la "sorpresa".
En cualquier caso, una vez que se haya estimado este modelo, se podrá comprobar si es mucho mejor que el modelo ingenuo. (En mi experiencia, una sola variable explicativa, como el recuento de equipos, sólo reducirá el error en una cantidad relativamente pequeña. Esta reducción, en teoría, mide la contribución del anuncio al precio del crudo).