Estoy intentando recopilar datos históricos por motivos experimentales (curiosidad intelectual) y estoy teniendo problemas para entender cómo se calculan esos datos. Primero un poco de recopilación de datos sobre AAPL desde el 10 de febrero de 2015 en la apertura.
datosA = http://hopey.netfonds.no/tradedump.php?date=20150210&paper=AAPL.O&csv_format=txt
datosB = http://hopey.netfonds.no/posdump.php?date=20150210&paper=AAPL.O&csv_format=txt
datosC = http://www.google.com/finance/getprices?i=60&p=4d&f=d,o,l,h,c,v&df=cpct&q=AAPL
datosD = http://chartapi.finance.yahoo.com/instrument/1.0/AAPL/chartdata;type=quote;range=4d/csv
Los datosA parecen proporcionar todas las transacciones que tuvieron lugar durante el día prescrito; ¿es esto correcto o estoy leyendo los datos de forma incorrecta? Si tomo la primera línea de dataC (close,high,low,open,volume)=(120.3,120.31,120.16,120.17,646886), entonces corresponde a las primeras transacciones introductorias de dataA. Asimismo, los datosD también corresponden a las transacciones de los datosA, pero a lo largo de varios minutos. En otras palabras, los datosC y los datosD parecen estimaciones (utilizando cierre, máximo, mínimo, apertura, volumen) de los datosA. ¿Es esto correcto?
Si esto es cierto, entonces los datosA son "datos brutos" e impresionantes por razones analíticas. Sin embargo, estoy confundido con dataB. Supongo que dataB es el diferencial entre oferta y demanda, pero si voy a la siguiente línea:
20150210T150001 120.54 300 300 120.55 4600 4600
entonces el bid/ask parece ser 120.54/120.55 que parece totalmente inexacto comparado con dataA (los datos brutos de las transacciones reales)? Incluso google indica que el (c,h,l,o,v) es (120,39,120,58,120,25,120,3,576584) durante el primer minuto de apertura, lo que no parece cercano al spread de 120,54/120,55?
¿Qué estoy entendiendo mal?