Necesito ayuda para entender por qué hay muchos valores diferentes para una métrica específica reportada por el 10-K o 10-Q en la base de datos EDGAR.
He descargado todo el universo de la renta variable estadounidense en JSON del sitio web de la SEC aquí (Datos a granel).
Este es mi código para obtener el Beneficio por Acción Diluido de una empresa en 2016
import json
import pandas as pd
f = open('CIK0001511198.json')
data = json.load(f)
df = pd.DataFrame(data['facts']['us-gaap']['EarningsPerShareDiluted']['units']['USD'])
df = df[(df['form'] == '10-K') | (df['form'] == '10-Q')]
df[df['fy'] == 2016]
Esperaba 4 filas con tres 10-Q y una 10-K ... algunos valores son diferentes incluso dentro del mismo id de formulario ( accn
)
¿Puede alguien explicar por qué hay muchos valores diferentes y cuáles son las diferencias?
¡Salud!