4 votos

Ayuda para extraer los datos fundamentales de la empresa de EDGAR

Necesito ayuda para entender por qué hay muchos valores diferentes para una métrica específica reportada por el 10-K o 10-Q en la base de datos EDGAR.

He descargado todo el universo de la renta variable estadounidense en JSON del sitio web de la SEC aquí (Datos a granel).

Este es mi código para obtener el Beneficio por Acción Diluido de una empresa en 2016

import json
import pandas as pd

f = open('CIK0001511198.json')
data = json.load(f)

df = pd.DataFrame(data['facts']['us-gaap']['EarningsPerShareDiluted']['units']['USD'])

df = df[(df['form'] == '10-K') | (df['form'] == '10-Q')]

df[df['fy'] == 2016]

enter image description here

Esperaba 4 filas con tres 10-Q y una 10-K ... algunos valores son diferentes incluso dentro del mismo id de formulario ( accn )

¿Puede alguien explicar por qué hay muchos valores diferentes y cuáles son las diferencias?

¡Salud!

1voto

Gavin McTaggart Puntos 1358

Deberías comprobar manualmente Bamsec para una de las acciones para ver qué está pasando, y a qué se refiere realmente la columna "val". Compara manualmente esos resultados con lo que ves aquí.

Podría ser algo así como que la empresa modificara el 10-K, lo que da lugar a dos entradas en este conjunto de datos.

Podría ser que la empresa informe de los datos del ejercicio anterior y del actual dentro del mismo 10-K, lo que hace que se introduzcan dos filas en este conjunto de datos para el único informe.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X