3 votos

Cómo promediar los FCD de una variable a lo largo de los años

Tengo datos de la relación riqueza-ingreso de 10 años. He calculado la cdf de esta variable en cada año. Ahora estoy tratando de promediar las cdfs a través de los años. En cada uno, el número de observaciones es diferente. ¿Alguien sabe cómo hacerlo?

Gracias de antemano.

Susan

0 votos

Se puede representar la fdc empírica sobre todos los datos agrupados (agrupados a lo largo de los años). Estaría bien comprobar si la CDF de un año concreto es la misma que la CDF agrupada.

0 votos

¡Muchas gracias!

5voto

GrZeCh Puntos 320

¿Por qué no haces una media ponderada? Supongamos que tienes diez años $t \in \{1,...,10\}$ y el año $t$ tiene $N_t$ observaciones de tal manera que en total se tiene $\sum_t N_t=N$ observaciones. Dejemos que el año $t$ CDF ser $F_t$ con apoyo $[\underline w_t,\overline w_t]$ .

A continuación, se puede definir una media ponderada de la FCD como $$\overline F (w) = \sum_t \frac{N_t}{N} F_t(w).$$ Esto nos da una CDF, una función continua creciente a la derecha que se extiende sobre [0,1] con soporte $\cup_t [\underline w_t,\overline w_t]$ . Sin embargo, hay que prestar atención a los soportes individuales, es decir, $F_t(w) =1 \forall w>\overline w_t$ y $F_t(w) =0 \forall w<\underline w_t$ .

4voto

Bernard Puntos 10700

La respuesta de @Baysiean proponía calcular una media ponderada de las funciones de distribución empírica por periodo $EDF_t(w)$ (donde $w$ es el valor en el soporte de una variable aleatoria $W$ ), un valor en el que evaluamos el $EDF_t$ de $W$ . Veamos lo que puede significar.

El $EDF_t(w)$ es decir, para cada valor $w$ en el soporte,

$$EDF_t(w) = \frac 1{N_t} \sum_iI\{w_{t,i} \leq w\}.$$

Aquí $w_{t,i}$ es un punto de datos de la muestra en el $t$ -en el período. La media ponderada propuesta es

$$\overline {EDF}(w) = \sum_t \frac{N_t}{N} EDF_t(w) = \sum_t \frac{N_t}{N} \frac 1{N_t} \sum_iI\{w_{t,i} \leq w\} = \frac 1 N \sum_t \sum_iI\{w_{t,i} \leq w\},$$

que no es más que la media agrupada de todos los datos disponibles y de todos los periodos de tiempo.

En otras palabras, tomar la media ponderada en este caso, resulta ser equivalente a considerar una media agrupada (no ponderada) sobre todas las muestras del período de tiempo, algo que, para ser significativo para inferencia (aparte de ser algo puramente descriptivo estadística para la muestra específica desprovista de significado económico/causal/estructural), debe basarse en el supuesto de que las funciones de distribución son idénticas periodo a periodo. Pero "tomar la media ponderada" parece permitir diferentes distribuciones, lo que no es el caso, si, de nuevo, uno está interesado en la inferencia económica.

Lo que sería realmente interesante es modelar esta tarea de estimación como una tarea bayesiana secuencial.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X