6 votos

Derivación del análisis de descomposición de índices

Actualmente estoy leyendo un artículo sobre la descomposición de índices. El documento está aquí como referencia : https://www.sciencedirect.com/science/article/pii/S0140988315001772

El documento expone cómo se ha obtenido la descomposición del índice, y me pierdo un poco en el último paso. El objetivo es descomponer los cambios en una variable agregada entre el tiempo $T$ y el tiempo $0$ .

Partimos de la base de que queremos romper una categoría agregada $V$ en una serie $j$ de subcategorías, $V_j$ cada uno de los cuales se ve afectado por una serie de $i$ factores a lo largo del tiempo. Así que tenemos :

$$ V(t) = \sum_j^m V_j (t) = \sum_j^m \big ( \prod_1^i x_{ij}(t) \big )$$

Así que lo que nos interesa es: $$V(T) - V(0) = \sum_j^m \big ( \prod_1^i x_{ij}(T) \big ) - \sum_j^m \big ( \prod_1^i x_{ij}(0) \big ) $$

También podemos considerar $V(T) - V(0)$ como: $$V(T) - V(0) = \int_0^T \frac{dV(t)}{d(t)}$$

Lo que nos lleva a considerar $\frac{dV(t)}{d(t)}$ a partir de la definición anterior tenemos:

$$\frac{dV(t)}{d(t)} = \sum_j^m \frac{dV_j(t)}{d(t)}$$

$$=\sum_j^m \left( \frac{dx_{1j}(t)}{dt}x_{2j}(t)x_{3j}(t)...x_{nj}(t)+\frac{dx_{2j}(t)}{dt}x_{1j}x_{3j}(t)...x_{nj}(t)+... +\frac{dx_{nj}(t)}{dt}x_{1j}(t)x_{2j}(t)...x_{(n-1)j} \right)$$

Podemos entonces reescribir esto como:

$$\frac{dV(t)}{dt} =\sum_j^m \left( \frac{V_j(t)}{x_{1j}(t)}\frac{dx_{1j}(t)}{dt}+\frac{V_j(t)}{x_{2j}(t)}\frac{dx_{2j}(t)}{dt} + ... + \frac{V_j(t)}{x_{nj}(t)}\frac{dx_{nj}(t)}{dt} \right) $$

Que, como $\frac{dln(x_{ij}(t))}{dt}) = \frac{1}{x_{ij}(t)}\frac{dx_{ij}(t)}{dt}$ podemos reescribir como:

$$ \frac{dV(t)}{dt} = \sum_j^m V_j(t) \left( \frac{dln(x_{1j}(t))}{dt}+\frac{dlnx_{2j}(t))}{dt} +\frac{dln(x_{3j}(t))}{dt}+ ... + \frac{dln(x_{nj}(t))}{dt} \right) $$

Lo que nos da finalmente que: $$V(T)-V(0) = \int_0^T \frac{dV(t)}{dt} = \int_0^T \left(\sum_j^m V_j(t) \left( \frac{dln(x_{1j}(t))}{dt}+\frac{dlnx_{2j}(t))}{dt} +\frac{dln(x_{3j}(t))}{dt}+ ... + \frac{dln(x_{nj}(t))}{dt} \right) \right)$$

Es en este punto donde el artículo afirma que, como los datos sobre los que queremos evaluar la integral no son continuos (que no lo son), tenemos que utilizar una integración discreta, que da la solución: $$V(T)-V(0) = \sum_j^m \left( w_j \times ln \left( \frac{x_{1j}(T)}{x_{1j}(0)} \right) + w_j \times ln \left( \frac{x_{2j}(T)}{x_{2j}(0)} \right) + ... + w_j \times ln \left( \frac{x_{nj}(T)}{x_{nj}(0)} \right) \right)$$

Para algunos pesos $w_j$ .

En este punto estoy perdido. No tengo ni idea de cómo pasamos de la integral a la suma, utilizando alguna integración discreta, ni qué son esos pesos que se han introducido.

¿Alguien puede indicarme cómo entenderlo mejor?

Gracias por cualquier ayuda,

Hmmm16

6voto

Mike Puntos 4226

Lamentablemente, el artículo es de pago, así que la respuesta se basa exclusivamente en su pregunta.

Lo que se hace para obtener el resultado es una linealización logarítmica bastante sencilla y, por tanto, una aproximación. Si tu esquema es correcto, el artículo utiliza los "trucos" de la derivada en tiempo continuo de funciones discretas y la integración discreta e integración discreta, pero al final todo se reduce a lo mismo.

Proporcionaré una derivación alternativa del resultado, haciendo explícita la aproximación e identificando los pesos $w$ . Así, aunque no sea el mismo, podrás seguirlo y confirmar el resultado.

Utilizamos que podemos aproximar una variable $X_t$ como $$ X_t \approx X\biggl(1+\log\frac{X_t}{X}\biggr) $$ donde $X$ es una constante. Cuanto más $X$ es $X_t$ mejor será la aproximación. Tenga en cuenta que $V(T)$ puede estar lejos de $V(0)$ en cuyo caso la aproximación es mala, digamos si la tasa de cambio de $V$ de $0$ a $T$ es superior al 10%.

Empecemos por aproximar $V_j(T)$ en torno a $V_j(0)$ . Aparte de las definiciones, utilizamos que $\log \frac{x}{y}=\log x - \log y$ . Obtenemos \begin{equation*} \begin{split} V_j (T) & \approx V_j(0) \biggl( 1+\log \frac{V_j(T)}{V_j(0)}\biggr)= V_j(0)\biggl(1+\log V_j(T) - \log V_j(0)\biggr) \\ & = V_j(0)\biggl(1+\log \prod_{i=1}^n x_{ij}(T) - \log \prod_{i=1}^n x_{ij}(0)\biggr) \\ & = V_j(0)\biggl(1+ \sum_{i=1}^n \log x_{ij}(T) - \sum_{i=1}^n \log x_{ij}(0)\biggr) \\ & = V_j(0)\biggl(1+ \sum_{i=1}^n [\log x_{ij}(T) - \log x_{ij}(0) ] \biggr) \\ & = V_j(0)\biggl(1+ \sum_{i=1}^n \log \frac{x_{ij}(T)}{x_{ij}(0)} \biggr) \end{split} \end{equation*}

Restar $V_j(0)$ de ambos lados, obtenemos \begin{equation*} \begin{split} V_j (T) - V_j(0) &\approx V_j(0)\biggl(1+ \sum_{i=1}^n \log \frac{x_{ij}(T)}{x_{ij}(0)} \biggr) - V_j(0) \\ & = V_j(0)\sum_{i=1}^n \log \frac{x_{ij}(T)}{x_{ij}(0)} \end{split} \end{equation*} En este punto ya puede reconocer similitudes en la estructura. Ahora solo queda resumir, simplificar e identificar los pesos. \begin{equation*} \begin{split} V(T)-V(0) & = \sum_{j=1}^m [V_j (T) - V_j(0)] \\ & \approx \sum_{j=1}^m V_j(0)\sum_{i=1}^n \log \frac{x_{ij}(T)}{x_{ij}(0)}\\ & = \sum_{j=1}^m \biggl(V_j(0) \log \frac{x_{1j}(T)}{x_{ij}(0)}+ \cdots + V_j(0)\log \frac{x_{ij}(T)}{x_{nj}(0)} \biggr) \end{split} \end{equation*}

Observe que la última línea corresponde exactamente al resultado de su pregunta, con los pesos identificados como $w_j=V_j(0)$ . Por tanto, ambas derivaciones son equivalentes.

4voto

Joe M Puntos 66

¿Alguien puede indicarme cómo entenderlo mejor?

Te doy una respuesta parcial, que espero pueda ayudarte a tener una orientación para entender el asunto.

Por desgracia, el artículo que has enlazado no se puede leer, así que sólo he leído el resumen. Y no podemos saber a priori el método concreto utilizado allí para calcular la integral. Así que, sin leer el artículo, es difícil dar una respuesta completa y específica.

el documento establece que como los datos que queremos evaluar la integral sobre no es continua (que no lo es) necesitamos utilizar un integración discreta

[...] No tengo ni idea. cómo pasamos de la integral a la suma utilizando alguna integración discreta, ni cuáles son estos pesos que se han introducido.

Como supongo que sabrás, además de los métodos analíticos para resolver integrales, existen numérico o discreto métodos para calcular integrales.

Estos métodos son importantes en dos casos concretos:

  1. Cuando la integral no se puede calcular por métodos analíticos, o, como se dice, en forma cerrada: muchas integrales no se pueden calcular o no existe una forma cerrada (una fórmula) para la integral, o mejor, para la primitiva.

  2. Tenemos datos. Los datos son por naturaleza discontinuos Si no se dispone de datos numéricos, se dispone de valores numéricos específicos indexados, por ejemplo, por tiempo. Es decir no conozco la función integrarse, no la tienes, sino sólo algunos valores concretos y discretos de ella. Sin conocer la función, por supuesto, no podemos hacer la integral, así que tenemos que recurrir a métodos numéricos o discretos.

También las funciones discontinuas pueden ser integrables, y en la mayoría de los casos lo son, pero el hecho es que en tu caso no tenemos función, sino sólo puntos de la función.

Esa es la razón por la que se pasa de la integral a una suma, porque una suma es sobre valores discretos, la integración requiere una función (y esa función debe ser integrable).

El tema de la integración numérica o discreta forma parte de análisis numérico.

Existen muchos métodos numéricos para resolver integrales.

Deberíamos conocer el método específico utilizado en su documento, para poder entender también cuáles son estos "pesos". $w$ en ese caso concreto:

En general, los métodos de integración numérica pueden describirse como una combinación de evaluaciones del integrando para obtener una aproximación a la integral. El integrando se evalúa en un conjunto finito de puntos denominado puntos de integración y se utiliza una suma ponderada de estos valores para aproximar la integral. Los puntos de integración y los pesos dependen de del método específico utilizado y de la precisión requerida de la aproximación.

Esta cita procede de un artículo de Wikipedia sobre integración numérica:

https://en.wikipedia.org/wiki/Numerical_integration

Desde un punto de vista matemático, si se pudiera leer el paper original, podríamos ver si , en la integración numérica, se ha utilizado algún método interpolatorio, como polinomios de Lagrange para encontrar los pesos $w_j$ . En este caso, los puntos de interpolación vienen dados por las observaciones disponibles.

Sin leer el documento, es sólo una suposición. Pero, según tengo entendido por los comentarios de Varulle, que cita partes del artículo original, no es así, se utilizan otros métodos.

Para continuar con las conjeturas, es suficientemente claro que se ha utilizado una cuadratura numérica, es decir una fórmula como

$\int_0^T f(t) = \sum_ {j=1,..,n}w_jf(x_j)$ ,

Lo que no está claro es cómo los derivados $\frac{dln(x_{1j}(t))}{dt}$ desaparecer.

4voto

Carl Puntos 2229

Perdón por esta respuesta tan realista, pero creo que el supuesto subyacente simplemente afirma que $V_j(t)$ es constante (hasta un término aleatorio no correlacionado), o dicho de otro modo: $$ V_j(t)=w_j,$$ lo que implica que $$ \int_0^T V_j(t) \frac{dln(x_{1j}(t))}{dt} dt = w_j\int_0^T \frac{dln(x_{1j}(t))}{dt} dt= w_jln\left(\frac{x_{1j}(T)}{x_{1j}(0)}\right),$$ y se obtiene la expresión para $V(T)-V(0)$ . No veo en el documento ningún esfuerzo por utilizar métodos de integración numérica.

EDITAR : Si intentamos ir más allá de valores constantes para $V_j$ en general, el resultado será diferente del que dan los autores. Por ejemplo, en el caso lineal, $V(t)=a_j+b_jt$ con $V'(t)=b_j \neq 0,$ encontramos que

\begin{align*} \int_0^T \left( a_j+b_js \right) \frac{d\ln(x_{1j})}{dt}(s) ds &= a_j\int_0^T \frac{d\ln(x_{1j})}{dt}(s) ds + b_j\int_0^T s \frac{d\ln(x_{1j})}{dt}(s) ds \\ &= a_j\ln\left(\frac{x_{1j}(T)}{x_{1j}(0)}\right) + b_j G_j(T,0), \end{align*} que, en general, difiere de la ecuación dada por los autores. Si además suponemos que $\ln(x_{1j}(t))' = c_{1j},$ o que $x_{1j}'(t) = c_{1j},$ seguimos teniendo una expresión con $G_j \neq 0$ y NO lineal en $ \ln \left(x_{1j}(T)/x_{1j}(0)\right) $ .

Los autores dicen explícitamente que su ecuación es una aproximación y que su calidad dependerá de las propiedades empíricas de los datos. Una posibilidad sería determinar las ponderaciones mediante una regresión, siempre que se disponga de suficientes observaciones.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X