10 votos

Estimación de los parámetros de la función de utilidad (no de producción) CES

La función de utilidad CES tiene la forma \begin{equation} u(x_1,\dots,x_n)=\left[\sum_{i=1}^n\alpha_ix_i^\rho\right]^{1/\rho}, \end{equation} donde $\alpha_i$ es el parámetro de la cuota de consumo y $\sigma=\frac{1}{1-\rho}$ es la elasticidad de sustitución.

Estoy interesado en estimar el $\alpha_i$ y $\sigma$ . Dado que no observamos directamente los niveles de utilidad, creo que podemos utilizar los datos para estimar las funciones de demanda marshallianas implícitas en la función de utilidad: \begin{equation} x_i(p_1,\dots,p_n,M)=\frac{M(\alpha_i/p_i)^\sigma}{\sum_{j=1}^n\alpha_j^\sigma p_j^{1-\sigma}},\quad i=1,\dots,n. \end{equation} Está claro que la función es altamente no lineal en los parámetros de interés. Por tanto, sería necesario un procedimiento de estimación no lineal.

Digamos que tenemos un consumo de datos $x_i$ Precios $p_i$ e ingresos $M$ . ¿Cómo hacemos para estimar los parámetros $\alpha_i$ y $\sigma$ ?

Puedo encontrar un montón de documentos sobre la estimación de la CES producción pero no me resultan útiles porque no observo la variable dependiente ( $u$ ). Dado que la utilidad CES es una forma funcional común utilizada en la literatura, sospecho que su estimación debe estar en algún lugar de la literatura.

Me las arreglé para encontrar el estimación por mínimos cuadrados no lineales en Stata pero no sé hasta qué punto este procedimiento es susceptible de sufrir una especificación errónea y hasta qué punto se debe confiar en los estadísticos (por ejemplo, t-stat o p-value) producidos por el programa.

Se agradecerá cualquier indicación de los artículos o capítulos de libros de texto sobre el tema, así como de los paquetes estadísticos que apliquen el procedimiento de estimación.

10voto

Carl Puntos 2229

Puede ser interesante aprovechar la separabilidad homotética de la función de utilidad CES en $x$ . Esto implica que $$\frac{x_i}{x_j} = \left( \frac{\alpha_i}{\alpha_j}\frac{p_j}{p_i} \right)^\sigma $$ y después $log$ -transformación: $$\ln(x_i) - \ln(x_j) = \beta_{ij} + \sigma (\ln(p_j) - \ln(p_i)). $$

Tras añadir un término aleatorio, esta especificación podría utilizarse para estimar el $\beta_{ij} \equiv \sigma (\ln(\alpha_i)-\ln(\alpha_j))$ y $\sigma$ parámetros por OLS y en un segundo paso identificar los $\alpha_i$ por la distancia mínima:

$$ \widehat{\alpha} = \arg \min_\alpha \Big(\widehat{\beta}-\widehat{\sigma}(\ln(\alpha)-\ln(P\alpha)) \Big)'\Omega^{-1} \Big( \widehat{\beta}-\widehat{\sigma}(\ln(\alpha)-\ln(P\alpha)) \Big), $$ donde $P$ representa la matriz de permutación adecuada.

Algunas referencias que estiman los parámetros de preferencia CES son Diewert y Feenstra (2017) o Redding y Weinstein (2020), con un enfoque diferente, sin embargo, basado en la función de gasto unitario.

La mayoría de las contribuciones empíricas rechazan la validez de las funciones de utilidad homotéticas (como la CES). Existen algunas propuestas sobre cómo construir funciones de producción CES no homotéticas que podrían extenderse fácilmente a las funciones de utilidad, véase Shimomura (1999) y las referencias que contiene. Una extensión sencilla de la especificación anterior es:

$$\ln(x_i) - \ln(x_j) = \beta_{ij} + \sigma (\ln(p_j) - \ln(p_i)) + \gamma_{ij} M/p + \varepsilon, $$ donde $p$ denota un índice de precios agregado específico del consumidor y del tiempo (sobre todos los productos básicos). Notación $ij$ significa productos básicos $i$ y $j$ y no por las observaciones (me salté el $n,t$ subíndices para mayor claridad).

Esta relación es compatible con las preferencias no homotéticas. El caso homotético se obtiene para $\gamma_{ij}=0$ que puede ser probado.

En cuanto al software informático... Me cambié completamente a R hace unos años, permitiría "fácilmente" codificar el estimador de la distancia mínima, y el enlace entre las funciones de utilidad y demanda.

Referencias:

Diewert, Erwin y Robert Feenstra (2017), "Estimación de los beneficios y costes de los productos nuevos y en desaparición" mimeo Universidad de California en Davis.

Redding Stephen J y David E Weinstein (2020), "Measuring Aggregate Price Indices with Taste Shocks: Theory and Evidence for CES Preferences", The Quarterly Journal of Economics, 135, 503-560.

Shimomura, K., 1999, "A simple proof of the Sato proposition on non-homothetic CES functions", Economic Theory, 14, 501-503.

0 votos

'+1' por la referencia del artículo de Redding, una locura de artículo. Lo he leído todo el día.

2 votos

Sólo una pregunta de seguimiento: ¿Cómo piensa estimar $\beta_{ij}$ y $\sigma(\log p_i - \log p_j)$ en un primer paso OLS? Me refiero a que si se hacen dummies para $(i,j)$ -combinaciones que captarán tanto $\beta_{ij}$ y $\sigma(\log p_i - \log p_j)$ ¿verdad?

0 votos

@Bertrand: Gracias por la respuesta y la referencia. ¡Son muy útiles!

7voto

WAF Puntos 312

Esta respuesta sigue de cerca la lógica de la estimación de la función de coste translog presentada en la sección 4.7 de La "econometría" de Fumio Hayashi .

Definir por conveniencia el índice de precios agregados CES $P:=(\sum_i \alpha_i^\sigma p_i^{1-\sigma})^\frac{1}{1-\sigma}$ . Entonces el sistema de demanda marshalliano en forma logarítmica puede escribirse como un sistema de ecuaciones lineales

$$ \begin{cases} \ln x_1 &= \ln \alpha_1^\sigma -\sigma\ln p_1 - (1-\sigma)\ln P + \ln M\\ ...\\ \ln x_n &= \ln \alpha_n^\sigma -\sigma\ln p_n - (1-\sigma)\ln P + \ln M. \end{cases}$$

Tenga en cuenta que se trata de un modelo de regresión múltiple . Si estimamos estas ecuaciones por separado, los datos harán necesariamente estimaciones de $\sigma$ varían en función de la ecuación que estimamos, por lo que tenemos que imponer la restricción del coeficiente común desde el principio.

Además, un modelo de regresión necesita necesariamente términos de error:

$$ \begin{cases} \ln x_1 &= \ln \alpha_1^\sigma -\sigma\ln p_1 - (1-\sigma)\ln P + \ln M + \epsilon_1\\ ...\\ \ln x_n &= \ln \alpha_n^\sigma -\sigma\ln p_n - (1-\sigma)\ln P + \ln M + \epsilon_n. \end{cases}$$

Los términos de error $\epsilon_i$ debe tener una interpretación económica para que entendamos las propiedades estadísticas de los estimadores elegidos. En otras palabras, la incertidumbre expresada en $\epsilon_i$ debe atribuirse a $\alpha_i$ o a $\sigma$ (suponiendo que $x_i,p_i,M$ están libres de errores de medición/observación).

La interpretación más accesible y común es la siguiente:

En realidad, los pesos $\tilde \alpha_i$ no son constantes entre los individuos, sino que pueden fluctuar un poco en torno a la media de la población $\alpha_i$ con $\epsilon_i\sim\mathcal{N}(0,\sigma_\epsilon^2)$ siendo un sustituto de este ruido: $$ \tilde \alpha_i = \exp(\epsilon_i/\sigma) \alpha_i. $$

Sustitución de $\alpha_i$ por $\tilde \alpha_i$ en el sistema de demanda inicial marshalliano y tomando los logaritmos se obtiene exactamente el sistema de ecuaciones de regresión indicado.

Observación: en relación con $\epsilon$ a las diferencias transversales en $\sigma$ complica las cosas, ya que en este caso obtenemos heteroscedasticidad del término de error en la regresión (después de tomar logaritmos, el término de error se multiplica necesariamente por alguna función de $p_i$ ).

Ahora, otro problema es que sin el conocimiento de $\alpha_i,\sigma$ , $P$ no se observa realmente. Este problema se resuelve restando la ecuación $j$ de la ecuación $j$ como se sugiere en la respuesta de @Bertrand. Obtenemos un sistema de ecuaciones más pequeño ( $n(n-1)/2$ contra $n$ al principio):

$$ \ln \frac{x_i}{x_j} = \sigma \ln \frac{\alpha_i}{\alpha_j} -\sigma\ln \frac{p_i}{p_j} + \epsilon_i - \epsilon_j,\quad \forall i\in\{1,..n\}, j\in\{1,..n\}\setminus \{i\}$$

Ahora este nuevo modelo de regresión múltiple tiene dos nuevas restricciones además de la coeficiente común heredado del original:

  1. términos de error correlacionados , como $\mathbb{Cov}(\epsilon_i-\epsilon_j,\epsilon_j-\epsilon_k) = -\mathbb{V}(\epsilon_j)$ ,
  2. restricción de coherencia en los efectos de pareja : $\ln{\alpha_i/\alpha_j}+\ln{\alpha_j/\alpha_k} = \ln{\alpha_i/\alpha_k},\quad \forall i\neq j\neq k$

La correlación en los términos de error no es un problema de consistencia, pero sin duda afecta a la estimación de las covarianzas y los intervalos de confianza.

Por otra parte, la coherencia del efecto par permite reducir el número de coeficientes a estimar en la fase de formulación del modelo.

En forma vectorial, nuestra regresión multivariante puede representarse como

$$ y_t = Z_t \delta + u_t $$

donde (para $n=3$ sin pérdida de generalidad)

$$ y_t = \begin{bmatrix} \ln(\frac{x_{1t}}{x_{2t}}) \\ \ln(\frac{x_{1t}}{x_{3t}}) \\ \ln(\frac{x_{2t}}{x_{3t}})\end{bmatrix},\quad Z_t = \begin{bmatrix} 1 & 0 & &\ln(\frac{p_{1t}}{p_{2t}}) \\ 0 & 1 & & \ln(\frac{p_{1t}}{p_{3t}})\\ -1 & 1 & & \ln(\frac{p_{2t}}{p_{3t}}) \end{bmatrix}, \quad \delta = \begin{bmatrix} \sigma \ln \frac{\alpha_1}{\alpha_2} \\ \sigma \ln \frac{\alpha_1}{\alpha_3}\\ \sigma \end{bmatrix}, u_t = \begin{bmatrix}\epsilon_1-\epsilon_2\\ \epsilon_1-\epsilon_3 \\ \epsilon_2-\epsilon_3\end{bmatrix}.$$

El sistema anterior se adapta fácilmente a la estimación de efectos aleatorios (tratada ampliamente en la sección 4.6 de Hayashi).

La estimación de la elasticidad de sustitución CES $\hat \sigma$ se obtiene directamente, mientras que $\hat\alpha_i$ se puede precisar con alguna normalización sencilla (por ejemplo $\sum_i \alpha_i = 1$ ).

2 votos

Claro, se ve bastante bien, avísame cuando creas que has terminado. También estás seguro de la indexación en la matriz offdiagonal $p_jx_j$ -¿los términos son correctos? Otra cosa que puede considerar es si quiere abordar algunas cuestiones de endogeneidad. Es decir, si la gente quiere hacer esto en la práctica, ¿es una buena idea? (No es parte de la pregunta original, lo sé)

0 votos

Gracias por la respuesta. Tendré que tomarme un tiempo para digerir la parte de la regresión del panel, ya que no es lo que hago normalmente en el día a día.

0 votos

@JesperHybel He abierto mis viejos libros de texto y he revisado el planteamiento. La endogeneidad no es un problema. Hay que tener mucho cuidado para identificar la $\alpha$ 's y lograr la eficiencia.

6voto

user10287 Puntos 61

En este comentario simplemente muestro que

Bajo ciertos supuestos el problema no es un problema de estimación, existe una solución exacta para $\sigma$ y una solución para los errores estructurales $\alpha_i$ hasta una normalización.

El sistema de demanda considerado está descrito por la función de demanda de Marshall

$$x_k^\star(p,M) = \left(\frac{\alpha_j}{p_j}\right)^{\sigma}\frac{M}{\sum_j p_j^{1-\sigma}\alpha_j^\sigma},$$

lo que implica que las cuotas de gasto vienen dadas por

$$s_k(p,I) := \frac{p_k x_k^\star(p,I)}{\sum_j p_j x_j^\star(p,I)} = \frac{p_k^{1-\sigma}\alpha_k^\sigma}{\sum_j p_j^{1-\sigma}\alpha_j^\sigma}.$$

A continuación, defino $K(p,\alpha) := \sum_j p_j^{1-\sigma}\alpha_j^\sigma$ donde $p = (p_1,...,p_N)$ y $\alpha := (\alpha_1,...,\alpha_N)$ y linealizar logarítmicamente los porcentajes de gasto para obtener

$$(1) \ \ \ \log s_k = (1-\sigma) p_k + \sigma \log \alpha_k + K(p,\alpha)$$

Sección transversal única de datos agregados: Dados los datos sobre $\{s_k,p_k\}_{k=1}^N$ esta ecuación se puede estimar utilizando OLS bajo el supuesto de que $\mathbb E[p_k,\ln \alpha_k] =0$ .

Consideremos ahora la situación en la que se observan dos períodos de tiempo $t=1,2$ y los precios se supone que muestran cierta variación, mientras que se supone que $\alpha$ los parámetros de la demanda del consumidor son constantes en el tiempo

$$(1') \ \ \ \log s_{kt} = (1-\sigma) p_{kt} + \sigma \log \alpha_k + K_t(p_t,\alpha),$$

donde he añadido el índice de tiempo a $K$ porque el vector precio varía en el tiempo. Está claro que se trata de una regresión estándar de efectos fijos de dos vías sin un término de error específico del tiempo. Utilizando los métodos de demeaning conocidos de la metodología de estimación de efectos fijos se puede encontrar la solución exacta para $(1-\sigma)$ .

Primero tomar promedios sobre los bienes para obtener

$$\frac{1}{N}\sum_k \log s_{kt} = (1-\sigma) \frac{1}{N}\sum_kp_{kt} + \frac{1}{N}\sum_k \sigma \log \alpha_k + K_t(p_t,\alpha),$$

restar de la ecuación (1) para obtener

$$(2) \ \ \ \ ds_{kt} = (1-\sigma) dp_{kt} + \sigma d\alpha_k,$$ donde el $d$ en de la variable significa simplemente que ha sido degradada en versión logarítmica por lo que $ds_{kt} := \log s_{kt} - \frac{1}{N}\sum_k \log s_{kt}$ .

Segundo tomar las primeras diferencias en el tiempo para conseguir

$$(3) \ \ \ \ ds_{k2} - ds_{k1} = (1-\sigma) [dp_{k2} - dp_{k1}]$$

tal que

$$(4) \ \ \forall k: \ \ \ (1-\sigma) = \frac{ds_{k2} - ds_{k1}}{dp_{k2} - dp_{k1}}$$

habiendo encontrado $\sigma$ se puede encontrar $\alpha_i$ utilizando la ecuación (2). Esto significa que hay que resolver para $d\alpha_k = \alpha_k$ bajo la normalización que $\frac{1}{N}\sum_k \log \alpha_k = 0$ . Por tanto, no se puede recuperar la media de los errores estructurales.

Bajo el supuesto de que $\alpha_k$ son invariantes en el tiempo con datos $\{p_{jt},s_{jt}\}_{j=1,...N, t=1,2}$ recuperar $\sigma$ utilizando exactamente (4) y los errores estructurales $\alpha_k$ hasta una única normalización utilizando (2).

Para ilustrar los cálculos, proporciono una pequeña simulación:

#set.seed(1)
N <- 50
M <- 100000
sigma <- 4

# Simulate structural errors assumed time-constant
phi <- 2*runif(N)+2
phi <- phi/((prod(phi))^(1/N))

# Simulate prices   
p1 <- 2*runif(N)+2
p2 <- 2*runif(N)+2

s1 <- (p1/phi)^(1-sigma)
s1 <- s1/sum(s1)
E1 <- M*s1

s2 <- (p2/phi)^(1-sigma)
s2 <- s2/sum(s2)
E2 <- M*s2

x1 <- E1/p1
x2 <- E2/p2

library(data.table)
dt <- data.table(good=rep(1:N,2),time=rep(c(1,2),each=N),price=c(p1,p2),x=c(x1,x2))
dt[,E:=sum(price*x),by=time]
dt[,share:=price*x/E]

dt[,ds:=log(share)-mean(log(share)),by=time]
dt[,dp:=log(price)-mean(log(price)),by=time]
1-coef(lm(ds~dp+as.factor(good),data=dt))[2]
1-coef(lm(log(share)~log(price)+as.factor(good)+as.factor(time),data=dt))[2]
sigma

# Or from a single instead of all N 
temp <- as.matrix(dt[good==2,.(ds,dp)])
1-(temp[2,1] - temp[1,1]) / (temp[2,2]-temp[1,2])

Los cálculos de este post se basan en el documento de Stephen J. Redding y David E. Weinstein A UNIFIED APPROACH TO ESTIMATING DEMAND AND WELFARE.

0 votos

Hay una cosa que se llama sobreajuste. Hará que sus observaciones del tercer periodo no se ajusten a los valores de los parámetros obtenidos.

0 votos

Se trata simplemente de mostrar que tal y como está redactado el modelo hay una solución exacta si se tiene más de un periodo de tiempo. Esto no tiene nada que ver con el sobreajuste. Un término más adecuado sería sobreidentificación.

0 votos

El punto de mi comentario es sólo para decir, que si tenemos un conjunto de datos $\{x^1_t,..,x^n_t,y_t \}_{t=1}^T$ y queremos elegir algunos valores para $a,b^1,..b^n$ para ajustar una relación lineal $y_t = a + \sum b^i x^i$ entonces siempre podemos desechar cualquier $T-n-1$ observaciones y hacer un sistema de ecuaciones lineales del resto. Pero eso no significa que los puntos de datos que hayas desechado satisfagan la misma ecuación. Los valores que obtengas no serán robustos. Llámalo como quieras, "demasiados parámetros, muy pocos datos".

5voto

Peter Bailey Puntos 62125

Estas otras respuestas parecen citar algunos métodos de los que aún no he oído hablar, sin embargo, todas ellas se refieren a la idea desarrollada por un economista checo llamado Jan Kmenta que ha llegado a conocerse como la aproximación de Kmenta (en la documentación del paquete R se puede encontrar una explicación en profundidad, así como una derivación detallada, MicEconCES .

Una forma general de una función de utilidad CES es:

$$u(x_1,...,x_n)=\gamma\left(\sum_i \delta_i x_i^{-\rho}\right)^\frac{v}{\rho}$$

Para estimar esto tenemos: $$\ln y=\alpha_0+\sum_i\alpha_i \ln x_i+\frac{1}{2}\sum_i\sum_j \beta_{ij}\ln x_i \ln x_j$$ donde $y$ es nuestro índice de utilidad (nótese que podemos recuperar un índice orgánico de utilidad mediante la estimación de un sistema de gasto y la utilización de nuestros principios de dualidad).

Para obtener los parámetros de la función CES tenemos las siguientes formas: $$\gamma=\exp(\alpha_0)$$ $$v=\sum_i\alpha _i$$ $$\delta_i=\frac{\alpha_i}{\sum_i \alpha_i}$$ $$\rho=\frac{\beta_{ij}}{\alpha_i \alpha_j}\sum_i \alpha_i \ \ \forall i,j$$

Recomiendo encarecidamente el uso del paquete R para cualquier trabajo empírico que se realice. Espero que esto ayude.

2 votos

Interesante. Espero que tenga tiempo para ampliar un poco el tipo de datos que se utilizan. No estoy seguro de seguir lo que $y$ es y cómo se hace medible por así decirlo.

1 votos

Interesante, pero no es una respuesta al post original, comentario a lo sumo. Sólo es útil cuando se observa la producción de la CES, que sólo es el caso de la función de producción CES. Se dice explícitamente en el post que la estimación de la función de producción no es el objetivo aquí.

0 votos

@Konstantin puedes obtener y después de estimar y sistema de gasto e invertirlo para obtener nuestro índice de utilidad.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X