8 votos

Identificar el significado de la asunción

Espero obtener una buena explicación sobre lo que se entiende por un supuesto de identificación .

En muchos artículos, en el apartado de estrategia empírica, los autores afirman que:

  • explotamos la variación a nivel de empresa para identificar el efecto
  • explotamos la variación a nivel de industria para identificar el efecto

Ejemplos:

El documento examina el efecto de las corridas bancarias sobre los préstamos. Aprovechamos la variación en la estructura de los pasivos de los bancos para identificar los bancos más vulnerables a la corrida.

Aprovechamos la variación entre mercados inmobiliarios comerciales geográficamente distintos para establecer de forma concluyente que las perturbaciones de la oferta de préstamos procedentes de Japón tuvieron efectos reales sobre la actividad económica en Estados Unidos.

6voto

brian Puntos 124

"Identificación" es el término más cargado de la econometría. Existen múltiples equilibrios de palabrería barata con respecto a su significado. Se utiliza con diferentes significados previstos (pero relacionados y superpuestos), en diferentes contextos, por personas con diferentes orientaciones, con diferentes niveles de precisión.

Por lo tanto, obtendrá una serie de respuestas correctas. A continuación se presenta un intento de cubrir algunas de las variaciones, desde el extremo teórico del espectro hasta el empírico.

Estadísticas

Un modelo estadístico es un mapeo uno a uno $\theta \mapsto P_{\theta}$ de un espacio de parámetros dado a una familia de medidas de probabilidad. Es la propiedad uno a uno del mapeo lo que hace que el modelo esté "identificado". No hay dos elementos diferentes en el espacio de parámetros que puedan dar lugar a procesos generadores de datos observacionalmente equivalentes.

Por lo tanto, en estadística siempre se identifica un modelo, por definición/presunción. (Esto puede verse en los supuestos de todos los resultados fundacionales, por ejemplo, Neyman-Pearson). Los estadísticos nunca hablan de identificación, porque no tienen que hacerlo.

Por ejemplo, para $$ y = \beta x + \epsilon \quad (*) $$ donde $(x,\epsilon)$ es normal bivariante, para especificar un modelo de población $(x,y)$ parametrizado por $\beta$ hay que suponer que $Cov(x, \epsilon) = 0$ . Sin imponer este supuesto, diferentes $\beta$ podría dar lugar a la misma distribución para $(x,y)$ . En la econometría, que es mucho más explícita sobre la cuestión de la identificación, la condición $Cov(x, \epsilon) = 0$ se llamará a veces supuesto de identificación .

Modelos estructurales

Si se intenta construir un modelo estadístico añadiendo perturbaciones no observadas a un modelo económico, es necesario abordar la identificación. Para que el modelo econométrico estructural resultante se identifique, normalmente hay que hacer ciertas suposiciones, ya sean de carácter económico o técnico. Estos se denominan supuestos de identificación .

Por ejemplo, supongamos que hay $n$ empresas en competencia Cournot con costes marginales constantes privados $(c_1, \cdots, c_n)$ extraído de la densidad conjunta $f(x_1, \cdots, x_n)$ . El econometrista observa la producción de las empresas $(q_1, \cdots, q_n)$ y el precio de mercado $P$ y le gustaría identificar $f$ . Una posible hipótesis de identificación es que el jacobiano del sistema FOC $$ \frac{d P(Q)}{dQ} q_i + P(Q) - c_i = 0, \, i = 1, \cdots, n,\, \mbox{ where } Q=\sum_1^n q_i $$ es no evanescente. Entonces, por el Teorema de la Función Implícita, $(q_1, \cdots, q_n)$ mapea uno a uno localmente a $(c_1, \cdots, c_n)$ . Esto implica que el modelo, parametrizado por la cantidad observada $(q_1, \cdots, q_n)$ se identifica, al menos localmente. La interpretación empírica es que una variación suficiente en las compensaciones a las que se enfrentan las empresas permite identificar $f$ .

Hay más ejemplos interesantes en los que el supuesto de identificación pone restricciones al comportamiento de los agentes económicos, etc.

Estimación empírica coherente con el uso

Hasta ahora, identificación es puramente una propiedad del mapeo de los procesos de generación de parámetros y datos. La identificación es un requisito previo para la estimación, pero por sí misma no menciona la muestra.

También hay contextos en los que un econometrista habla de un estimador específico diseñado para estimar un parámetro específico en un modelo específico. Un supuesto bajo el cual el estimador estima sistemáticamente el parámetro se denomina supuesto de identificación . Por ejemplo, dados los datos de las series temporales $(x_t, y_t)$ generado por $$ y_t = \beta x_t + \epsilon_t, \; t = 1, 2, \cdots, \quad (**) $$ el parámetro $\beta$ " pueden ser identificados por OLS $\hat{\beta}$ " bajo el supuesto de que $Cov(x, \epsilon) = 0$ .

En $(*)$ y $(**)$ la condición $Cov(x, \epsilon) = 0$ y la terminología son los mismos, pero "suposición de identificación" tienen significados diferentes (pero claramente relacionados).

Inferencia empírica de uso-causal

Cuando uno está interesado en establecer el efecto causal, una condición impuesta al modelo que permite la interpretación causal de la estimación se llama supuesto de identificación . Sí $Cov(x, \epsilon) = 0$ para el modelo lineal también entraría en esta categoría. A menudo se refuerza para $E[\epsilon|x] = 0$ que es más interpretable para la inferencia causal.

Del mismo modo, cuando $Z$ es un instrumento, la condición de exogeneidad $Cov(Z, \epsilon) = 0$ es una hipótesis de identificación. En el caso de las diferencias en diferencias, la condición de tendencias paralelas es un supuesto de identificación. Para el diseño de regresión discontinua, los supuestos de identificación son que, en primer lugar, no hay otras discontinuidades excepto la variable de forzamiento, y en segundo lugar, los agentes no pueden manipular la variable de forzamiento. El diseño empírico correspondiente (por ejemplo, IV/DID/RDD/etc) se denomina a veces estrategia de identificación .

En este contexto, la "identificación" no es una condición binaria. Se puede tener débil identificación Por ejemplo, un instrumento débil.

Utilizada en este sentido, una hipótesis de identificación debe justificarse claramente cuando se afirma que se mantiene empíricamente. En otras palabras, hay que justificar que la correspondiente variación es exógena--por ejemplo, la variación del instrumento es exógena, etc.

En su ejemplo citado,

El documento examina el efecto de las corridas bancarias sobre los préstamos. Aprovechamos de la estructura de los pasivos de los bancos para identificar los bancos que fueron más vulnerables a la corrida...

La vulnerabilidad a una corrida es claramente una variable endógena en relación con los préstamos. La afirmación es entonces que el diseño empírico en cuestión utiliza la variación exógena en la estructura de los pasivos de los bancos -como instrumento/variable de refuerzo/lo que sea- para eludir la endogeneidad y lograr la identificación.

3voto

Matthias Benkard Puntos 11264

Creo que la mejor manera de explicar esto es explicar rápidamente lo que es la identificación. Como se menciona en este hilo :

Por ejemplo, en el caso de John Stachurski "Una introducción a la teoría econométrica" la identificación es un proceso para averiguar si los parámetros son identificables y la identificabilidad se define como

"La identificabilidad significa que el vector de parámetros asociado a la distribución desconocida puede eventualmente distinguirse de los datos".

Además, como bien resume BBKing:

Una estimación identificada es cualquier estimación que cumple ciertas condiciones que la convierten en el número verdadero que queremos.

Por ejemplo, cualquier coeficiente de (estimación de) una regresión OLS son estimaciones. Sin embargo, un coeficiente de un modelo OLS que cumple todos los supuestos OLS para una estimación consistente insesgada (por ejemplo, ninguna relación entre los términos de error y la variable independiente) es una estimación identificada. Sólo un modelo de este tipo "logra la identificación" o permite a los autores afirmar que "identificamos el efecto".

Entonces, ¿cuáles son los supuestos de identificación? Son supuestos bajo los cuales se puede decir que los parámetros son identificables. Por ejemplo, en los MCO simples

$$y = X \beta +e$$

una condición para que un parámetro sea identificable es que $X’X$ que se utiliza para estimar la $\beta$ (ya que $\hat{\beta} = (X'X)^{1}X'y$ ), debe ser invertible. Si la matriz $X'X$ no es invertible, simplemente no podemos identificar los parámetros del modelo.

Los diferentes modelos tendrán diferentes condiciones para que los parámetros sean identificables. Si considera que las sugerencias anteriores son demasiado avanzadas para su nivel, puede consultar algún libro de texto de econometría, como Verbeek's guide to modern econometrics o Pesaran Time Series and Panel Data Econometrics, o algún libro de texto de licenciatura, como Wooldridge introduction to modern econometrics, para saber cuáles son las condiciones de identificación de los distintos modelos (aunque los libros de texto de licenciatura sólo las mencionan muy brevemente).

1voto

Bernard Puntos 10700

"Identificación" es la jerga profesional de la econometría para "afirmar que los resultados de un modelo econométrico estiman efectivamente lo que queremos y declarar que lo estiman".

La "identificación" no incluye la afirmación de que una estimación específica procedente de la combinación de un método de estimación específico con una muestra de datos, será una "buena" estimación (insesgada, consistente, etc.). Sólo afirma que podemos, de alguna manera, estimar en principio lo que declaramos que queremos estimar. Esto lleva a varias condiciones, a veces técnicas, que no se pueden resumir.

Pero en los ejemplos que cita el PO, la "identificación" no se utiliza en este sentido, sino en un sentido mucho más general e informal, porque (explotando el) " variación ", está en el corazón mismo de la estimación estadística: la única manera de separar / estimar los efectos es si hay alguna relación variable entre ... variables variables.

Consideremos, por ejemplo, el salario como variable dependiente y los años de educación como variable explicativa: si observamos la variación del salario en una muestra en la que todos los trabajadores tienen los mismos años de educación, no podemos estimar cuál es el efecto de los años de educación sobre el salario, si es que hay alguno. A la inversa, supongamos que tenemos una muestra en la que todos los salarios son iguales, pero los años de educación varían por trabajador. Aquí podríamos decir que los años de educación no importan para el salario, pero aun así, esta será sólo una conclusión específica de la muestra, no podríamos generalizarla. Pero si tanto el salario como los años y la educación varían, entonces podríamos en principio estimar su relación, que también podría ser cero.

En otras palabras, para estimar un efecto estructural (es decir, fijo, permanente en cierto sentido), necesitamos variación (diferencia, cambio): una de las muchas contradicciones estimulantes (aparentes) que caracterizan a la estadística.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X