"Identificación" es el término más cargado de la econometría. Existen múltiples equilibrios de palabrería barata con respecto a su significado. Se utiliza con diferentes significados previstos (pero relacionados y superpuestos), en diferentes contextos, por personas con diferentes orientaciones, con diferentes niveles de precisión.
Por lo tanto, obtendrá una serie de respuestas correctas. A continuación se presenta un intento de cubrir algunas de las variaciones, desde el extremo teórico del espectro hasta el empírico.
Estadísticas
Un modelo estadístico es un mapeo uno a uno $\theta \mapsto P_{\theta}$ de un espacio de parámetros dado a una familia de medidas de probabilidad. Es la propiedad uno a uno del mapeo lo que hace que el modelo esté "identificado". No hay dos elementos diferentes en el espacio de parámetros que puedan dar lugar a procesos generadores de datos observacionalmente equivalentes.
Por lo tanto, en estadística siempre se identifica un modelo, por definición/presunción. (Esto puede verse en los supuestos de todos los resultados fundacionales, por ejemplo, Neyman-Pearson). Los estadísticos nunca hablan de identificación, porque no tienen que hacerlo.
Por ejemplo, para $$ y = \beta x + \epsilon \quad (*) $$ donde $(x,\epsilon)$ es normal bivariante, para especificar un modelo de población $(x,y)$ parametrizado por $\beta$ hay que suponer que $Cov(x, \epsilon) = 0$ . Sin imponer este supuesto, diferentes $\beta$ podría dar lugar a la misma distribución para $(x,y)$ . En la econometría, que es mucho más explícita sobre la cuestión de la identificación, la condición $Cov(x, \epsilon) = 0$ se llamará a veces supuesto de identificación .
Modelos estructurales
Si se intenta construir un modelo estadístico añadiendo perturbaciones no observadas a un modelo económico, es necesario abordar la identificación. Para que el modelo econométrico estructural resultante se identifique, normalmente hay que hacer ciertas suposiciones, ya sean de carácter económico o técnico. Estos se denominan supuestos de identificación .
Por ejemplo, supongamos que hay $n$ empresas en competencia Cournot con costes marginales constantes privados $(c_1, \cdots, c_n)$ extraído de la densidad conjunta $f(x_1, \cdots, x_n)$ . El econometrista observa la producción de las empresas $(q_1, \cdots, q_n)$ y el precio de mercado $P$ y le gustaría identificar $f$ . Una posible hipótesis de identificación es que el jacobiano del sistema FOC $$ \frac{d P(Q)}{dQ} q_i + P(Q) - c_i = 0, \, i = 1, \cdots, n,\, \mbox{ where } Q=\sum_1^n q_i $$ es no evanescente. Entonces, por el Teorema de la Función Implícita, $(q_1, \cdots, q_n)$ mapea uno a uno localmente a $(c_1, \cdots, c_n)$ . Esto implica que el modelo, parametrizado por la cantidad observada $(q_1, \cdots, q_n)$ se identifica, al menos localmente. La interpretación empírica es que una variación suficiente en las compensaciones a las que se enfrentan las empresas permite identificar $f$ .
Hay más ejemplos interesantes en los que el supuesto de identificación pone restricciones al comportamiento de los agentes económicos, etc.
Estimación empírica coherente con el uso
Hasta ahora, identificación es puramente una propiedad del mapeo de los procesos de generación de parámetros y datos. La identificación es un requisito previo para la estimación, pero por sí misma no menciona la muestra.
También hay contextos en los que un econometrista habla de un estimador específico diseñado para estimar un parámetro específico en un modelo específico. Un supuesto bajo el cual el estimador estima sistemáticamente el parámetro se denomina supuesto de identificación . Por ejemplo, dados los datos de las series temporales $(x_t, y_t)$ generado por $$ y_t = \beta x_t + \epsilon_t, \; t = 1, 2, \cdots, \quad (**) $$ el parámetro $\beta$ " pueden ser identificados por OLS $\hat{\beta}$ " bajo el supuesto de que $Cov(x, \epsilon) = 0$ .
En $(*)$ y $(**)$ la condición $Cov(x, \epsilon) = 0$ y la terminología son los mismos, pero "suposición de identificación" tienen significados diferentes (pero claramente relacionados).
Inferencia empírica de uso-causal
Cuando uno está interesado en establecer el efecto causal, una condición impuesta al modelo que permite la interpretación causal de la estimación se llama supuesto de identificación . Sí $Cov(x, \epsilon) = 0$ para el modelo lineal también entraría en esta categoría. A menudo se refuerza para $E[\epsilon|x] = 0$ que es más interpretable para la inferencia causal.
Del mismo modo, cuando $Z$ es un instrumento, la condición de exogeneidad $Cov(Z, \epsilon) = 0$ es una hipótesis de identificación. En el caso de las diferencias en diferencias, la condición de tendencias paralelas es un supuesto de identificación. Para el diseño de regresión discontinua, los supuestos de identificación son que, en primer lugar, no hay otras discontinuidades excepto la variable de forzamiento, y en segundo lugar, los agentes no pueden manipular la variable de forzamiento. El diseño empírico correspondiente (por ejemplo, IV/DID/RDD/etc) se denomina a veces estrategia de identificación .
En este contexto, la "identificación" no es una condición binaria. Se puede tener débil identificación Por ejemplo, un instrumento débil.
Utilizada en este sentido, una hipótesis de identificación debe justificarse claramente cuando se afirma que se mantiene empíricamente. En otras palabras, hay que justificar que la correspondiente variación es exógena--por ejemplo, la variación del instrumento es exógena, etc.
En su ejemplo citado,
El documento examina el efecto de las corridas bancarias sobre los préstamos. Aprovechamos de la estructura de los pasivos de los bancos para identificar los bancos que fueron más vulnerables a la corrida...
La vulnerabilidad a una corrida es claramente una variable endógena en relación con los préstamos. La afirmación es entonces que el diseño empírico en cuestión utiliza la variación exógena en la estructura de los pasivos de los bancos -como instrumento/variable de refuerzo/lo que sea- para eludir la endogeneidad y lograr la identificación.