8 votos

¿Qué significa hacer una suposición de identificación?

Tratando de entender este problema:

Suponga que tiene acceso a un conjunto de datos que sigue a los individuos desde la adolescencia hasta la edad adulta. Cada año, usted observa los ingresos los logros educativos, la salud y el estado civil. Supongamos que de ver cómo el matrimonio afecta causalmente a los ingresos de los hombres. hombres. Utilizando los datos descritos, ¿cómo examinaría esta cuestión? ¿Qué ¿cuál sería su hipótesis de identificación? ¿Cómo podría evaluar la plausibilidad de esta hipótesis?

En primer lugar, estoy tratando de entender, ¿qué es un supuesto de identificación? Creo que es la suposición que se pone a prueba y que te dice si hubo una relación causal o no. ¿Es eso cierto?

Y mis primeras ideas para responder al problema de los deberes son estas:

Tendría que determinar que los ingresos y el matrimonio no están determinados simultáneamente, son causales inversos, o ambos están influidos por la misma variable. Así que crear un grupo contrafactual (hombres solteros) y emparejarlo con hombres casados podría establecer una buena diferencia en las diferencias.

Pero, ¿cómo evaluar la plausibilidad de este supuesto? Normalmente me limito a introducir los números en el ordenador y no me importa la plausibilidad. ¿Qué hace que una hipótesis sea más plausible en econometría?

11voto

brian Puntos 124

Supuesto de identificación: suposiciones hechas sobre la DGP que le permiten extraer una inferencia causal. Por ejemplo, el supuesto de exogeneidad para el IV, el supuesto de tendencias paralelas en el diff-in-diff.

Los supuestos de identificación (ausencia de endogeneidad en general) nunca pueden ser confirmar estadísticamente (un no rechazo es bueno, pero no es una confirmación). Así que la evaluación de la plausibilidad consiste en argumentos empíricos basados en lo que se sabe de la DGP.

5voto

Snehes datta Puntos 8

Tal vez otro ejemplo ayude aquí:

Imagínese que desea conocer el efecto del tabaquismo en la probabilidad de contraer cáncer. Al comparar simplemente las tasas de cáncer de los fumadores y los no fumadores, podría obtener una estimación sesgada de este efecto, porque quizás los fumadores también tienen una serie de comportamientos poco saludables que aumentan el riesgo de padecer cáncer (por ejemplo, beber mucho, hacer poco ejercicio, exponerse mucho al estrés, etc.).

En otras palabras, el "supuesto de identificación" que usted hace para estimar el efecto causal del tabaquismo en las tasas de cáncer, es decir, que los fumadores y los no fumadores sólo se diferencian en términos de su comportamiento como fumadores, es probable que no se mantenga aquí.

Por esta razón, es posible que desee utilizar una estrategia de identificación con supuestos menos dudosos. Por ejemplo, en lugar de analizar el efecto directo del consumo de cigarrillos sobre el cáncer, podría analizar el efecto de los cambios en el precio de los cigarrillos sobre el cáncer. Por ejemplo, podría ser que algunos distritos hayan aumentado el impuesto sobre los cigarrillos en un 20% mientras que otros distritos no lo han hecho. En tal caso, es probable que el consumo de cigarrillos disminuya en el primer grupo de distritos en relación con el segundo. Este cambio relativo en el consumo de cigarrillos puede utilizarse posteriormente para estimar el efecto causal del tabaquismo en las tasas de cáncer, ya que es poco probable que el aumento del precio esté correlacionado con las características de los fumadores/no fumadores (consumo de alcohol, ejercicio, etc.) --> en otras palabras, el supuesto de identificación en este modelo de estimación es más plausible que en el ingenuo comparación de fumadores y no fumadores.

Espero que esto ayude. También es posible que quieras mirar los artículos académicos que ilustran cómo utilizar estrategias de identificación geniales y rigurosas, por ejemplo

Donohue III, John J., y Steven D. Levitt. "El impacto del aborto legalizado en la delincuencia". Quarterly Journal of Economics (2001): 379-420.

Miguel, Edward y Michael Kremer. "Gusanos: identificando los impactos sobre la educación y la salud en presencia de externalidades de tratamiento". Econometrica 72.1 (2004): 159-217.

Abadie, Alberto, Joshua Angrist y Guido Imbens. "Estimaciones por variables instrumentales del efecto de la formación subvencionada sobre los cuantiles de los ingresos de los aprendices". Econometrica 70.1 (2002): 91-117.

0voto

Josiah Puntos 200

La "identificación causal", abordada en la descripción de su problema y en otras respuestas, es diferente de la "identificación del modelo" = "identificación de los parámetros", que es un requisito algo más general.
Significa que con una muestra infinitamente grande de observaciones, los parámetros de un modelo podrían estimarse con valores distintos. Es decir, diferentes valores de los parámetros de un modelo deben conducir a diferentes predicciones (distribuciones de probabilidad) sobre los observables. Esta cuestión suele denominarse problema de identificación.

El título de tu post (pregunta) sugiere que se necesita una respuesta más general que abordar sólo la identificación en el caso de la inferencia causal.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X