1 votos

Efecto Fijo Vs Efecto Aleatorio en el Modelo Logit Mixto

¿Cómo decides si usar una variable como efecto fijo o efecto aleatorio en un modelo logit mixto?

Aquí, estoy tratando de estimar un modelo logit mixto para datos de elección discreta. X1, x2 y x3 son iguales para cada individuo. Son variables demográficas. Y x4, x5 y x6 varían para cada individuo y varían según la elección realizada. pid representa de manera única a cada encuestado y gid representa de manera única cada conjunto de elección.

mixlogit y x1 x2 x3, group(gid) id(pid) rand(x4 x5 x6 price) robust nrep(500) burn(25) difficult tech (nr 5 dfp 5)

En este modelo anterior, estoy confundido sobre cómo decidir qué variables utilizar como efecto fijo y cuáles como efectos aleatorios. Se agradecen sus sugerencias.

1 votos

Lee el libro de Kenneth Train sobre Métodos de Elección Discreta ... hay un capítulo sobre modelos de logit mixtos. Está escrito en un estilo muy accesible.

0 votos

Gracias. Lo haré seguro.

3voto

user10287 Puntos 61

En un modelo logit mixto, los coeficientes del modelo logit $\beta = (\beta_1,...,\beta_K)$ se asumen como variables aleatorias. Consideremos, para simplificar, el caso en el que solo hay dos coeficientes $K=2$.

En el modelo logit, la probabilidad de elección para la alternativa $j$ del conjunto de elección $j \in \{1,...,J\}$ se expresa como

$$P_j = \frac{\exp(\beta_{1j} + \beta_{2j} x_1)}{\sum_{s=1}^J \exp(\beta_{1s} + \beta_{2s} x_1)}.$$

Por lo tanto, el modelo tiene relativamente muchos parámetros $J * K$. Debido a que las alternativas de elección se identifican solo en relación unas con otras, solo se identifican $(J-1)*K$ parámetros.

En el modelo logit mixto, se asume que los coeficientes son aleatorios. Esto implica que cualquier coeficiente $\beta_{kj}$ puede expresarse como

$$\beta_{kj} = \mu_{kj}+\sigma_{kj}z_{kj},$$

donde $z_{kj}$ es la extracción normalizada de la distribución relevante. Por lo tanto, si se asume que los coeficientes siguen una distribución normal, entonces $z_{kj} \sim \mathcal N(0,1)$.

Los parámetros a estimar ahora incluyen los parámetros de la distribución de $\beta_{kj}$, que incluirán la ubicación $\mu_{kj}$ y la escala $\sigma_{kj}$.

Aquí viene la parte realmente importante: Observa que

$$\beta_{jk}x_{k} = \mu_{kj}x_k + \sigma_{kj} z_{kj} x_k,$$

ahora $\sigma_{kj}$ se estima y si no es significativamente diferente de 0, puedes asumir que $\sigma_{kj}=0$ y por lo tanto

$$\beta_{jk}x_{k} = \mu_{kj}x_k$$

lo que significa que el coeficiente no es aleatorio.

Entonces, una respuesta es que simplemente debes asumir que todos los coeficientes son aleatorios y probar si es el caso.

Ahora, en la práctica, puede ser muy difícil estimar los modelos logit mixtos debido a que muchos parámetros son empíricamente no identificables. Esto dificulta probar si todos los parámetros deberían ser aleatorios o no.

Por lo tanto, a menudo se observa en casos aplicados que se asume que los coeficientes siguen una distribución normal y que las covarianzas se asumen como 0.

Además, incluso en casos en los que las covarianzas son 0, el modelo puede ser difícil de estimar. Por lo tanto, en estos casos, ciertos coeficientes se eligen como no aleatorios por diseño. Esto debería basarse en la interpretación y, por lo tanto, dependerá del contexto en el que se utilice el modelo.

A menudo, los coeficientes aleatorios se utilizan para describir la variación en los gustos entre individuos. Se asume que las preferencias de los individuos por ciertas alternativas dependen de $x_k$ y de cómo varía esta dependencia en $x_k$ de un individuo a otro.

Por ejemplo, cuánto afecta el sabor a fresa de un tipo de helado $j$ medido por $x_j$ a la elección de ese tipo de helado $j$ difiere de un individuo a otro. Para algunos puede ser malo, para otros bueno.

Por lo tanto, en este caso, si no crees que diferentes individuos tengan preferencias diferentes (a algunos les gusta la fresa y a otros no), entonces simplemente haz que el término no sea aleatorio.

También, ten en cuenta que la variación en los gustos se puede modelar con variables observadas incluyendo términos de interacción. Aquí, la parte $\sigma_{kj} z_{kj} x_k$ se convierte en un término de interacción donde $z_{kj}$ es observado. Por lo tanto, los coeficientes se asumen aleatorios solo cuando se hace la suposición de que existe variación de gusto no observada cuando se han incluido todas las variaciones observadas. Esto obviamente depende de la disponibilidad de datos.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X