3 votos

¿Puedo utilizar los datos calculados por regresión

Puedo usar los datos calculados para el análisis de regresión.

caso 1: en primer lugar ejecutar OLS $y = \alpha+\beta$ x, y obtener $\hat\beta$, a continuación, calcular $z = h^\hat\beta$, en última ejecución $m = \gamma + \mu z$.

caso 2: siga la misma configuración que la del caso 1, ejecute $z = \zeta + \rho p$.

caso 3: uso de matlab resuelve la ecuación $k_i = \sum_j d_{ij} k_j$ para $k_i$, a continuación, ejecute $w = \theta + \pi k$.

donde $\alpha$,$\beta$,$\gamma$,$\mu$,$\zeta$,$\rho$,$\theta$y $\pi$son los coeficientes de las otras letras denotan las variables.Me tienen las variables y,x,h,m,p,$d_{ij}$,w. Todas las relaciones entre las variables son de los modelos.

Son independientes de los casos que me he topado.

Voy a estimar los coeficientes $\mu$,$\rho$y $\pi$.

2voto

luchonacho Puntos 7713

Me temo que el aceptado la respuesta no es lo suficientemente precisa, y puede ser muy engañosa.

Este problema es formalmente llamado Generado Regresión problema que surge cuando usamos "generado" regresores en una regresión. Esta es una muy característica común de las estimaciones como Modelo de Selección de Heckman, donde utilizamos la predicción de la Inversa de Mills Proporción de la selección de la ecuación en la ecuación estructural. Tenemos que dividir el problema en dos:

  • Consistencia: generalmente no hay problema de consistencia cuando se utiliza regresores generados en una estimación. Una prueba formal puede encontrarse en Wooldridge (2010), en la página 123.

  • Inferencia estadística: aquí puede haber problemas. Bajo el nulo que genera regresores son cero, los errores estándar y todas las pruebas son válidas (es posible que aún necesita para corregir la heterocedasticidad y correlación serial como de costumbre, utilizando errores estándar robustos). Sin embargo, si el generado regresor es estadísticamente significativa, a continuación, los errores estándar y, en consecuencia, cualquier prueba no válida. Lo que necesitas es una correcta estimación de la varianza asintótica. Las fórmulas que dependen de cada caso (más información en Newey y McFadden [1994]). Sin embargo, una solución general para calcular la constante de los errores estándar es el uso de bootstrap. Como un aparte, por ejemplo, si el uso de Stata, simplemente ejecutar el comando normal con el siguiente código antes de:

    bootstrap, reps(400) seed(10101): regres ...
    

reps el número de repeticiones y seed es para la reproducibilidad.

TL;DR

Si su generados regresor es estadísticamente significativa en la regresión, entonces usted necesita para la estimación de los errores estándar el uso de boostrapping porque son inválidas. Si ellos son insignificantes, están a salvo.

1voto

warren_s Puntos 952

La respuesta de alguien

Caso 1: no Hay una estimación de error en beta_hat. Por lo que Z debe ser realmente llamado Z_hat, que es diferente de la verdadera Z se define como exp(beta_0). La estimación del error se traduce en el error-en la variable del problema en la segunda regresión. El estimador de MCO de mu sufrirá una atenuación de sesgo en muestras finitas. Sin embargo, en muestras grandes, cuando la varianza de la estimación de error en beta_hat llega a cero, la atenuación de sesgo desaparece. Así que usted puede ejecutar la regresión como de costumbre.

Caso 2: No es un problema. Simplemente ejecutar la regresión como de costumbre.

Caso 3: No hay un problema, siempre se puede estimar el k precisamente. Es decir, los errores numéricos tienen que ser muy pequeños. De lo contrario, tendrá el mismo problema que en el Caso 1.

1voto

Kariem Puntos 1416

luchonacho la respuesta es bueno tener en mente, pero esto no significa que usted no puede hacer lo que usted propone, sólo que usted debe tener una buena razón para hacerlo.

Puesto que usted está usando sólo su estimado de la variable en el caso 1 y el caso 2 me voy a centrar en aquellos.

Tanto en el caso 1 y el caso 2 que están en la estimación de una regresión lineal simple con X como la variable y y como la variable dependiente. Esto implica que usted cree que X y y están relacionadas en un estricto sentido lineal. Así que el beta hat está diciendo que la pendiente de la línea entre X y Y.

Usted, a continuación, elevar h a una potencia de beta hat. Supongo h es función de otra variable. Esencialmente esto es sólo una transformación de la h. Usted está levantando cada valor almacenado en h para una potencia de beta hat.

Si eso es lo que quiero hacer es que parece ser una forma válida de hacerlo, pero yo estoy luchando para interpretar lo que z significaría sin saber cómo sus variables están relacionadas.

Yo también estoy luchando para ver por qué usted necesita para hacer la transformación en el primer lugar. Con un par de detalles sobre cómo están relacionadas las variables, o tal vez un enlace a la documentación de su trabajo está citando podría ser de más ayuda.

Tal y como está ahora mismo, yo diría que su regresiones utilizando la variable z no tiene sentido económicamente y tienen importantes problemas estadísticos así. Recomiendo tomar un paso atrás y pensar acerca de sus especificaciones de nuevo.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X