2 votos

Sesgo de especificación - la varianza estimada es un estimador sesgado de la verdadera varianza del término de error

Considere los dos modelos (a)y=Xβ+u(a)y=Xβ+u donde XX es n×Kn×K y b) y=Zγ+ωy=Zγ+ω donde ZZ es n×rn×r . Bajo los supuestos clásicos (y ZZ y XX no son estocásticos) si el modelo (a), es decir y=Xβ+uy=Xβ+u es el verdadero modelo, demuestre que E(σ2ω)σ2uE(σ2ω)σ2u y explique la implicación de su resultado.

Puedo hacerlo en dos casos cuando r>kr>k (sobreajuste) o cuando r<kr<k (infraajuste).

¿Hay alguna forma corta de hacerlo, sin casos (porque tanto para el overfitting como para el underfitting la varianza está sesgada)? Entonces, lo que pregunto es si se pueden agrupar para que el resultado no dependa de la relación entre rr y kk ?

0 votos

Si se pregunta si la varianza de ww se espera que sea mayor que la varianza de uu ¿no deberías escribir E[σ2w]>E[σ2u]E[σ2w]>E[σ2u] ?

0 votos

No, porque a) es un modelo verdadero (que se asemeja a la población) y b) es un modelo mal especificado, la dirección de la mala especificación no se da. Por eso he tomado los casos. Pero como en ambos casos la varianza esperada será mayor que la verdadera (estimador sesgado). Por lo tanto, mi pregunta es si se pueden agrupar, es decir, si podemos demostrarlo sin tener en cuenta si r es mayor o menor que K. Si es así, ¿cómo podemos hacerlo?

0 votos

E. Sommer entendió lo que le pedía. Hicieron la edición apropiada de la notación para esa desigualdad.

1voto

Carl Puntos 2229

Si el modelo (a)y=Xβ+u(a)y=Xβ+u es verdadera, entonces ω=u+XβZγω=u+XβZγ en (b)(b) y la afirmación es la siguiente.

1voto

smt Puntos 896

De a) obtenemos yˆyx=Mxy=Mxuy^yx=Mxy=Mxu y de b) yˆyz=Mzy=MzXβ+Mzuy^yz=Mzy=MzXβ+Mzu , donde MxMx y MzMz son las matrices de los residuos (las de la respuesta aceptada de la pregunta que enlazaste) y ˆyx^yx y ˆyz^yz son los valores predichos de y basados en los modelos lineales de who.

La estimación de la varianza es s2x=(yˆyx)T(yˆyx)nks2x=(y^yx)T(y^yx)nk para el primer modelo y s2z=(yˆyz)T(yˆyz)nrs2z=(y^yz)T(y^yz)nr para el segundo.

Así, E(s2z)=E[(MzXβ+Mzu)T(MzXβ+Mzu)]nr=1nr(E[(MzXβ)T(MzXβ)]+E[(MzXβ)T(Mzu)]+E[(Mzu)T(MzXβ)]+E[(Mzu)T(Mzu)])=1nr(E[(MzXβ)T(MzXβ)]+2E[(MzXβ)T(Mzu)]+E[(Mzu)T(Mzu)])=1nr(E[||MzXβ||22]+2E[βTXTMzu]+E[(Mzu)T(Mzu)]),E(s2z)=E[(MzXβ+Mzu)T(MzXβ+Mzu)]nr=1nr(E[(MzXβ)T(MzXβ)]+E[(MzXβ)T(Mzu)]+E[(Mzu)T(MzXβ)]+E[(Mzu)T(Mzu)])=1nr(E[(MzXβ)T(MzXβ)]+2E[(MzXβ)T(Mzu)]+E[(Mzu)T(Mzu)])=1nr(E[||MzXβ||22]+2E[βTXTMzu]+E[(Mzu)T(Mzu)]),

como (MzXβ)T(Mzu)=(Mzu)T(MzXβ)=βTXTMTzMzu=βTXTMzuR.

Porque Z,X fijo ||MzXβ||22 y βTXTMz son constantes.

Así, E(s2z)=1nr(||MzXβ||22+2βTXTMzE(u)+E(uTMzu))= =||MzXβ||22nr+0+E(uTMzu)nr=||MzXβ||22nr+σ2σ2ingeneral.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X