Considere los dos modelos (a)y=Xβ+u(a)y=Xβ+u donde XX es n×Kn×K y b) y=Zγ+ωy=Zγ+ω donde ZZ es n×rn×r . Bajo los supuestos clásicos (y ZZ y XX no son estocásticos) si el modelo (a), es decir y=Xβ+uy=Xβ+u es el verdadero modelo, demuestre que E(σ2ω)≥σ2uE(σ2ω)≥σ2u y explique la implicación de su resultado.
Puedo hacerlo en dos casos cuando r>kr>k (sobreajuste) o cuando r<kr<k (infraajuste).
¿Hay alguna forma corta de hacerlo, sin casos (porque tanto para el overfitting como para el underfitting la varianza está sesgada)? Entonces, lo que pregunto es si se pueden agrupar para que el resultado no dependa de la relación entre rr y kk ?
0 votos
Si se pregunta si la varianza de ww se espera que sea mayor que la varianza de uu ¿no deberías escribir E[σ2w]>E[σ2u]E[σ2w]>E[σ2u] ?
0 votos
No, porque a) es un modelo verdadero (que se asemeja a la población) y b) es un modelo mal especificado, la dirección de la mala especificación no se da. Por eso he tomado los casos. Pero como en ambos casos la varianza esperada será mayor que la verdadera (estimador sesgado). Por lo tanto, mi pregunta es si se pueden agrupar, es decir, si podemos demostrarlo sin tener en cuenta si r es mayor o menor que K. Si es así, ¿cómo podemos hacerlo?
0 votos
E. Sommer entendió lo que le pedía. Hicieron la edición apropiada de la notación para esa desigualdad.
0 votos
¿Qué quiere decir con que la "varianza está sesgada"? Si se estima σ2σ2 por s2s2 entonces la última variable aleatoria es insesgada para σ2σ2 .