Supongamos que para cada observación i=1,…,Ni=1,…,N tenemos MM ecuaciones: yi,j=xi,jβj+εi,jyi,j=xi,jβj+εi,j Donde i=1,…,Ni=1,…,N enumera los individuos y y j=1,…,Mj=1,…,M enumera las ecuaciones. aquí xx es de tamaño 1×kj1×kj y βjβj es de tamaño kj×1kj×1 y kjkj es el número de covariables para la regresión jj . Apilamiento sobre todo i=1,…Ni=1,…N obtenemos MM ecuaciones: yj=Xjβj+εjyj=Xjβj+εj donde ahora XjXj es de tamaño N×kjN×kj . Para simplificar, supongamos que XjXj no son estocásticos. A continuación, supongamos que para todo i=1,…,Ni=1,…,N y j=1,…,Mj=1,…,M : E(εi,j)=0,E(ε2i,j)=σjj Para la covarianza entre ecuaciones, dejemos para todo i=1,…,N y j,ℓ=1,…,M : E(εi,jεi,ℓ)=σj,ℓ mientras que para todos j,ℓ=1,…,M y i,i′=1,…,N con i≠i′ : E(εi,j,εi′,k)=0 Esto significa que los errores del mismo individuo pueden estar correlacionados entre las ecuaciones, mientras que los errores de los diferentes individuos no están correlacionados.
Esto se puede expresar de forma más compacta como cov(εj,εℓ)=σj,ℓIN Ahora, apilemos las distintas ecuaciones, una sobre otra: y=Zβ+ε, donde: y=[y1y2⋮yM],ε=[ε1⋮εM],Z=[X10…00X2…0,⋮⋮⋱⋮00…XM],β=[β1⋮βM] La matriz de varianza-covarianza de ε tiene la forma: E(εε′)=V=[σ11INσ12IN…σ1MINσ21INσ22IN…σ2NIN……⋱⋮σM1IN……σMMIN]=Σ⊗IN donde ⊗ es el producto de Kronecker y: Σ=[σ11σ12…σ1Mσ21σ22…σ2M⋮⋮⋱⋮σM1σM2…σMM] Σ da la matriz de covarianza de los errores para un individuo fijo.
Para el producto de Kronecker, tenemos las reglas: (A⊗B)−1=A−1⊗B−1 y (A⊗B)(C⊗D)=AC⊗BD y (A⊗B)′=A′⊗B′ .
Dejemos que ˆΣ sea la estimación de Σ a partir de una primera estimación OLS de yj en Xj y que ˆV=ˆΣ⊗IN . Entonces el estimador GLS factible viene dado por: ˆβ=(Z′ˆV−1Z)−1Z′ˆV−1y,=(Z′(ˆΣ⊗IN)−1Z)−1Z′(ˆΣ⊗IN)−1y,=(Z′(ˆΣ−1⊗IN)Z)−1Z′(ˆΣ−1⊗IN)y,=β+(Z′(ˆΣ−1⊗In)Z)−1Z′y
Ahora, supongamos que todos los Xi son idénticos, digamos X entonces Z=IM⊗X y podemos simplificar aún más: ˆβ=(Z′(ˆΣ−1⊗IN)Z)−1Z′(ˆΣ−1⊗IN)y,=((IM⊗X)′(ˆΣ−1⊗IN)(IM⊗X))−1(IM⊗X)′(ˆΣ−1⊗IN)y,=((IMˆΣ−1⊗X′IN)(IM⊗X))−1(IMˆΣ−1⊗X′IN)y,=(ˆΣ−1⊗X′X)−1(ˆΣ−1⊗X′)y,=(ˆΣ⊗(X′X)−1)(ˆΣ−1⊗X′)y,=(ˆΣˆΣ−1⊗(X′X)−1X′)y=(IM⊗(X′X)−1X′)y Observe que ˆΣ desapareció de esta ecuación. La última ecuación se puede escribir de la siguiente manera: ˆβ=[(X′X)−1X′y1(X′X)−1X′y2⋮(X′X)−1X′y1]=β+[(X′X)−1X′ε1,(X′X)−1X′ε2⋮(X′X)−1X′εM] Por tanto, las estimaciones GLS factibles son idénticas a las estimaciones OLS de una estimación ecuación por ecuación. Obsérvese que esto también significa que los residuos ˆεj serán idénticos a los residuos de una estimación OLS.
Ahora para estimar la matriz de covarianza de la varianza, tomamos el producto (ˆβ−β)(ˆβ−β)′ que da una matriz con entradas: (ˆβj−βj)(ˆβj−βj)′=[(X′X)−1X′εj][(X′X)−1X′εj]′,=(X′X)−1X′εjε′jX(X′X)−1 Entonces para la ecuación j tenemos el matiz de covarianza de la varianza: V(ˆβj)=E((ˆβj−βj)(ˆβj−βj))=σjj(X′X)−1,
Como σjj no se conoce, se suele estimar mediante ˆσjj=1N∑iˆε2i,j donde ˆεi,j son los residuos del estimador GLS factible. Sin embargo, en este caso, serán idénticos a los residuos de un estimador OLS (ya que los estimadores ˆβ son idénticos). Por ello, las estimaciones de las varianzas de ˆβ para el SUR serán idénticas a las estimaciones de la varianza de las estimaciones OLS (ecuación por ecuación).