Para demostrar la imparcialidad de $\hat{\sigma}^2$ condicionado a $X$, es decir, $\mathbb{E}(\hat{\sigma}^2|X)=\sigma^2$, considera $\hat{u}= y- X \hat{\beta}=y-X(X'X)^{-1} X'y = [I_n -X(X'X)^{-1} X'X]y = My$, y utilizando $y=X\beta +u$, escribimos $\hat{u}=Mu$, dado que $MX=0$.
Simplemente una observación sobre la matriz $M$: $M$ es una matriz que es simétrica ($M=M'$) e idempotente ($M=M^2$). La matriz $M$, llamada productora de residuos, puede interpretarse como una matriz que produce el vector (columna) de residuos de mínimos cuadrados en la regresión de $y$ sobre $X$ cuando pre-multiplica cualquier vector $y$.
Entonces, \begin{equation*} \hat{u}' \hat{u} = u'M' M u = u' M u \end{equation*} Por lo tanto, $u' M u$ es un escalar y es igual a su traza que denotamos como $tr(u' M u)$.
Luego, recordemos que tr(ABC)=tr(BCA), y bajo la suposición de homocedasticidad $\mathbb{E}(uu'|X)=\sigma^2$, \begin{align*} \mathbb{E}(u'M u |X) = & \mathbb{E}(tr(u'Mu|X)) = \mathbb{E}[tr(Muu')|X] \\ = & tr[M \mathbb{E}(u u'|X)] = tr(M \sigma^2 I_n) \\ = & \sigma^2 tr(M)= \sigma^2 (n-k-1) \end{align*} La última igualdad proviene del hecho de que $tr(M)=tr(I_n)-tr[X(X'X)^{-1} X'] = n - tr[(X'X)^{-1}X'X]$, y esto resulta en $n-tr(I_{k+1})=n-k-1$. Finalmente, \begin{equation} \mathbb{E}(\hat{\sigma}^2|X)= \mathbb{E}(u'Mu|X)/(n-k-1)=\sigma^2 \end{equation}
Para encontrar referencias donde las propiedades de la traza en álgebra lineal se discuten de manera simple, consulta el apéndice de "Introductory Econometrics: A Modern Approach" de Wooldridge (última edición)