(Antes de aplicar las pruebas de correlación en serie a los residuos, es conveniente inspeccionar visualmente los residuos para comprobar su blancura, observando la muestra ACF y PACF. Las estadísticas de las pruebas de correlación serial suelen ser algún tipo de transformaciones de la ACF de la muestra).
...en el modelo AR(p)... El término de error debe ser i.i.d...
Esta afirmación no es correcta. La condición i.i.d. no es necesaria para los modelos ARIMA, y además es más estricta que la hipótesis nula de una prueba de correlación serial de gran muestra. En una muestra grande, normalmente no se espera poder distinguir entre procesos de ruido blanco i.i.d. y covarianza estacionaria.
El libro de texto dice que la prueba LM de Breusch-Godfrey está diseñada para probar autoregresión en el modelo del término de error como $Y_t = \beta_1 + \beta_2 X_t + u_t...$ ...Me pregunto si podemos usar la prueba LM de BG para probar la correlación correlación serial del término de error en el modelo AR(p).
Sí. La distribución asintótica bajo la hipótesis nula de Breusch-Godfrey se obtiene bajo la condición $E[u_t X_t] = 0$ . Bajo esta condición y la estacionariedad, los residuos $\hat{u}_t$ aproximado $u_t$ en una muestra grande y el estadístico F de la regresión auxiliar tiene el habitual $\chi^2$ -distribución.
Con la variable dependiente retardada, por ejemplo $X_t = Y_{t-1}$ y el modelo es AR(1) $$ Y_t = \beta_1 + \beta_2 Y_{t-1} + u_t, $$ bajo la nulidad de que $u_t$ no tiene correlación serial, entonces $E[u_t Y_{t-1}] = 0$ . El punto aquí es que el modelo de serie temporal está correctamente especificado bajo el nulo.