Es probable que en su curso estuvieran hablando de algún caso concreto. Por lo general, se suele ver más de un desfase en los trabajos aplicados.
Por ejemplo, uno de los modelos estándar de series temporales es el modelo de Lag Autorregresivo Distribuido (ARDL). En este modelo suele ser necesario incluir varios rezagos. El modelo general ARDL(p,q) tiene el siguiente aspecto:
$$ y_t = \beta_0 + \sum_{i=1}^p \beta_i y_{t-i}+ \sum_{j=0}^q \gamma_jx_{t-j} +e_t$$
donde normalmente se quiere elegir el orden de los lag para eliminar la autocorrelación del modelo. Esto es sólo un ejemplo, en muchos modelos de series temporales querrá incluir múltiples rezagos, por ejemplo también en los modelos VAR, AR, ARIMA y muchos otros. Es imposible ofrecer una visión exhaustiva de estos modelos, pero puede consultar Verbeek (2008). A Guide to Modern Econometrics. 4ª edición, capítulos 8-9, para obtener una visión general.
Una forma de seleccionar el número óptimo o los rezagos es con criterios de información como el criterio de información bayesiano de Akaike o de Schwartz (de nuevo son sólo ejemplos, hay más de ellos - véase la fuente mencionada anteriormente).
En R hay múltiples formas de implementarlas. Un ejemplo es el paquete "tsDyn", que se utiliza principalmente para seleccionar el número óptimo de rezagos para VAR. Por ejemplo, usted podría ejecutar:
install.packages("tsDyn")
require("tsDyn")
data(barry)
test1 <- lags.select(barry, lag.max = 12)
test1
Best AIC: lag= 12
Best BIC: lag= 2
Best HQ : lag= 2
Por lo tanto, en los datos anteriores basados en Akaike (AIC) deberíamos incluir 12 rezagos en el modelo VAR ejecutado en estos datos, según Schwartz (BIC) y Hannan-Quinn (HQ) sólo 2 rezagos. Como puede ver, estos criterios no siempre coinciden, por lo que también hay que ejercer cierta discreción, pero está fuera del alcance de esta respuesta de SE explicar completamente en todos los casos cómo aplicarlos. Puedes volver a echar un vistazo al libro de texto que te recomendé.