Por lo general, se debe utilizar un sistema ajustado $R^2$ casi siempre si se utiliza para decidir si se incluyen regresores adicionales.
La razón de ello es que, sin ajustar, el $R^2$ nunca disminuirá cuando se añadan más regresores al modelo (véase Verbeek A Guide to Modern Econometrics pp 22). Ajustado $R^2$ resuelve este problema ya que penaliza por el regresor adicional ya que ajustado $R^2$ viene dada por*:
$$\text{adj } R^2 = 1 - \frac{1/(N-K) \sum e_i^2}{1/(N-1) \sum (y_i-\bar{y}_i)^2}$$
donde, $N$ es el número de observaciones, $K$ es el número de regresores independientes, $e$ son errores y $y$ es la variable dependiente.
La inclusión de $K$ (no ajustado $R^2$ sólo tiene 1) le "castigará" por añadir frívolamente nuevos regresores porque ahora cada vez que añada un nuevo regresor el $R^2$ será menor. En consecuencia, esta es una buena salvaguarda contra el sobreajuste porque si se añade un nuevo regresor y se ve $R^2$ caer que te dice que el regresor que has añadido no mejora el ajuste lo suficiente como para añadirlo.
* Aunque hay que tener en cuenta que hay más de uno ajustado <span class="math-container">$R^2$</span> pero normalmente cuando la gente habla de ajustar <span class="math-container">$R^2$</span> se refieren a la de arriba que se utiliza bastante.
1 votos
No usaría ajustado $R^2$ para la selección de variables / selección de modelos, ya que no es óptima con respecto a ningún objetivo de modelización conocido. Véase "Justificación y optimización de $R^2_{adj.}$ como criterio de selección de modelos" . Además, $R^2_{adj.}$ no es necesariamente un estimador más preciso de la población $R^2$ que el normal, no ajustado $R^2$ es.