Estoy tratando de predecir las tasas de impago de las empresas utilizando datos macroeconómicos. Tengo algunas variables explicativas (todas las variables se explican en la figura 2), que van desde el año 2000 hasta el 2017. Sobre este conjunto de datos he calculado mi regresión lineal. Además, nos dieron tres escenarios sobre los que teníamos que hacer una previsión. Se nos pidió que elaboráramos un modelo:
- que maximiza el r-cuadrado ajustado
- que es económicamente intuitivo
Después de algunas iteraciones he podido llegar a un modelo que tiene un r-cuadrado ajustado de 0,935. Al tener un r-cuadrado ajustado tan alto, me temo que he caído en la trampa de la multicolinealidad, ya que una variable sería el valor absoluto del PIB y la otra sería la tasa de variación interanual del PIB. Así que mi primera pregunta sería: ¿Se trata de un caso de multicolinealidad o no? Y en caso afirmativo, ¿qué variable sería la mejor para la regresión? ¿El PIB absoluto o la variación anual del PIB?
A continuación, al pronosticar el impago de las empresas utilizando la regresión lineal recién calculada, obtengo tasas de impago negativas. Obviamente, esto no es económicamente intuitivo y viola el segundo requisito. Como puede verse en el gráfico siguiente, las tasas de impago sólo son positivas para el caso pesimista. Así que mi segunda pregunta sería: ¿Es posible forzar la variable de respuesta (tasas de impago de las empresas) para que sea positiva?