Es más fácil hablar de lo que es un modelo paramétrico que uno no paramétrico. Los modelos paramétricos tienen una relación bien definida entre las variables independientes y la variable dependiente y, además, utilizan una distribución de probabilidad bien definida para el componente de azar o aleatorio de la relación.
En un modelo no paramétrico, algo de lo anterior no está bien definido.
Por ejemplo, en la ecuación de regresión $$Y=\beta_0+\beta_1X+\varepsilon,\varepsilon\sim\mathcal{N}(0,\sigma^2),$$ cada parámetro y cada variable se asignan a un número fijo. Además, $\varepsilon$ tiene una forma funcional bien definida.
Ahora imaginemos que no conocemos la forma funcional, sólo que creemos $Y$ es monótonamente creciente en $X$ . Una forma de comprobarlo es convertir las observaciones en rangos. Sin embargo, ya no tendríamos una relación bien definida entre las dos variables, aunque los rangos sigan una función de masa de probabilidad o de densidad que se comporte bien.
Además, podríamos tener una forma bien definida como $$Y=\beta_0+\beta_1X+\epsilon,$$ salvo que no tenemos ni idea de qué $\epsilon$ se extrae de.
Para complicar un poco el asunto, existe también una categoría denominada modelos semiparamétricos. En un modelo semiparamétrico, algunas partes están muy bien definidas y otras no.
En general, los modelos paramétricos tienen mayor poder estadístico si los supuestos del modelo son en realidad supuestos válidos. Los modelos no paramétricos suelen ser más robustos.
Aunque he hablado de variables independientes y dependientes, en realidad no es necesario. Puede haber una sola variable, por ejemplo. Podría tener la variable $X$ en la que no se conoce su distribución y se cree que es mala a pesar de todo.
Si quisieras saber si el centro de la localización es mayor que cinco, podrías usar la prueba del signo, dividiéndolos en la mediana para ver si la mediana es mayor que cinco.
Suele haber una expresión errónea con respecto a la no-parametría frecuencial que surge con frecuencia. Es que los datos determinan el modelo, o que los datos se utilizan más. Ninguna de las dos frases es cierta. Si la primera parte fuera cierta, entonces sería un modelo no paramétrico bayesiano. Si lo segundo fuera cierto, entonces las pruebas no paramétricas serían más potentes que las paramétricas.
Lo que ha sucedido es que los datos están sujetos a relaciones menos definidas que son, a grandes rasgos, como restricciones de relajación. Si se pasa de una relación lineal a una relación monotónicamente creciente (decreciente), entonces se hacen afirmaciones más débiles.
En general, con los modelos frecuentistas se obtiene menos información sobre el funcionamiento del mundo. También estás menos encorsetado en tus modelos. Esta afirmación no es necesariamente cierta en el caso de los modelos bayesianos debido a cómo funciona la selección de modelos bayesianos y a que la función de verosimilitud es mínimamente suficiente.
Los modelos sin distribución y sin parámetros aprovechan otras propiedades de un problema distintas de la relación directa entre las variables. Por ejemplo, en todas las circunstancias, existe una mediana para una distribución. Asimismo, incluso las variables empatadas pueden clasificarse, sólo que todas tienen el mismo rango.
1 votos
Ver "Conciliación de las definiciones alternativas de paramétrico y no paramétrico" y "Definiciones formales para modelos no paramétricos y paramétricos" entre otros hilos en Cross Validated. Vea también las definiciones de las etiquetas: paramétrico y no paramétrico .
0 votos
¿Es la volatilidad realizada un modelo?