3 votos

¿Medición de un estimador insesgado para la varianza con RMSE?

El error medio cuadrático (RMSE) es considerada por algunos como la mejor medida de la calidad de una estimación de la varianza . A menudo se ve citado como:

RMSE=1nni=1(^σiσi)2RMSE=1nni=1(^σiσi)2

Donde ˆσ^σ es la estimación de la volatilidad mientras que σσ es la volatilidad real.

Mi pregunta es: ¿qué es σσ en este caso? Supongamos que ˆσ^σ es la volatilidad realizada del día anterior (es decir, la RV=Nt=0rtRV=Nt=0rt donde rtrt es el rendimiento de 5 minutos), ¿la volatilidad real es sólo el rendimiento absoluto del día siguiente?

1voto

akalenuk Puntos 1738

El error medio cuadrático está relacionado con la eficiencia. No se limita a los estimadores insesgados, a menos que se añada esa restricción. Si no lo hicieras, descubrirías que el estimador de máxima verosimilitud o el estimador bayesiano tendrían, en el caso general, una pérdida cuadrática menor.

Por un momento, ignoremos σσ como medida de la volatilidad y generalizarla a θθ un parámetro de interés. Puede ser un centro de localización, una medida de escala, forma, sesgo, curtosis o cualquier otra cosa, incluyendo un fractil o un cuantil.

Si ˆθ^θ es un estimador, entonces la eficiencia de un estimador es E[(ˆθθ)2].E[(^θθ)2]. El RMSE es sólo una transformación.

En el caso de E[(ˆσtσt)2]E[(^σtσt)2] El ^σt^σt es la volatilidad realizada, que obviamente es observable. El σtσt es la volatilidad verdadera, pero no observable, de ese día. Es un parámetro y no se conoce.

He creado un código en R para generar mil muestras de tamaño diez de la distribución normal estándar para que puedas verlas gráficamente. Me olvidé de establecer la semilla, pero para este gráfico, el MSE para el Estimador de Máxima Verosimilitud (MLE) fue de .19677 mientras que el MSE para el estimador insesgado de Pearson y Neyman (PN) fue de .22797. El estimador insesgado era aproximadamente un 15,8% menos eficiente, pero era intrínsecamente más preciso. El compromiso es entre la precisión y la exactitud.

Gráficamente, la diferencia en los estimadores fue Density of Sample Estimates

Obsérvese que el RMSE se estima a veces en economía hallando el RMSE de lo real menos una predicción. Tenga en cuenta que es un estimador sesgado del RMSE de la población.

library(ggplot2)
library(export)
rm(list = ls())

x<-matrix(rnorm(10000),ncol = 1000,nrow = 10)

variance_ML<-function(A){
n<-length(as.vector(A))
  x_bar<-sum(A)/n
  variance<-sum((A-x_bar)**2)/n
  return(variance)
}

variance_PN<-function(A){
  n<-length(as.vector(A))
  x_bar<-sum(A)/n
  variance<-sum((A-x_bar)**2)/(n-1)
  return(variance)
}

MLE<-apply(x,2,variance_ML)

PN<-apply(x,2,variance_PN)

MSE_MLE<-sum((MLE-1)**2)/length(MLE)

MSE_PN<-sum((PN-1)**2)/length(PN)

graphical_frame<-data.frame(MLE,PN)

g<-ggplot(data = graphical_frame)+geom_density(aes(x=MLE),kernel="gaussian",color="red",show.legend = TRUE)+geom_density(aes(PN),kernel="gaussian",color="blue",show.legend = TRUE)
h<-g+labs(title = "Density Estimate of MLE(Red) and Pearson-Neyman Unbiased Estimator (Blue)",x="Estimator",y="Density")

graph2png(h,file="TBD")

0voto

Makoto Puntos 135

Yo también estoy estudiando esto.

Desde Ait-Sahalia, Mykland y Zhang (2005) , simplemente asumieron una σσ = 30% del precio de las acciones.

Desde Bandi y Russell (2008) En el caso de los precios de las acciones, calcularon la desviación estándar durante un periodo bastante más largo que el subintervalo de muestreo, por ejemplo, 1 día = 6,5 horas de negociación. A continuación, redujeron la desviación estándar a la unidad del subintervalo de muestreo, por ejemplo, 1 minuto, para σσ .

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X