Estoy trabajando en una media-varianza problema de optimización, pero en lugar de títulos financieros que estoy eligiendo un 'portfolio' de N de los atletas. Es una 1-período problema de optimización más de un genérico de estadística de la que voy a llamar a performance
aquí. Estoy asumiendo athlete_performance
es un N longitud del vector aleatorio distribuido como multivariante-normal:
athlete_performance $\sim MVN(\mu \Sigma)$
Donde $\mu$ es el vector 1xN de los medios (o rendimiento esperado)
y donde $\Sigma$ es una matriz de NxN con la variación en la diagonal ( $\Sigma[i,i]$ = $Var(i)$ ) y la covarianza de la diagonal ( $\Sigma[i,j]$ = $Cov(i,j)$ ).
Mi pregunta es acerca de las opciones disponibles para la estimación de la covarianza (fuera de la diagonal) parte de la matriz.
Mi preocupación principal es la predictibilidad de mi matriz de covarianza. Si yo estuviera trabajando con valores que habían sido mencionados juntos por 10 años, luego de muestra "covarianza" puede ser predictivo de futuros covarianza, pero en el deporte no es tan simple.
Imagina que un mariscal de campo y un receptor abierto en el Fútbol Americano. Cómo bien su rendimiento se correlaciona depende de la calidad de la defensiva contra el pase que están jugando a la contra. O en las carreras de F1, si el conductor a y B son ambas fuerte en la recta pistas, pero sólo conductor B es fuerte en apretado acorralado pistas, sus actuaciones se correlacionan de manera muy diferente en función de si la pista es recta o en zig-zag-ing.
Soy consciente de la "muestra de covarianza", que en mi caso sería en el histórico superposición entre los dos atletas. También estoy consciente de "encogido covarianza". Me preguntaba si hay más métodos robustos para el cálculo de la covarianza que iba a ser más predictivo de futuros covarianza, posiblemente con algún tipo de regresión o MCMC.
Gracias por leer la pregunta y por tu tiempo!