Cuento corto:
Tengo 2 conjuntos de datos:
- Set 1: Vector con los datos diarios de rendimientos del mercado accionario (por ejemplo,. [1%, 1.2%, -2%])
- Conjunto 2: Que el vector de rendimientos del mercado accionario, se multiplica por otro vector (por ejemplo,. [2%, 0.6%, -1%] lo que equivale a [1% * 2, 1.2% * 0.5, -2% * 0.5])
Quiero poner a prueba la hipótesis de que el conjunto de datos 1 tiene una media que es igual a la media del conjunto de datos 2 cuando ajuste de la varianza.
Puede que el dependiente muestras de prueba de la t de ser utilizado para esto? Si no, ¿cómo puedo hacerlo?
Largo De La Historia:
Quiero probar la rentabilidad de la importancia de una estrategia que tiene una variable de la cartera de peso. Que el peso depende de la volatilidad de los últimos X días de datos, y se haga el ajuste de modo que la volatilidad esperada es igual a un objetivo determinado.
En el conjunto de datos 1, tengo 20K+ días de datos donde el promedio diario de retorno es de ~0,025% con una desviación estándar de ~0,63%.
En el conjunto de datos 2, cuando me ajustar la desviación estándar, el retorno es de ~0,0024%. Intuitivamente, parece que con 20K de puntos de datos, la diferencia en el modo en el que iba a ser bastante significativo, ya que los dos conjuntos de datos siempre van a estar muy correlacionadas (.8+ en este caso). Pero el p-valor es de .50, al azar.
Me gustaría pensar que esta prueba de la t no es apropiado debido a que el conjunto de datos 1 tiene una influencia directa sobre los resultados del conjunto de datos 2, en una forma que no ocurre en los otros casos en que esta prueba se aplica. Yo estaba pensando en hacer una simulación de Monte Carlo, donde me multiplicar conjunto de datos 1, por un vector con números al azar, donde los números tienen las mismas propiedades estadísticas como los números que he utilizado en el conjunto de datos 2.
Gracias.