Supongamos que tengo un modelo para la superficie de volatilidad implícita y quiero averiguar la frecuencia de recalibración necesaria basada en las comillas históricas. Dado que tengo una amplia gama de strikes y tenores durante un largo período de tiempo, necesito automatizar de alguna manera este proceso, es decir, necesito una métrica computable en lugar de "ahh parece bastante cerca del mercado".
¿Qué tipo de métrica estadística tendrá más sentido? Estoy pensando en la media de las diferencias porcentuales entre las comillas del mercado y del modelo, es decir, el valor medio de $$100\cdot\frac{\sigma^{market}-\sigma^{model}}{\sigma^{market}}$$ sobre toda la superficie de volatilidad, sin embargo, la media sobre toda la superficie puede ser bastante engañosa, ya que no captará los grandes valores atípicos en una superficie suficientemente grande y anulará las diferencias de magnitud similar pero de signo contrario. No obstante, no veo una métrica mejor para evaluar el ajuste de una superficie global.
¿Qué sentido tiene una diferencia porcentual media en toda la superficie para evaluar la calidad de un ajuste? ¿Existe una métrica mejor? Se agradecerá cualquier ayuda.
UPD: ¿Tiene más sentido elegir una suma de diferencias al cuadrado en todos los tenores y huelgas $$\sum_{K,T}(\sigma^{market}-\sigma^{model})^2$$ como métrica?