No se pueden comparar de forma significativa porque los errores específicos no tienen un significado. Por ejemplo, imagina dos conjuntos índice 1 a U y 1 a N, U<N, de lanzamientos de monedas. Si U=10 y los diez primeros lanzamientos de monedas son todos cara y N=1000000, y 500.000 son cara, hay errores diferentes, pero se deben sólo al azar. Las diferencias en los errores no proporcionan información sobre el proceso de generación de datos.
Sin embargo, está estipulando el proceso. El parámetro poblacional que busca es el error estándar. Excepto por los efectos de escala causados por el impacto del tiempo en el proceso de difusión, el error estándar será idéntico en ambos casos. La estimación muestral del error estándar será diferente, pero lo que le interesa es el parámetro poblacional.
Como el primer conjunto es un subconjunto del segundo, no hay información en el primero que no esté en el segundo, y el segundo contiene más información, por lo que no se debe realizar la primera estimación. Se estaría desechando información.
Su problema tiene que ver con la teoría del valor extremo. El proceso de difusión es importante porque la medición es sensible a la naturaleza de la ecuación general. No es posible dar una respuesta más detallada sin una mayor especificación de la naturaleza de la ecuación.
Puede utilizar las estadísticas de la muestra para probar o estimar los parámetros de la población; las estadísticas individuales de la muestra no tienen ningún significado comparativo, ya que son inherentemente erróneas según su especificación. Dado que su modelo está en los números reales, la probabilidad de que su modelo con estimaciones en lugar de valores verdaderos sea correcto es inherentemente un evento de medida cero. Como tal, a menos que conozca realmente los parámetros, el valor de una muestra frente a otra carece de interés.