0 votos

¿Existe alguna restricción para el numerador del cálculo de la varianza para la población?

Al leer cosas relacionadas con el grado de libertad, me enfrento a este documento .

En este documento, hay una parte:

La desviación estándar en una población es: enter image description here

Entiendo que cuando estimamos la desviación estándar, en la muestra, debemos restringir la suma de las desviaciones a 0, pero por qué no ocurre en la población, ¿es por la aleatoriedad de los datos?

7voto

Alex Antiu Puntos 1

La "restricción de desviación" no es realmente una restricción. Es sólo un resultado natural que proviene de la definición de $\bar{x}$ : $$\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)=\sum_{i=1}^{n}x_{i}-n\bar{x}\equiv0.$$ No es algo que planteemos intencionadamente en la varianza muestral, es un subproducto o efecto secundario que surge cuando sustituimos la media muestral $\mu$ por su estimación $\bar{x}$ . Si utilizamos otra estimación que $\bar{x}$ esta "restricción" también cambiará en consecuencia. Consideremos una situación diferente, en la que conocemos el verdadero valor de media de la población entonces la varianza puede estimarse simplemente mediante $n^{-1}\sum_{i=1}^{n}\left(x_{i}-\mu\right)^{2}$ , sin ningún tipo de restricción.

4voto

Ben Puntos 129

Puede ser útil distinguir aquí tres estadísticas diferentes. La desviación estándar de la población $\sigma$ está dada por:

$$\sigma=\sqrt\frac{\sum_{i=1}^n(x_i-\mu)^2}{n}\qquad(1)$$ Para calcularlo necesitamos conocer los valores de $x_i$ para toda la población. La página web desviación estándar de una muestra puede calcularse utilizando exactamente la misma fórmula, aunque con el $x_i$ siendo los datos de la muestra, $\mu$ la media de la muestra y $n$ el tamaño de la muestra. En este caso no es necesaria ninguna "restricción". Por lo tanto, al comparar el cálculo de las desviaciones típicas de la población y de la muestra, no se plantea la cuestión de por qué no hay "restricción" en la fórmula de la población.

Cuando el denominador debe ser $n-1$ en lugar de $n$ se encuentra en la situación común en la que utilizamos los datos de la muestra, no para encontrar la desviación estándar de la muestra, sino para estimar la desviación estándar de la población. Así, la fórmula se convierte en (suponiendo que la media de la población no se conoce, por lo que también debe estimarse a partir de los datos de la muestra):

$$s=\sqrt\frac{\sum_{i=1}^n(x_i-\bar{x})^2}{n-1}\qquad(2)$$

Lo que posiblemente puede causar confusión aquí es que a veces se hace referencia a esta fórmula como dar el desviación estándar de la muestra Una frase que -al menos para mí- sugiere la desviación estándar de la muestra, no una estimación de la desviación estándar de la población.

Por lo tanto, la fórmula (1) no es el equivalente poblacional de (2), y no hay razón para que (1) tenga $n-1$ en el denominador sólo porque (2) lo tiene.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X