Lo que me molesta es que si tomamos un ejemplo de población e investigamos las distribuciones de la edad y los salarios, imaginemos que la distribución de los salarios (Y) en la población se parece a la distribución chi cuadrada con df=10 y la distribución de la edad (X) se parece a la distribución exponencial. Entonces, ¿cómo podemos tener una variable i.i.d. en el muestreo?
Respuesta
¿Demasiados anuncios?La hipótesis de "distribución idéntica e independiente" (o cualquier restricción de la misma) en una muestra, se refiere a la relación entre variables aleatorias en diferentes observaciones no entre las variables que forman la misma observación.
Así, en una muestra multidimensional "de tamaño $n$ "
$$\{(y_1, x_{11}, x_{21}),(y_2, x_{12}, x_{22}),...,(y_n, x_{1n}, x_{2n})\}$$
la hipótesis se aplica entre las variables de observación $i$ y todas las variables de cualquier otra observación. Así que $y_1$ se supone independiente de, por ejemplo $y_2$ pero también se supone que es independiente de $x_{12}$ . También $x_{11}$ se supone que es independiente de $x_{12}$ sino también de $x_{22}$ etc.
Ciertamente, $y_i$ se asume estocástico dependiente con $x_{1i}, x_{2i}$ , mientras que también $x_{1i}$ y $x_{2i}$ puede depender estocásticamente para el mismo $i$ es decir, dentro de cada observación.
0 votos
Las extracciones aleatorias con reemplazo de la misma población son iid.
0 votos
Entonces, ¿se supone que cuando hablamos de iid y decimos que (Y, X) son iid, queremos decir que todos los X son idénticos y todos los Y son idénticos, no que X e Y son idénticos?
1 votos
No hay punto de regresión de Y sobre X si X e Y son iid.
0 votos
Estas preguntas se adaptan mucho mejor a Validación cruzada . Echa un vistazo y encontrarás bastantes similares con buenas respuestas.
0 votos
Gracias por el consejo. Supuse que sería un lugar adecuado, ya que se trata de una asignatura de nuestro curso de econometría, que forma parte de los estudios de economía.