Tengo curiosidad: ¿cuáles son exactamente los problemas causados por el uso de un muestreo representativo en lugar de un muestreo aleatorio cuando se crea una submuestra de un gran conjunto de datos para un análisis no experimental? Además, ¿cuál es la eficacia del emparejamiento de la puntuación de propensión cuando se desea crear grupos de comparación equilibrados para los análisis no experimentales?
Respuestas
¿Demasiados anuncios?Para responder a tu primera pregunta: depende de la submuestra que quieras utilizar.
Una muestra representativa o estratificada se construye dividiendo la población de interés en subconjuntos no superpuestos, extrayendo una muestra aleatoria de cada subconjunto y, a continuación, calculando las ponderaciones para ajustar el hecho de que no todos los elementos de la muestra tenían la misma probabilidad de ser seleccionados de la población.
La ventaja de utilizar una muestra representativa o estratificada es que puede utilizar la información que tiene sobre la población para construir su muestra y así tener estimaciones más fiables de las estadísticas calculadas para la población de interés. La desventaja es que las ponderaciones que ha calculado son correctas para la muestra estratificada que ha construido, pero si quiere explorar las características que difieren entre los estratos, estas ponderaciones podrían ser perfectamente incorrectas. Sus estimaciones estarían sesgadas y probablemente no podría ajustar este sesgo.
En cuanto a la equiparación de la puntuación de propensión. Sólo se puede emparejar con lo que se puede ver. Todavía tendrá que lidiar con el problema del sesgo de las variables omitidas. Es posible que el emparejamiento de la puntuación de propensión aumente el sesgo en lugar de disminuirlo. Su eficacia depende de las suposiciones que se hagan y de si éstas se cumplen.
Que una muestra sea ``representativa'' de la población no tiene nada que ver con la distribución de algún atributo en su muestra, que es aleatoria. Lo que cuenta es que la probabilidad de que una unidad esté incluida en la muestra sea igual para toda la población. Supongamos que quieres estimar la proporción de mujeres en una población. Cuando se extrae una muestra aleatoria de personas de la población, la proporción de mujeres en la muestra es una estimación coherente de la proporción de mujeres en la población porque la muestra es aleatoria. No será la misma debido al error de muestreo. A medida que se extrae una muestra más grande, la estimación de la proporción de mujeres converge con el valor de la población.
Supongamos que ya se conoce la cuota de población de las mujeres y se quiere estimar algo más. Digamos que su población de interés está formada por 6 personas, 2 mujeres y 4 hombres. Se extrae una muestra de 3 personas sin reemplazo. En el caso del muestreo aleatorio, la probabilidad de muestreo de cada persona de la población es 1/2. Si extrae una muestra estratificada compuesta por 1 mujer y 2 hombres, la probabilidad de muestreo sigue siendo 1/2 para cada persona de la población, por lo que ambas formas de muestreo son representativas de la población.
¿Tiene algo que ganar estratificando su muestra? Si lo que quiere estimar es independiente del sexo, no ganará nada. Sin embargo, si quiere estimar algo que no es independiente del género, una muestra estratificada le dará una estimación más precisa al reducir el error de muestreo. El inconveniente es que si, por alguna razón, utiliza probabilidades de muestreo incorrectas y no las ajusta, obtendrá una estimación sesgada.
RE: Me acabo de dar cuenta de que esta respuesta es en gran parte un duplicado de la anterior. Lo siento por eso.
2 votos
¿Qué quiere decir con muestreo representativo? Creo que aquí hay dos cuestiones. Yo las separaría. Además, esto es probablemente más apropiado ( $\nsim$ offtopic) para stats.stackexchange.com
0 votos
Puedo separar las preguntas, pero son sinérgicas y por eso las hice juntas. La cuestión es que la equiparación de la propensión es una opción que se emplea a veces para eludir los problemas de muestreo.
0 votos
Por muestreo representativo, ¿se refiere a muestreo estratificado ?
0 votos
De acuerdo con @luchonacho: "muestreo representativo" no es un término muy útil. Tal y como comentan Kruskal y Mosteller jstor.org/stable/1402564?seq=1#page_scan_tab_contents su interpretación depende del redactor y puede significar nada más que "una aclamación general e injustificada de los datos".
0 votos
Muy bien. Bueno, para todos los que no se agarran a pajas heterodoxas, vamos a precisar esto. El muestreo representativo en este contexto significa cuando se construye una submuestra de una población estadística grande que replica adecuadamente esa población estadística más grande según alguna característica de interés. Por lo tanto, mi intención es que la palabra signifique lo que la inmensa mayoría de los economistas quieren que signifique.
0 votos
¿Y cuál es la diferencia con el muestreo aleatorio? Digamos que su característica de interés es el género. Una muestra aleatoria de la población generalmente replicará la distribución de género de la población original. Véase aquí . Creo que estás un poco confundido con la terminología (que parece haber tomado de Investopedia ). Existe la método de muestreo y está el calidad de la representatividad del método. Para lograr la representatividad, pueden ser apropiados diferentes métodos.
0 votos
El muestreo aleatorio es cuando se selecciona de una población al azar sin basarse en observables. Este método puede ser representativo por azar. Las muestras aleatorias suficientemente grandes deberían ser representativas con certeza. Se pueden combinar los dos métodos. Si no está lo suficientemente familiarizado para distinguir entre los dos, entonces no se preocupe por tratar de responder a la pregunta. Esta pregunta tiene sentido en su forma actual. No estoy confundido.