(Mi pregunta de investigación se basa en la economía, pero para simplificar, estoy utilizando un ejemplo no económico)
Supongamos que intento averiguar si la temperatura corporal media de una población es igual a 37 grados centígrados. Tomo una muestra aleatoria de personas y les tomo la temperatura corporal.
El problema es que algunas personas se han tomado la temperatura corporal una vez, pero otras se la han tomado varias veces (dos, tres o incluso diez veces).
Normalmente, haría una regresión de la temperatura corporal sobre una constante, y haría pruebas de hipótesis con $H_0: \beta_0 = 37$ . Sin embargo, me preocupa la correlación serial.
¿Bastaría con agrupar los errores estándar por persona para corregir esta correlación serial? (por ejemplo, utilizando reg bodytemperature, cluster(person)
en Stata)
0 votos
En general, la agrupación no se ocupa de la correlación serial. Además, la forma en que usted sugiere agrupar implicaría N clusters con una observación cada uno, lo que generalmente no es una buena idea. Además, ¿por qué te preocupa la correlación serial en este caso? No veo cómo la correlación serial en su muestra se ve afectada por el hecho de que las personas en el pasado hayan medido su temperatura y usted no tiene un panel por lo que entiendo. Para preguntas sobre la agrupación, puedo recomendar encarecidamente el documento de Cameron y Miller "A Practitioner's Guide to Cluster-Robust Inference".
0 votos
Uy, perdón, no me he explicado bien. Lo que quería decir es que algunas personas se han tomado la temperatura varias veces, y esto queda registrado en su conjunto de datos. Por ejemplo, si me he tomado la temperatura cinco veces, entonces se registrará en el conjunto de datos como cinco observaciones, pero con mi nombre al lado.