En muchos artículos, antes de ejecutar una regresión, los autores realizan una prueba T o una prueba Chi-cuadrado para comprobar si existe una diferencia significativa entre las variables de dos submuestras. En mi caso, la variable de interés son las largas horas de trabajo, así que ¿debo hacer estas pruebas en las submuestras: personas que trabajan muchas horas y las que no lo hacen? No entiendo por qué necesito esto si luego hago una regresión. ¿Por qué la gente suele hacer pruebas?
Respuesta
¿Demasiados anuncios?Sí, debe comprobar si la diferencia es estadísticamente significativa si sigue el camino del submuestreo en lugar de utilizar variables de interacción. Es decir, debe comprobar la diferencia si le importa la calidad de su trabajo. Si no le importa la calidad del resultado (tal vez sea para un curso en el que sólo quiere aprobar), por supuesto que puede omitirlo, pero la calidad de la investigación y las conclusiones que pueda extraer se verán afectadas.
La razón por la que es importante comprobar si la diferencia es estadísticamente significativa es que cuando se divide la muestra en submuestras, por supuesto habrá algunas diferencias en la estimación $\hat{\beta}$ sólo se debe al azar.
Por ejemplo, si en la submuestra A se estima $\hat{\beta}_{iA}=4$ y en la submuestra B se estima $\hat{\beta}_{iB}=4.5$ no se puede afirmar automáticamente que en la submuestra B el efecto sea realmente mayor en 0,5. Es posible que la diferencia de 0,5 pueda atribuirse totalmente al azar.
Para ver si la diferencia es realmente significativa hay que utilizar algún test para comprobar $H_0: \hat{\beta}_{iA}- \hat{\beta}_{iB} = 0$ contra la alternativa de que la diferencia sea distinta de cero. La prueba adecuada dependerá de la especificidad de su investigación, $t$ -prueba y $\chi^2$ son comunes, pero no son las únicas pruebas que se pueden utilizar.