Variación exógena
Como dice André, usted busca causalidad no sólo la correlación. Y la mejor manera de encontrar eso es la variación exógena - menciona los experimentos. A menos que se pueda forzar al azar a algunas personas a usar el SO - y prohibirlo a un grupo de control, hay poco que se pueda hacer con verdaderos experimentos.
Sin embargo, puede haber salvación. Usted está detrás de la " tratamiento de los tratados efecto "- los que están informados sobre el SO, y deciden utilizarlo. Esto es difícil de conseguir, porque este último paso se correlaciona con la capacidad. Algunas personas son simplemente mejores/más eficientes/inteligentes y, por tanto, pueden beneficiarse más/menos del SO.
Para eliminar esta auto-selección, se podría mirar en su lugar algo como el " efecto medio del tratamiento ". Informamos a una submuestra sobre el SO. Algunos lo utilizarán, otros no. ¿Cuál es el aumento medio de la productividad en esta muestra?
Estimación IV
Ahora bien, usted informará aleatoriamente a los individuos sobre el SO (algo que StackExchange, como empresa, podría hacer realmente), o usted/ellos podrían tener ya datos sobre "estar informados sobre el SO", llamemos a eso Informar a . Mientras Informar a no se correlaciona con las características relevantes (como la destreza), puede utilizarlo como sustituto. Desgraciadamente, se podría argumentar que sí lo hace: Tal vez los programadores más inteligentes/mejores sean también mejores en la creación de redes/uso de Google, y por lo tanto tienen más probabilidades de encontrar SO y convertirse en Informar a .
Por supuesto, si también se dispone de datos sobre la capacidad, se puede controlar este aspecto, por lo que se eliminaría este sesgo concreto.
Entonces, todo lo que tienes que hacer es retroceder alguna medida de productividad/éxito/avance de la carrera en Informar a y tal vez capacidad .