Hace un par de meses me internó en esta organización; y, como va a desaparecer en el presente, decidí pasar mi última semana, con lo que sea fuera de tiempo que tenía, para investigar los factores que afectan a los salarios de los maestros. Uno de los problemas que me encontré con los sueldos de los maestros fue que la distribución por el estado fue sesgada. Yo tenía un montón de observaciones que se aferró a la parte baja de los salarios del espectro. Traté de resolver esto mediante la incorporación de un Salario Comparable Índice en mi variable dependiente (maestro de los salarios), pero los resultados que se encuentran estaban completamente fuera de fecha para el alcance de mi proyecto. Yo en cambio decidí a entrar a mi variable dependiente. Esto fue muy agradable porque ahora mi salario tenían una distribución normal y que sólo se veía perfecto en el histograma. Cuando empecé a probar, he llegado al punto donde me quedé con una última variable independiente, la propiedad las declaraciones de impuestos. El problema con mi normativo de los salarios fue también evidente en mi propiedad impuestos observaciones. Tuve una enorme asimetría de impuestos a la propiedad devolver números hacia el extremo inferior del espectro. Así que, me he registrado esta variable así y todavía se pasa la hipótesis nula de la prueba de bien.
No estoy seguro de si esto es correcto, pero comparando el cambio de una variable registra a otro registra variable me dio la elasticidad. Suponiendo que esto es correcto, a mi la ecuación de regresión (algo así como LogWages = B0 + B1(LogPropertyTaxReturns)) muestra la elasticidad entre las dos variables. Es esta significativa, aunque? Si mi objetivo era ver cuál es la variable más afectados los salarios de los maestros en cualquier condado de mi estado, a continuación se muestra la elasticidad entre las dos variables es útil? Queremos criar a los municipios con los más bajos salarios de los maestros hacia arriba para aumentar su nivel de vida, pero me temo que he extrapolado tan lejos de las observaciones que mi conclusión de la ecuación de regresión es sin sentido.
Edit: Uno de mis mayores temores es que debería haber usado un modelo no lineal para mostrar la relación. Siento que forzar tanto la dependiente y la variable independiente para cooperar en el este de regresión lineal es engañosa en algún aspecto.