1 votos

Encontrar un intercepto en datos basados en porcentajes y utilizar variables ficticias

¿Cómo puedo encontrar un intercepto en un dato porcentual? Mis datos tienen porcentajes de calificaciones ( he convertido a números donde $A^*=8, A=7,B=6...U=0$ ) por origen étnico y otros indicadores que quiero comprobar mediante variables ficticias. Por ejemplo, el 90,3% de los estudiantes chinos obtuvieron $A^*-C$ grado, los estudiantes de raza mixta obtuvieron el 87,3%, etc. ¿Cómo interpreto esto para obtener un intercepto? He elegido la mediana 32,5 ya que las notas son 5 $A^*$ a $C$ (entre $A^*(8\cdot5=40)$ y $C( 5\cdot5=25)$ . ¿Es razonable el uso de la mediana en este caso?

Mi ecuación va a ser

$y =b_0 +b_1 +b_2+b_3+b_4+b_5+b_6+u$

donde $y$ es el grado, $b_0$ es la mediana ( constante), $b_1$ es la comida escolar gratuita, $b_2$ es chino, $b_3$ es negro, $b_4$ es asiático, $b_5$ es masculino, $b_6$ es mujer, y $u$ es el término de error. El blanco es el valor por defecto.

Por lo tanto, si un alumno varón chino no recibe comidas escolares gratuitas (sustituto de la pobreza) es $b_0 + b_2 + b_5$ .

Mi pregunta es la misma que la anterior, ¿tiene sentido que utilice la mediana y, en segundo lugar, puesto que ya sé que los alumnos chinos obtienen mejores resultados que el resto del grupo, necesito utilizar la diferencia porcentual o utilizar las variables binarias ficticias?

Simplemente quiero averiguar el efecto de la pobreza y la raza en las calificaciones esperadas de los alumnos. No tengo acceso a las calificaciones individuales ni a los datos de panel para los ingresos, etc., de ahí que quiera utilizar la comida escolar gratuita.

Gracias de nuevo por sus respuestas.

Vea la imagen de abajo.
GCSE Result by Ethnicity

2voto

Rex Puntos 5812

Como ha señalado Jamzy, realice una regresión OLS de las calificaciones con respecto a cualquier variable que tenga.

$$\text{grades} = \beta_0 + \beta_1 x_1 + \cdots + \beta_i \ \text{race} + \cdots$$

$$\text{race} =\begin{array}{cc} \Bigg\{ & \begin{array}{cc} 0 & mixed \\ 1 & Chinese \\ \end{array} \end{array}$$

o viceversa con el 0 y el 1. $\beta_0$ será la intercepción que está buscando. Si resulta negativo, trata de tomar el logaritmo de ambos lados y ver si una regresión lineal todavía tiene un buen ajuste para usted allí.

2voto

Mythokia Puntos 129

Esto acaba siendo un poco lioso. Se debería ejecutar un GLM con enlace probit o logit . La razón es que la regresión está acotada, y no queremos que sus estimaciones ignoren los límites y sugieran calificaciones del 130% o del -20%. Tales estimaciones pueden y probablemente ocurrirán con OLS. Véase el post de Stata Journal sobre este tema. o aquí .

Normalmente, estas regresiones probit/logit se utilizan para datos binarios, consistentes en 0 y 1. Sin embargo, funcionarán bien aquí, donde la calificación es la probabilidad de acertar cualquier pregunta.

El intercepto tiene un análogo en estas estimaciones, todavía. Es un término constante que sufrirá una transformación dependiendo de su elección de probit o logit. Creo que hay otras funciones de enlace disponibles, pero no son particularmente comunes en la literatura económica.

Dada: $Y=\beta_0+x'\beta_{1..n}+\epsilon$ es su objetivo de investigación donde

$0<Y<1$ , $Y=grade,x=[gender,race,...]$

Suponiendo que $\epsilon$ está distribuido logísticamente, Logit: $\frac {1}{1+e^{-\beta_0}}$

Suponiendo que $\epsilon$ se distribuye normalmente, Probit: $\Phi(\beta_0)$

Por supuesto, es posible que su distribución no sea ninguna de estas, pero éstas se consideran estándar.

También se da el caso de que OLS es insesgado en la estimación de un intercepto para este tipo de datos, pero puede sugerir grados imposibles (por ejemplo, -0,2 o 1,3 como intercepto). La razón por la que esto es imposible es porque no se puede obtener un -0,2 o un -1,3 como nota percentil.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X