1 votos

Qué define un proceso de generación de datos

Digamos que tenemos un cierto DGP $y=c+ax+bz+ error$ . Esto significa que, condicionado a los valores de $x$ y $z$ en un caso determinado (y sin información adicional )el valor esperado de $y$ se puede deducir introduciendo los valores en la ecuación anterior. Digamos ahora que $x$ y $z$ están correlacionados. Una DGP diferente puede ser ahora $y=d+mx+error$ donde m puede ser mayor (o menor) que $a$ debido a la correlación de $x$ y $z$ . Ahora no $y=d+mx+error$ también es una DGP válida dado que el valor esperado de $y$ con la condición de $x$ (y ninguna otra información) se da correctamente?

1voto

Parece que hay (al menos) dos formas de interpretar el concepto de "proceso generador de datos":

  1. El proceso de generación de datos es una descripción correcta del proceso causal que genera los valores de la variable dependiente $Y$ .
  2. El proceso de generación de datos especifica el valor esperado de la variable dependiente $Y$ dados los valores tomados las variables independientes.

Ahora bien, la respuesta a su pregunta parece depender de la interpretación que adoptemos:

  1. Si seguimos la interpretación 1, entonces no pueden ser ambos procesos generadores de datos: cualquiera de las dos variables $Z$ determina causalmente $Y$ o no lo hace.
  2. Si seguimos la interpretación 2, entonces ambos pueden ser procesos válidos de generación de datos. Como usted señala, no hay ninguna razón para suponer que $\mathbb{E}[Y|X = x]$ es lo mismo que $\mathbb{E}[Y|X = x, Z = z]$ .

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X