Una variable ficticia es una variable binaria, que no necesita ser registrada. Puede utilizarlas tal cual. Además, si la variable es 1 para un resultado determinado y cero en caso contrario, al tomar los registros convertirá su variable en 0 y en un valor perdido porque el registro de 0 no existe.
actualización: En lugar de un gráfico, por qué no calcular simplemente los coeficientes de correlación por pares. Aquí hay un ejemplo usando Stata
. sysuse auto, clear
(1978 Automobile Data)
. * Create a dummy variable
. gen byte big= weight>3020
. ta big
big | Freq. Percent Cum.
------------+-----------------------------------
0 | 35 47.30 47.30
1 | 39 52.70 100.00
------------+-----------------------------------
Total | 74 100.00
. * Correlate big with price
. pwcorr big price
| big price
-------------+------------------
big | 1.0000
price | 0.3469 1.0000
Both are positively correlated.
. * Add a other dummy and compute new correlations
pwcorr price foreign big
| price foreign big
-------------+---------------------------
price | 1.0000
foreign | 0.0487 1.0000
big | 0.3469 -0.5682 1.0000
1 votos
" los gráficos de dispersión se colapsan en la línea horizontal " No entiendo las dimensiones aquí. $(x,y)$ donde $x$ ¿es un tonto? ¿Puede atacar una imagen a su pregunta?
0 votos
Lo que trato de decir es que cuando tomo los gráficos de dispersión estoy viendo sólo algunas líneas. Esos son, ya sea en el cero (a la izquierda de y) de uno (derecha) de y) o en la parte inferior ((x) . Es difícil examinar cualquier relación entre la variable ficticia y las variables clave. Las otras dummies utilizadas están bien. ¿Podría haber alguna forma de resolver esto?
2 votos
¿Conoces el dicho "a veces una imagen vale más que mil palabras"? ¿Qué tal si insertas el gráfico de dispersión en tu pregunta? Es muy fácil de hacer.
0 votos
He actualizado el post con una imagen
1 votos
Pero... ¿esto es lo que se supone que debe parecer? Las variables ficticias sólo pueden tomar valores "0" y "1". Cualquier dispersión con un dummy dentro del cuadrado implicaría que el dummy de alguna manera tomó un valor diferente de 0 y 1.
0 votos
Las variables dummies muestran aquí si un evento tuvo lugar en un periodo de tiempo específico. 0 es ningún evento, 1 evento. La forma en que están en los cuadros de dispersión es difícil de entender lo que está pasando. Mira también la variable categórica f, cómo se representa extrañamente en las cajas. ¿Hay alguna forma de manipularlas, por ejemplo, tomando el logaritmo u otro?