2 votos

¿Cómo se explica la correlación negativa entre la cantidad vendida y el gasto en publicidad?

He recibido el siguiente conjunto de datos de nuestro profesor de economía. Tiene 15 observaciones y 4 variables - 'qsold' (cantidad vendida del producto X), psn (precio de X), pcb (precio de un producto sustitutivo Y), adv (gasto en publicidad de X). Se supone que debo derivar una función de demanda ( qsold = B0 + B1 (psn) + B2 (pcb) + B3 (adv) ). Ahora, teóricamente, se supone que las tres variables independientes tienen una relación con qsold, sin embargo, se supone que debo explorar sólo la relación lineal, así que, traté de ajustar el siguiente modelo.

df1
qsold   psn pcb adv
1183    1361.97 1405.78 3.22
974 1520.49 1369.17 3.39
1179    1361.43 1448.71 4.03
1258    1159.67 1465.12 3.91
1161    1297.74 1383.93 3.46
1052    1362.44 1450    3.64
992 1447.25 1404.4  3.55
1213    1316.93 1418.03 3.81
1133    1365.97 1391.95 4.21
1001    1283.92 1403.11 4.22
1221    1329.34 1428.9  3.38
1137    1278.41 1426.81 3.89
1112    1466.21 1442.68 3.65
1025    1355.73 1359.79 4.25
1277    1377.06 1455.03 3.35

lm(formula = qsold ~ psn + pcb + adv, data = df1)

Residuals:
    Min      1Q  Median      3Q     Max 
-118.47  -31.59   12.42   39.46   92.43 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)  
(Intercept)  635.4451  1240.7873   0.512   0.6187  
psn           -0.5897     0.2647  -2.228   0.0477 *
pcb            1.1835     0.6650   1.780   0.1027  
adv         -103.7231    62.7722  -1.652   0.1267  
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 72.57 on 11 degrees of freedom
Multiple R-squared:  0.5764,    Adjusted R-squared:  0.4609 
F-statistic:  4.99 on 3 and 11 DF,  p-value: 0.02004
  1. En la salida anterior, sólo psn es significativo (basado en las estadísticas t). Nuestro profesor nos dijo que debíamos considerar sólo los coeficientes significativos en la función de demanda . Me resulta difícil estar de acuerdo. En este caso, si considero sólo psn en mi función de demanda, quizás esté violando la hipótesis nula, que se basa en las estadísticas F (que todos los coeficientes son 0). Además, si considero sólo psn Esencialmente, estoy negando el efecto combinado de las tres variables y, básicamente, eligiendo un modelo diferente al que ajusté.

  2. adv tiene un coeficiente negativo, lo que va en contra de mi comprensión teórica. Como he leído que tiene una correlación positiva con la cantidad demandada. ¿Cómo puedo explicar esta relación?

Si es posible, por favor, cite la literatura, a la que puedo referirme. Además, tenga en cuenta que la recopilación de datos para otras variables, el aumento del tamaño de la muestra o el ajuste de modelos no lineales no es una posibilidad.

2voto

Matthias Benkard Puntos 11264

En el resultado anterior, sólo psn es significativo (basado en las estadísticas t). Nuestro profesor nos dijo que deberíamos considerar sólo los coeficientes significativos en la función de demanda. Me resulta difícil estar de acuerdo. En este caso, si considero sólo psn en mi función de demanda, tal vez esté violando la hipótesis nula, que se basa en las estadísticas F (que todos los coeficientes son 0). Además, si considero sólo psn estoy esencialmente negando el efecto combinado de las tres variables, y básicamente eligiendo un modelo diferente al que ajusté.

Es importante tener en cuenta la significación porque no se puede observar directamente el proceso de generación de datos. La regresión no le dice lo que $\beta_0, \beta_1 ... $ son, te dice lo que parecen ser en base a la línea de ajuste que minimiza la suma de los residuos al cuadrado a través de los datos. Sí en las expectativas (siempre que se cumplan todos los supuestos de OLS) $E[\hat{\beta}] = \beta$ pero este resultado sólo se mantiene en el límite cuando el número de observaciones llega a infinito (véase la discusión en Verbeek. A Guide to Modern Econometrics o cualquier libro de texto de econometría para más detalles).

En este caso concreto, el $F$ -(con 3 y 11 grados de libertad) es de 4,99, lo que es suficiente para rechazar la nulidad de insignificancia conjunta, es decir $H_0: \beta_0 = \beta_1 = ... \beta_k = 0$ por lo que no es un problema.

Sin embargo, no se puede rechazar la hipótesis nula de que $\beta_3$ (efecto de la publicidad) es cero. En consecuencia, sólo tomando los resultados de la regresión que presenta al pie de la letra (lo cual no es necesario siempre en la investigación real, pero podría serlo en el aula), la respuesta correcta sería "la publicidad no tiene un efecto significativo sobre la cantidad vendida, no podemos rechazar la hipótesis de que el verdadero efecto de la publicidad es 0".

adv tiene un coeficiente negativo, lo que va en contra de mi entendimiento teórico. He leído que tiene una correlación positiva con la cantidad demandada. ¿Cómo puedo explicar esta relación?

Esto podría deberse a que tiene alguna causalidad inversa. Las ecuaciones de demanda son sistemas endógenos y deben modelarse con ecuaciones simultáneas, no con una simple regresión (véase esta explicación para saber cómo hacerlo en R). El uso de la regresión multivariante simple en estos casos probablemente dará lugar a coeficientes sesgados.

Es posible que cuando la demanda es baja las empresas aumenten el gasto en publicidad, mientras que cuando la demanda es alta y las empresas venden rápidamente sus existencias es posible que no quieran gastar dinero extra en publicidad. Esto crea un problema de causalidad inversa que sesga la $\beta_3$ estimaciones que ya no dan el efecto exacto de adv en $y$ (cantidad vendida). Es posible que el gasto en publicidad aumente las ventas, pero las mayores ventas están simplemente asociadas a un menor gasto y al segundo efecto de las ventas $\rightarrow$ adv simplemente domina.

Dicho esto, mencionas que se trata de un ejercicio impuesto por tu profesor y no de una verdadera investigación. Es posible que tu profesor sólo quiera comprobar si puedes interpretar correctamente las estimaciones de los coeficientes y no si entiendes conceptos como la causalidad inversa (si no has tratado esto en tu clase, probablemente tu profesor no esté interesado en discutirlo). Deberías preguntarle a tu profesor cuáles son sus expectativas respecto a la respuesta.

0voto

john Puntos 121

Hay una gran diferencia entre los niveles de precios y el adv. intente utilizar una transformación logarítmica o ln.

Y creo que podrías eliminar cualquier variable que no sea significativa, o tu modelo no sería significativo.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X