No soy una persona de datos. Así que sólo puedo aportar ideas sobre los incentivos teóricos que hay detrás del fenómeno. Además, creo que existen múltiples formas de este tipo de spam en la web y cada una de ellas se basa en distintos incentivos. Por lo tanto, no hay una única respuesta verdadera. Permítanme primero expresar mi opinión sobre el spam clásico (de correo electrónico) y relacionarlo con lo que ustedes tienen en mente. Lo haré en esta respuesta utilizando un modelo de bebé que cualquier estudiante de grado podría idear. Luego, señalaré los incentivos de desviación de búsqueda de un intermediario en una segunda respuesta basada en el modelo de Hagiu y Jullien (RAND 2011). Ustedes (y la comunidad) pueden entonces elegir lo que más les convenga.
Spam clásico
Supongo que los incentivos clásicos detrás del spam (del correo electrónico) surgen porque el coste marginal $c$ es muy pequeño, mientras que los beneficios $b$ son comparativamente grandes, $c \approx 0, b>c$ . Aunque son muy pocas las personas que hacen clic en el enlace de spam, puede resultar rentable enviar una cantidad ridícula de correos electrónicos, porque algunos sí hacen clic y, por tanto, acaban en la página de inicio. El spammer maximiza $(b-c)q$ que es estrictamente creciente en $q$ la cantidad de correos electrónicos enviados. Por lo tanto, elige la máxima cantidad posible $q$ Es decir, enviar el spam a cualquier dirección disponible.
El beneficio $b$ aquí es que cada visitante de la página web puede comprar un bien o generar ingresos por publicidad. En el primer caso, $b=p_1 p_2 V$ con $p_1>0$ es la probabilidad de que el lector medio de correo electrónico haga clic en el enlace y $p_2$ la probabilidad de comprar un bien (posiblemente fraudulento) al spammer (o de transferir dinero al príncipe nigeriano) y $V>>0$ siendo un gran beneficio de esta transacción. Ya que $c \approx 0$ El spam paga incluso para las probabilidades extremadamente bajas $p=p_1p_2$ .
Por otro lado, el spammer es sólo un intermediario que conduce a los posibles clientes a la página web de un vendedor. Este intermediario recibe un pago por visita o por transacción. Ambas opciones conducen al mismo modelo que el anterior. El vendedor estaría dispuesto a pagar al spammer una cantidad fija $x$ por visitante con $x \in [0,p_2V]$ de manera que el spammer y el vendedor puedan acordar algún beneficio del spam $b \in (c,pV]$ y se aplica el modelo anterior. Si el vendedor paga una parte $s$ de $pV$ por transacción, también podemos llegar al mismo modelo con $b=spV>c$ .
O bien, el enlace sólo lleva a una página de inicio llena de anuncios. Entonces, el emisor de spam recibe un pago por cada clic en el anuncio o por cada segundo que se vea el anuncio. Ambas cosas son isomorfas al modelo anterior con intermediarios adicionales. Otra alternativa es que el enlace descargue malware, lo que da lugar al mismo modelo con $V$ siendo el valor de la infiltración exitosa del malware y $p$ siendo la probabilidad de una descarga exitosa sin ser detectada.
En lugar de $q$ siendo una cantidad de correos electrónicos enviados podría ser una palabra clave adicional para los motores de búsqueda. Ya que añadir una palabra clave más es casi sin costo y atrae un número adicional de visitantes esperados $r>0$ llegamos a un modelo similar con $(rb-c)q$ .
Este modelo de bebé se abstrae de muchas cosas, pero creo que los incentivos cruciales se basan en un coste marginal muy bajo y en la ley de los grandes números. Por supuesto, el spam molesta a la gente y participar en él conlleva una pérdida de reputación. Por esa razón, no se ve que las empresas establecidas lo hagan.