Estoy aplicando el documento de Arthur " Diseñar agentes económicos que actúen como un agente humano: Un enfoque conductual de la racionalidad limitada " de 1991 en JAVA y tengo un problema de comprensión de una parte del documento:
En un punto dice: desencadenar acciones al azar en base a sus puntos fuertes y no sé qué significa esto.
El algoritmo se describe como sigue:
1.) Las acciones se representan como $a = (1,2,...,A)$ Estos valores representan la media y todas las acciones tienen una desviación estándar fija. La media de una acción y su desviación estándar ayudan a trazar la distribución normal. El resultado de una acción, que se desconoce antes, se extrae después de elegir la acción de la distribución normal descrita anteriormente.
2.) Cada acción tiene un determinado valor de fuerza ( $S(t)$ ) asociada a ella, la fuerza depende de las creencias previas (en mi caso depende del conjunto de habilidades previas). La suma actual de estas fuerzas es C(t).
3.)En todo momento $t$ Calculo el vector de probabilidad $p(t) = S(t)/C(t)$
4.) Elija una acción del conjunto según la probabilidad
5.) Actualizar la fuerza de esa acción (punto 3, página 354)
6.) Renormalizado (punto 4, página 354).
El problema se plantea en el punto 4: elegir una acción en función de la probabilidad, ¿qué probabilidad?
No sé cómo traducir esta afirmación en código.