tl;dr - Esta afirmación es falsa. Si bien es cierto que un inversor que compró al principio de cada uno de los 10 días más importantes, y luego vendió al final de los mismos, podría disfrutar de ganancias del 64% sobre un inversor similar que no participó en esos 10 días, no se deduce que estos 10 días más importantes " representan el 63% de los rendimientos de los últimos 50 años " .
La reclamación es incorrecta debido a un marco roto.
Imagine que alguien le dice que la mejor estrategia para su futuro financiero es utilizar una determinada estrategia para jugar al póquer en un casino de Las Vegas. Puede que tengan razón en que su estrategia es óptima, en un marco que supone que vas a apostar tu futuro financiero en un casino. Pero, ¿es entonces cierto que la estrategia óptima para tu futuro financiero pasa por jugar al póker en un casino de Las Vegas?
No es que la afirmación sobre cómo jugar al póquer sea necesariamente errónea, sino que el marco que la rodea lo es. De la misma manera, el título de esta pregunta se pregunta:
¿Es cierto que "sólo diez días de comilla representan el 63% de los rendimientos de los últimos 50 años"?
Que " 63 por ciento " La cifra puede provenir de operaciones matemáticas correctamente realizadas, pero el marco sugiere que alguien que se perdiera esos 10 días sólo podría esperar disfrutar del 37% restante de rendimientos en los últimos 50 años.
El problema es que, por lo general, es inapropiado afirmar que los miembros de un conjunto constituyen una parte del total de ese conjunto cuando éste no se limita a sumar valores positivos. (Más sobre las matemáticas al final de esta respuesta).
Por ejemplo, pasando por Las cifras de Wikipedia En el caso de los días de la semana, parece que un inversor que se salte los 5 peores días habría aplicado una ganancia de ~79,4% a su patrimonio. Pero, ¿tiene sentido atribuir el ~79,4% de la riqueza a saltarse los 5 peores días mientras se atribuye también el 63% de la riqueza a estar presente en los 10 mejores días?
Analogía: ¿Un empleado hace el 90% del trabajo de una pequeña empresa?
Pensemos en una pequeña empresa con 25 empleados. Hacen pequeños trabajos por encargo.
Uno de los empleados, Bob, desempeña un papel menor como especialista en el 90% de los proyectos; el 10% restante no tiene que ver con su área de experiencia. Bob escribe entonces en su currículum:
Mis esfuerzos representaron el 90% de la productividad de la empresa durante mi mandato.
Lo que hace pensar que él hizo el 90% del trabajo y los demás el 10%, ¿no? ¡Claramente es un empleado de primera categoría!
Y no miente, en el sentido de inventarse los números. Esa cifra es exacta, para el marco en el que fue calculada.
El problema es que el marco está roto. Es decir, no tiene sentido que Bob describa su participación en el 90% de los proyectos como si hubiera representado el 90% del trabajo de la empresa. No es que haya hecho mal las cuentas, es que la lógica del modelo en sí es un poco tonta.
Afirmación corregida: Invertir en los 10 mejores días daría una rentabilidad del ~64%.
Parece que, si un inversor invirtiera al principio de un día y luego se retirara al final para cada uno de los 10 días principales, habría aplicado un factor de ~164%, para una ganancia de ~64%.
Sin comprobar los cálculos ni las cifras, eso me parece plausible. Pero, suponiendo que sea cierto, se convierte en falso si tergiversamos esa afirmación mediante una redacción que haga parecer que se trata de una cosa en la que tiene sentido atribuir el 64% de las ganancias a 10 días concretos, de manera que cualquiera que se haya saltado esos 10 días concretos sólo puede esperar disfrutar del 36% de las ganancias, o algo así.
No es que alguien haya hecho mal las cuentas o se haya equivocado al calcular la cifra, sino que el marco del modelo en el que existe la cifra está roto. La solución correcta es salir de ese marco.
Discusión: Explicación matemática.
Cuando decimos que algo contribuye x % a un total, normalmente estamos trabajando dentro de un marco en el que estamos sumando un montón de valores positivos para llegar a un total.
Podemos hacer que estas inversiones sean aditivas. En concreto, podemos tomar el logaritmo natural de la relación de cada día para obtener un parámetro aditivo. Luego, podemos sumar esos parámetros aditivos, elevar el número de Euler a la potencia de su suma, y eso es el factor total.
Para coger la tabla de Respuesta de @MoneyAnn y luego aumentarlo:
Date +% factor ln(factor)
-----------------------------------------------------
1987-10-21 0.0910 1.0910 0.0870947068509337
1987-10-20 0.0533 1.0533 0.0519280928603591
1970-05-27 0.0502 1.0502 0.0489806222216219
1987-10-29 0.0493 1.0493 0.0481232751817282
1982-08-17 0.0476 1.0476 0.0465018336514199
1962-05-29 0.0465 1.0465 0.0454512629039174
1974-10-09 0.0460 1.0460 0.0449733656427312
1957-10-23 0.0449 1.0449 0.0439211870579281
1974-10-07 0.0419 1.0419 0.0410459694360010
1974-07-12 0.0408 1.0408 0.0399896482161584
------------------
Total: 0.498009964
Entonces exp(0.498009964)
es 1.645443519
que recupera que ~ 1.64
-factor, o ~64%, al que se referían otras respuestas.
Sin embargo, el marco roto que se presenta en la reclamación tiene dos problemas importantes:
-
Los factores no se suman en todos los días.
Si alguien quería hacer una afirmación como esta, entonces debería haber ln(factor)
'd todo de los días, y luego dividió la suma de esos parámetros para los 10 primeros días por la suma de esos parámetros para todos los días.
-
Los factores contienen negativos.
Algunos días terminaron más bajos de lo que empezaron. Por ejemplo, aparentemente 1987-10-19 tuvo un golpe de -20,47%, para un ln(factor) ~= ln(1-0.247) ~= -0.231553819
. En general, para cualquier factor
de menos de 1
, ln(factor)
debe ser negativo.
Podríamos intentar arreglar los números para dar cuenta del problema nº 1, pero el marco no se presta a resolver el problema nº 2.
1 votos
Por favor, lea Intención y finalidad de los comentarios . Si usted tiene una solicitud para el OP para aclarar la pregunta o pedir más detalles, ese es el propósito. 5 respuestas largas se han publicado ahora, y se refieren a esto bastante bien.
1 votos
He visto muchas reclamaciones de este tipo. Sospecho que la mayoría de ellos han hecho la aritmética correctamente. Para lo que se está utilizando aquí es para afirmar que la distribución normal es un mal modelo de la realidad lejos de la media, porque los sucesos con muchas desviaciones típicas fuera son mucho más comunes de lo que afirmaría la distribución normal. La distribución normal es muy conveniente porque tenemos muchos teoremas sobre lo que ocurre cuando las cosas se distribuyen normalmente. Mientras te mantengas cerca de la media no importa mucho qué
0 votos
Curva en forma de campana que utilizas. Cuando se va muy lejos, importa mucho. En la vida real las colas son siempre mayores de lo que dice una distribución normal.
0 votos
@RossMillikan - tus comentarios pueden ser copiados y editados en una respuesta. Resumes maravillosamente gran parte de la intención de Taleb en su breve discusión de este fenómeno. Tratando de ser positivo y no un comentario cop.....