4 votos

¿Cuál es el lenguaje de aprendizaje automático preferido en esta industria para el aprendizaje no supervisado?

Me preguntaba de los que tienen experiencia comercial de aprendizaje automático financiero, cuál es el lenguaje de aprendizaje automático de elección en esta industria en el sentido más general.

También, cuál sería el mejor lenguaje para el aprendizaje automático adaptativo y no supervisado, con el fin de informar las decisiones de negociación.

Cuando digo lo mejor me refiero a un equilibrio entre la velocidad y la productividad del desarrollador, y en cierta medida a las bibliotecas existentes, aunque con las herramientas genéricas de aprendizaje profundo esto podría pesar menos.

1 votos

R para ambas preguntas

5voto

R.

Los otros en juego son Python y, cada vez más, Scala. Pero si se trata de crear o probar un algoritmo de aprendizaje automático para un nuevo problema, es R.

Actualización del 2 de julio de 2017: Esta respuesta apareció en mi feed debido a un upvote, así que supongo que vale la pena actualizarla.

Hoy en día hay unos cuantos factores clave que deciden qué idioma elijo para un problema. Si el problema es realizar un análisis de datos que no puede caber en memoria en una máquina, entonces probablemente voy a utilizar Scala para Spark. Si puede caber en memoria y los datos son de una forma en la que los campos relevantes son números o categorías, entonces voy a utilizar R. Si los datos contienen texto o imágenes, entonces es más probable que utilice Python (a menos que tenga la intención de utilizar uno de los paquetes de modelado de texto de R.)

0 votos

Gracias, tengo curiosidad por saber por qué usarías R para un nuevo algoritmo frente a Scala.

1 votos

Por la misma razón de usar R, es mucho más rápido desarrollar una aplicación de procesamiento de datos en. Eso es tanto por las características del lenguaje, como por el gran cuerpo de paquetes existentes que puedes integrar o del que puedes aprender código. No me malinterpretes, creo que Scala es un gran lenguaje, pero para las aplicaciones de datos, el tiempo de desarrollo es sólo una fracción del que se necesita en R.

1 votos

Personalmente no pondría a Scala en esa lista, se utiliza principalmente para el procesamiento distribuido en Spark/Hadoop (aunque también podrías hacerlo en python/R) y sus capacidades de ML son bastante limitadas a lo básico. Para la creación de prototipos de algoritmos, también pondría Matlab/Octave junto a R.

4voto

Vitaliy Puntos 463

Python. Scikit-learn es una potente biblioteca de aprendizaje automático escrita en Python. Además de bibliotecas como modelos estadísticos y el flujo tensorial. Python es un lenguaje estable a nivel de producción (también utilizado por Quantopian).

Para el aprendizaje no supervisado, es posible que desee buscar la propagación de afinidad, DBSCAN o los algoritmos K-Means de proceso Dirichlet que no requieren el conocimiento de los clusters por adelantado. Para los datos de texto, el LDA y el HDP en línea son útiles para el aprendizaje de los temas.

Finanhelp.com

FinanHelp es una comunidad para personas con conocimientos de economía y finanzas, o quiere aprender. Puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X