La mayoría de los científicos de datos serios prefieren R a Python , pero si desea trabajar en ciencia de datos o aprendizaje automático en un banco de inversión, probablemente tendrá que dejar de lado su parcialidad por R. En su lugar, los bancos utilizan de forma abrumadora Python.
Importante para los que se desean aprender Python
En realidad para empezar un curso de Python, hay muchas opciones sin embargo podemos recomendar este grupo de cursos para los que se inician o quieren fortalecer sus capacidades en python desde un nivel básico a escalar a niveles avanzados, por ejemplo tenemos: Python de Cero a Experto,o también puede pueden empezar poco a poco en Curso Programación de Python y este que puede ser más completo: Programación en Python.
"Se prefiere Python a R en los bancos por varias razones", dice el jefe de ciencia de datos con sede en Nueva York en un banco líder. "Hay una mayor disponibilidad de paquetes de aprendizaje automático como sklearn en Python; es mejor para tareas de programación genéricas y es más fácil de producir; además, Python es mejor para la limpieza de datos (como solía ser Perl) y para el análisis de texto".
Por esta razón, dijo que los bancos han trasladado su análisis de datos a Python casi por completo. Hay algunas excepciones: algunos trabajos de inicio usan R, pero en su mayor parte predomina Python.
No obstante, R todavía tiene sus fans. Jeffrey Ryan , el ex estrella de Citadel es un gran defensor de R y dirige una conferencia anual sobre R en finanzas (cancelada este año debido a COVID-19). "R fue diseñado para estar centrado en datos y fue construido por investigadores", dice Ryan. "Mientras que Python se apropió del marco de datos y la serie temporal de R, a través de Pandas [la biblioteca de software de código abierto para la manipulación de datos en Python construida por Wes McKinney, un ex desarrollador de software en Two Sigma]".
R todavía se utiliza en el trabajo y la investigación estadísticos, dice Ryan. En comparación, Python es la herramienta de "análisis de datos popular" y es fácil de usar sin aprender estadísticas. "Python encontró una audiencia completamente nueva de programadores en el momento exacto de la historia", reflexiona Ryan. "Cuando los programadores (más numerosos que los estadísticos) quieren trabajar con datos, Python tiene el atractivo de un solo lenguaje que" lo hace todo ", incluso si técnicamente no hace nada de esto por diseño".
Dada la importancia de los datos en los servicios financieros, se podría suponer que los bancos favorecerían el lenguaje más capaz, incluso si requiere un esfuerzo adicional para dominarlo. Sin embargo, Graham Giller, director ejecutivo de Giller Investments y exjefe de investigación en ciencia de datos en JPMorgan y Deutsche Bank, dice que los bancos se han decantado por Python sobre R porque los departamentos de TI de los bancos están dirigidos predominantemente por científicos informáticos en lugar de personas que se preocupan por un mucho sobre los datos.
"Personalmente, me gusta mucho R", dice Giller. "R es mucho más una herramienta para estadísticos profesionales, es decir, personas interesadas en la inferencia de datos, en lugar de científicos informáticos interesados en el código". A medida que los científicos informáticos de los bancos han ido ganando terreno, Giller dice que los bancos han "reemplazado a los quants con profesionales de TI o con quants que en el fondo quieren ser profesionales de TI", y han traído Python con ellos.
Para los matemáticos puros en finanzas, todo es un poco frustrante. Pandas se construyó en la parte posterior de R, pero ha cobrado vida propia. "Pandas comenzó como una forma de llevar un entorno similar a R a Python", dice Giller, observando que Pandas puede ser "horriblemente lento e ineficiente" en comparación.
Sin embargo, a la mayoría de las personas no les importa esto: cuanto más se usan Python y Pandas, más casos de uso tienen. "R tiene una base de usuarios relativamente más pequeña que Python en este momento", dice Ryan. "Esto, a su vez, significa que se comienzan a crear muchas herramientas en torno a Python y los datos, y se basa en su éxito".
Lenguaje R: https://cran.r-project.org/bin/windows/base/
Lenguaje Python: https://docs.python.org/es/3/tutorial/