Utilizo los tres programas.
Python puede hacer todo lo que R puede hacer y R puede hacer todo lo que hace Python, pero debo decir que R es superior a Python cuando se trata de los paquetes. Por esa razón, para la mayoría de análisis econométricos suelo preferir R. También me resulta más fácil producir gráficos estándar de estadísticas con R (aunque para mapas prefiero Python).
Sin embargo, Python es mucho mejor para web-scraping, análisis numérico y análisis de sentimientos de texto (aunque R también tiene buenos paquetes para eso). Además, prefiero usar Python cuando necesito configurar mi propio programa, ya que programar en Python es más natural (si eso tiene sentido) que en R, a menos que el programa se pueda construir fácilmente a partir de funciones predefinidas de varios paquetes.
Siempre recomiendo a las personas a mi alrededor que aprendan tanto Python como R: la diferencia entre ellos no es tan grande y con R realmente no necesitas invertir demasiado en habilidades de programación, solo lo básico y luego usar paquetes.
Además, los Cuadernos Jupyter que pueden alojar tanto R como Python hacen que sea más fácil usarlos.
Cuando se trata de Stata, lo uso solo con fines educativos (imparto tutoriales econométricos en la universidad). Para ser honesto, no me gusta Stata por varias razones:
-
Stata no es un software gratuito y no creo que el precio esté justificado dado que es un producto inferior en comparación con programas gratuitos como R y Python. Si lo puedes conseguir de forma gratuita en la universidad, probablemente no te importe, pero aún así es algo a tener en cuenta.
-
Stata es un programa, no un lenguaje, por lo que si deseas crear una nueva función compleja debes obtener y aprender Mata por separado (el lenguaje de programación de Stata).
-
Stata tiene algunas limitaciones serias en los tamaños de las matrices, incluso en la edición más cara el tamaño max de mat es 11000, lo que es un límite serio cuando trabajas con datos de panel y debes ejecutar modelos iterativos con un gran número de variables. Te verás obligado a menudo a ejecutar, por ejemplo, pruebas de heterocedasticidad de panel LR en submuestras aleatorias incluso con la edición más cara.
-
Crear gráficos hermosos en Stata es casi imposible, No me malinterpretes, puedes hacer algunos gráficos decentes en Stata, pero palidece en comparación con lo que puedes hacer con Python o R.
-
Stata es torpe con el análisis de series temporales. Si buscas un programa fácil de usar para el análisis de series temporales, sería EViews. Por ejemplo, Stata no puede manejar si tienes cuartos que están expresados en formato de fecha, pensará que tienes lagunas en tu serie de tiempo y no te permitirá ejecutar comandos básicos de series temporales hasta que crees una nueva variable de series temporales. Además, la oferta de modelos de series temporales es bastante baja y programar tu propio modelo es doloroso.
-
Aunque técnicamente es posible hacer web scraping o análisis numérico en Stata, es un infierno; si lo necesitas para tu trabajo, no lo uses.
Sin embargo, Stata también tiene algunas ventajas:
-
Es más fácil de usar que R o Python e incluso se puede utilizar sin programar a través de la interfaz (por eso lo usamos para tutoriales para estudiantes como el primer programa que ven para no sentirse abrumados).
-
Hacer ajustes en los conjuntos de datos, crear variables dummy, etc., es más fácil en comparación con Python o R, pero principalmente porque en Python y R puedes tener varios tipos de datos: listas, marcos de datos, etc.
-
Con la compra de Stata obtienes acceso a los foros de Stata, es algo similar a Stack Exchange, pero en realidad pagan a profesionales para darte respuestas allí y a menudo, además del soporte, puedes obtener consejos muy buenos incluso sobre econometría, y generalmente obtendrás consejos muy rápidos.
Personalmente, no usaría Stata para mi propio trabajo científico. Python y R son superiores en todos los aspectos a Stata, pero es un programa muy bueno para comenzar para los estudiantes.