La Ciencia de Datos es un campo emocionante y en constante crecimiento que combina matemáticas, estadísticas y programación para analizar datos y extraer insights. Si estás interesado en adentrarte en este fascinante mundo, aquí tienes una lista de enlaces recomendados para comenzar tu aprendizaje.

Antes que nada tengo que aclarar que incluyo recursos aparte de FreeCodeCamp. Estos recursos pueden ser perfectamente complementarios para los que desean estudiar algunas de las certificaciones de FreeCodeCamp.

Este artículo es un poco más personal dado que la gran mayoría de estos recursos me han ayudado en mi aprendizaje de Ciencia de Datos. Los comparto como aditamiento a un futuro Podcast de FreeCodeCamp español, organizado por Rafael Hernandez.

Si lo que buscas son proyectos de Python, aquí tienes algunos. Por otra parte, si necesitas un esquema de la disciplina, puedes consultar este artículo. Las recomendaciones son opcionales y están basadas en mi análisis propio (que puede errar), aún así espero que alguna parte de este artículo te sea de ayuda. Sin más demoras, he aquí los recursos.

Recursos en español:

  1. Afi Escuela - Machine Learning: Enlace
    Descripción: Este canal de YouTube ofrece una serie de videos sobre Machine Learning, donde podrás aprender los conceptos básicos y técnicas avanzadas de esta disciplina.
  2. Data Science: Enlace
    Descripción: Explora esta lista de reproducción que cubre diversos temas relacionados con la Ciencia de Datos, incluyendo análisis exploratorio de datos, visualización y algoritmos de aprendizaje automático.
  3. Píldoras Informáticas - SQL: Enlace
    Descripción: Aprende SQL, un lenguaje de consulta utilizado para trabajar con bases de datos, a través de esta serie de videos que cubren desde los fundamentos hasta técnicas más avanzadas.
  4. Píldoras Informáticas - Python: Enlace
    Descripción: Descubre el lenguaje de programación Python con esta serie de videos que te guiarán desde los conceptos básicos hasta temas más avanzados.
  5. Aprendizaje y Minería de Datos (Con R) - Universidad Politécnica de Valencia: Enlace
    Descripción:
    Esta lista de reproducción ofrece un curso completo sobre Aprendizaje y Minería de Datos utilizando el lenguaje R. Aprenderás técnicas estadísticas y algoritmos utilizados en este campo.
  6. Fundamentos de Estadística - Universidad de los Andes: Enlace
    Descripción: A través de este curso en Coursera, obtendrás los fundamentos de la estadística y aprenderás a aplicarlos en situaciones reales.
  7. Curso de R - SEE Sociedad Ecuatoriana de Estadística: Enlace          Descripción: Este es un curso en español ofrecido por la Sociedad Ecuatoriana de Estadística (SEE). Está enfocado en el lenguaje de programación R, ampliamente utilizado en análisis estadístico y en ciencia de datos. R es una herramienta poderosa para visualización, manipulación y análisis de datos. Es ideal para aquellos que deseen fortalecer sus habilidades en el análisis estadístico y la manipulación de datos utilizando R.

Recursos en inglés para aprender Ciencia de Datos:

A continuación, se presentan una serie de enlaces recomendados en inglés que te serán útiles para aprender sobre Ciencia de Datos:

  1. Intro to Data Science (Enfoque Matemático)
  2. Matemáticas para Ciencia de Datos (Álgebra Lineal) y Cálculo Multivariable
  3. Aprendizaje Automático (Andrew NG es un clásico)
  4. Aprendizaje Automático (También un clásico y mi primer curso teórico en ML)
  5. Matemáticas para Ciencia de Datos (Avanzado)
  6. Introducción al Aprendizaje Profundo (Mejor hacer este después de varios cursos introductorios)
  7. Aprendizaje Automático (¡Este es mi curso favorito en ML! El curso del Prof. Kilian es muy recomendado)
  8. Aprendizaje Automático (Curso muy práctico y estructurado, necesitarás trabajar en un Notebook de Jupyter para seguir el curso)
  9. Teoría del Aprendizaje Estadístico (Curso bastante avanzado)
  10. Bootcamp de Ciencia de Datos del Hasso Plattner Institute (Este es reciente, la información es libre pero para sacarle provecho tienes que saber las bases de Python y SQL.)

Cursos gratuitos que NO son simples MOOCs:

  1. Programación en Python: Este curso es de la Universidad de Helsinki. Aprendí mucho en los cursos de 2019 y 2020, por lo que considero que la tradición aún continúa.
  2. Data Análisis en Python: De la misma universidad, solo que centrado en el análisis de datos.
  3. Certificado de Analítica de Datos de Google: Sinceramente, no hice el curso de Data Analytics porque era en R y en ese entonces estaba centrado en Python. Sin embargo, completé el Certificado en Gestión de Proyectos, por lo que puedo recomendar la calidad de los cursos de Google. El certificado es de pago, pero puedes pedir ayuda financiera a Coursera en caso de tener una situación económica difícil.
  4. Beca AWS Machine Learning Scholarship Program: También tienes que aplicar a ayuda financiera. En este caso, la beca es condicional a una selección siguiendo los criterios y la fecha de aplicación.
  5. Applied Data Science Lab: Este es como un bootcamp de Ciencia de Datos. El lenguaje de programación es Python y tienes que aprobar una preselección. El programa es bastante práctico y puede ser bastante demandante si no estás familiarizado/a con la programación orientada a objetos.

Por cierto, la universidad también tiene una Maestría en Ingeniería Financiera. Pero a ver, primero debes tener un título de pregrado, aprobar un test cuantitativo y comprometerte a dedicar hasta 25 horas a la semana en el estudio, lo cual puede generar tensión si ya tienes un trabajo.

Otros consejos para aprender:

Aporta a las comunidades: En mi caso, estuve activo en los foros de R Studio y de la Python Software Foundation, aunque la comunidad a la que más he contribuido ha sido FreeCodeCamp. También he tenido el placer de apreciar el proceso de colaboración en GitLab de la comunidad de NumPy. Incluso sin hacer aportes trascendentales, he aprendido mucho en el proceso. Solo en Python, por ejemplo, hay diversas comunidades que puedes explorar. Puedes encontrar sitios como Devto y otros que son muy útiles para conectar con desarrolladores. No todos necesariamente son científicos de datos, pero puedes aprender mucho de otros roles, lo que fortalecerá tu capacidad. Si estás interesado en una comunidad de nicho, puedes visitar Kaggle.

Lee materiales de Data Science: No voy a recomendar sitios específicos para evitar hacer publicidad, pero leer materiales de Data Science puede ayudarte a reforzar lo que has puesto en práctica.

Aunque no puedes aprender Data Science solo leyendo, el acto de leer puede consolidar tus conocimientos. También puedes optar por revisar exclusivamente el código de otros y analizar si podrías resolver los problemas de manera diferente.

No te preocupes por ser constante: Ok aclarando, hay dos formas de ser constante, una buena en la que tu empiezas algo y te has propuesto casi bajo juramento estudiar una determinada materia o avanzar en cierto proyecto hasta terminar. NO me refiero a ese tipo, eso está muy bien.

Me refiero a la forma "falsa" de ser constante que solo está en nuestra mente debido a nuestros sesgos, es algo así como "el perfil perfecto". Tienes que tener título x, más tantos años de experiencia, y esos mismos años deben de ser en un nicho muy específico, y además debes saber solo cierto lenguaje o cierta herramiento, cierto framework para los proyectos, etc.  No se permiten desvíos en la carrera, ni cambios de sector o algo que ponga en evidencia tu "carrera progresiva".

Este es un error que puede surgir en recursos humanos, perfiles idealizados en los que los requisitos están mucho más orientados a encontrar un personaje más que personas que sepan hacer el trabajo.

La diversidad de capacidades y experiencias es parte importante del ser humano, simplemente no necesitas ser el "personaje perfecto". Es muy cierto que muchas veces lo mejor es aplicar, no obstante, saber analizar cuales ofertas son realmente irrealistas te ayudará a ahorrar tiempo y esfuerzo.

Puede haber asomo de razón en juzgar a un hombre por los más comunes rasgos de su vida, pero en atención a la natural instabilidad de nuestras costumbres e ideas, entiendo que hasta los buenos autores hacen mal obstinándose en formar del hombre una contextura sólida y constante: eligen un principio general, y de acuerdo con él ordenan o interpretan las acciones, y si no logran acomodarlas a la idea preconcebida, toman el partido de disimular las que no entran en su patrón. Montaigne "De la inconstancia de nuestras acciones". Ensayos

La recomendación es la siguiente, no te dejes intimidar por este tipo de "ofertas", analiza bien y verás que hay empresas que cuyos requisitos realmente concuerdan con la necesidad que estas tienen.

Pregúntate lo siguiente: ¿Estos requisitos que solicitan, qué necesidad llegarán a satisfacer en la empresa? No es lógico solicitar a alguien con un MBA, con 4 años de experiencia en proyectos, dos de ellos solo con Kanban y que sepa Python, R, y también HTML solo para un puesto de analista de datos. O tampoco sería cuerdo solicitar alguien con ingeniería en ciencias de la computación y 3 años de experiencia solo en determinado sector para un puesto con funciones similares al de Junior Developer pero con otro nombre.

Escribe para reforzar lo aprendido: Este consejo puede ser un poco sesgado, ya que yo amo escribir. No es necesario tener el talento de Jorge Luis Borges, pero creo que en la escritura técnica sobre ciencia de datos, lo que importa es que el mensaje cumpla una función pedagógica.

No se trata de entretener o impresionar, sino de crear contenido útil que simplifique el aprendizaje. Debe ser un contenido educativo que facilite el proceso al máximo. Al ponerse en el lugar de quien explica y de la audiencia/estudiante, podrás reflexionar sobre el proceso y ayudarte a memorizar el tema de forma inconsciente.

Haz voluntariado: Existen dos formas de poner en práctica lo aprendido. Una es participar en proyectos de código en comunidades donde todos tienen conocimientos de programación, como trabajar en un repositorio de Github. La otra forma es trabajar en un entorno 100% "natural", donde la mayoría no tiene idea de programación o solo tiene conocimientos generales.

Contribuir a proyectos sociales u ONGs que te interesen realizando tareas como procesamiento, análisis y visualización de datos te dará una idea de las dificultades del "mundo real". Descubrirás que no todas las organizaciones tienen un marco adecuado para trabajar con los datos.

En algunos casos, incluso podrías convertirte en educador además de analista de datos, ya que tendrás que explicar los procesos a tu equipo. Incluso para el diseño de una campaña de educación ambiental, podrías necesitar una muestra confiable, y la recolección de datos en los plazos establecidos por el project manager requerirá ajustar la metodología y la gestión...

¡Ups! Perdón por la digresión, pero espero que haya quedado clara la moraleja: en un caso real, el entorno organizacional tiene su peso y siempre debes recordar que trabajarás con personas, no solo con programas. Tus habilidades de comunicación serán clave. Tu trabajo no consistirá simplemente en trabajar con notebooks de jupyter.

PD. Si puedes conseguir una pasantía o un trabajo junior remunerado, puedes prescindir del voluntariado.

Aquí te dejo 3 enlaces relevantes:

La pregunta del millón: ¿Es necesario tener estudios universitarios (pregrado, máster) para ejercer en Data Science?

Respuesta rápida: No. Respuesta extensa: Depende de lo que quieras hacer y dónde quieras trabajar.

Algunas empresas tienen requisitos específicos según el sector. Sin duda, tener una formación universitaria es beneficioso para solicitar el puesto, pero la experiencia suele tener más peso. Puedes empezar creando tu propio portafolio (incluso un portafolio como desarrollador de front-end podría ser un buen comienzo). También existe la posibilidad de hacer una transición desde otro rol como Software Testing a Data Science.

Incluso puestos como analista de negocios (business analyst) o analista de datos son buenos antecedentes. Estos roles también cuentan como experiencia relevante y, junto con un portafolio y algunas certificaciones, puedes realizar una transición. Esto también aplica si tienes formación universitaria pero en áreas no cuantitativas.

Otras Salidas Profesionales en el Campo de la Ciencia de Datos

Por último, es necesario que te preguntes acerca de tus objetivos. Al tener conocimientos de Data Science, hay opciones de carrera. No es como si Data Scientist fuera tu única opción. Incluso fuera del sector de tecnología, existen diversas salidas en las que tu conocimiento de programación te daría una ventaja.

Hoy día, hay periodistas utilizando la ciencia de datos en sus investigaciones, como se evidenció en el caso de los "Panamá Papers", donde se analizaron millones de documentos para revelar información sobre evasión fiscal y corrupción. Estos periodistas combinan su experiencia en periodismo con habilidades en ciencia de datos para desentrañar historias complejas y presentar información de manera impactante.

Los project managers también se benefician de tener conocimientos en ciencia de datos. Dirigir proyectos con soluciones centradas en inteligencia artificial se ha vuelto cada vez más relevante en el mundo empresarial. Los project managers con habilidades en ciencia de datos pueden aprovechar las capacidades analíticas y predictivas para tomar decisiones informadas y liderar proyectos exitosos en entornos tecnológicos.

Además, existen carreras especializadas en campos como el analista de investigación de mercado, donde la capacidad de utilizar herramientas de ciencia de datos para analizar datos de mercado y extraer información relevante es fundamental. Los analistas de investigación de mercado pueden utilizar técnicas de minería de datos y análisis predictivo para comprender mejor las tendencias del mercado y ayudar a las empresas a tomar decisiones estratégicas.

La consultoría en transformación digital es otro campo donde los conocimientos de ciencia de datos son altamente valorados. Recientemente un estudio de Deloitte encontró que la capitalización potencial de este mercado posee muy altas prospectivas.

Ayudar a las organizaciones a aprovechar los datos para optimizar sus procesos, tomar decisiones basadas en datos y adaptarse a los desafíos digitales se ha convertido en una necesidad en la era de la transformación digital. Los consultores en transformación digital con habilidades en ciencia de datos pueden guiar a las empresas en su viaje hacia la adopción de tecnologías y prácticas basadas en datos.

Estas son solo algunas de tantas opciones, por otra parte, cada vez es más popular el término Data Literacy, o alfabetismo de datos, de allí que un conocimiento mínimo de esta disciplina se pueda volver un requisito creciente en varios sectores.

Conclusión.

A lo largo de nuestro recorrido, hemos descubierto que adquirir habilidades en ciencia de datos no solo es valioso para convertirse en un Data Scientist, sino que también abre un abanico de oportunidades profesionales en campos muy diversos.

En un mundo impulsado por los datos, la capacidad de recopilar, analizar y transformar información en conocimiento es una habilidad altamente demandada. Los profesionales de la ciencia de datos son buscados por su capacidad para extraer insights significativos de grandes volúmenes de datos, identificar patrones, predecir tendencias y tomar decisiones basadas en evidencia.

No hay tal cosa como un "perfil fijo" para ciencia de datos, así que no te presiones más de lo necesario a la hora de las entrevistas.

Por último, sonará un poco cliché, pero la ciencia de datos se ha convertido en un elemento clave para que las organizaciones impulsen la innovación, optimicen sus operaciones, comprendan mejor a sus clientes y se adelanten a las demandas del mercado. La combinación de conocimientos en programación, estadísticas, aprendizaje automático y visualización de datos otorga a los científicos de datos una ventaja competitiva para abordar los desafíos complejos de hoy en día.