Si deseas recopilar datos de sitios web de forma automática, web scraping puede ser exactamente lo que necesitas. En este curso aprenderás todos los fundamentos desde cero con ejercicios y proyectos prácticos.

Acabamos de publicar un curso de 2 horas en el canal de YouTube de freeCodeCamp.org en español que te enseñará cómo usar web scraping para recopilar datos de sitios web de forma automática con Python y Beautiful Soup.

intro

El curso fue creado por Gustavo Juantorena. Él es Biólogo especializado en Neurociencias y está haciendo un doctorado en computación en el laboratorio de Inteligencia Artificial Aplicada de la Universidad de Buenos Aires, Argentina.

Gustavo tiene amplia experiencia enseñando Python, ciencia de datos y web scraping y te mostrará paso a paso cómo puedes aplicar estas técnicas en tus proyectos.

Los temas del curso incluyen:

  • Introducción a las Application Programming Interface (APIs)
  • Conceptos básicos sobre la Web
  • DOM (Document Object Model)
  • Web scraping con Python
  • El flujo de trabajo en web scraping
  • Cómo usar las APIs
  • Beautiful Soup
  • Los métodos find() y find_all()
  • Cómo encontrar atributos en HTML
  • Cómo seleccionar elementos por sus atributos
  • Descargar imágenes automáticamente
  • Las etiquetas "iframe" y "table"
  • Cómo extraer datos de productos
  • Cambios que dependen de la URL
  • Cómo buscar datos en la página
  • Cómo moverse en el árbol del DOM
  • Control de excepciones
  • Almacenamiento de datos

El curso tiene un enfoque práctico.

Comenzarás obteniendo datos de la API de Wikipedia y de una API que retorna las horas del amanecer y del ocaso y luego aplicarás tus conocimientos de web scraping en un sitio web real llamado ScrapePark.org.

Adicionalmente, trabajarás con una de las herramientas más importantes y más ampliamente usadas en el mundo de la ciencia de datos: los Jupyter Notebooks.

Escribirás y ejecutarás tu código de Python en Jupyter Notebooks en Google Colaboratory.

code
Captura de pantalla del Jupyter Notebook del curso.

Proyecto ScrapePark

Durante el curso también aplicarás tu conocimiento a un proyecto práctico creado en colaboración con freeCodeCamp: ScrapePark.org.

Screenshot-2023-08-07-at-6.37.07-PM
scrapepark.org/spanish (versión en español).

ScrapePark.org es un sitio web que simula una tienda online de patinetas. Fue creado específicamente para este curso y es administrado por freeCodeCamp.org para que puedas practicar tus habilidades de web scraping de forma segura.

Gustavo te mostrará cómo aplicar web scraping a este sitio web para obtener información de sus productos.

Suena genial, ¿no? 😁

Al final del curso, tendrás el conocimiento necesario para aplicar técnicas de web scraping a situaciones y proyectos reales.

Si te interesa la ciencia de datos, el mercadeo o la programación, este curso te enseñará las habilidades que necesitas para usar todo el potencial de los datos en la web.

Curso de Web Scraping en YouTube

Genial. Ahora que ya sabes más sobre web scraping, te invitamos a tomar el curso de Gustavo en el canal de YouTube de freeCodeCamp.org en español.

✍️ Curso creado por: Gustavo Juantorena.