Perspectivas e ingeniería

Análisis en profundidad de la infraestructura de datos web, las técnicas de extracción y el futuro de los datos estructurados a gran escala.

Últimos artículos

Tutorial de BeautifulSoup: Construir un raspador real de Python desde cero

TL;DR: Este tutorial de BeautifulSoup te guía a través de un scraper Python completo, desde la instalación pip hasta un script reforzado que pagina Hacker News, exporta a CSV y JSON, y se mantiene lo suficientemente educado como para no ser bloqueado. Cada fragmento es ejecutable, y señalamos los momentos exactos en los que BeautifulSoup es la herramienta equivocada.

Sorin-Gabriel Marica19 min read
May 12, 2026

Web Scraping con Selenium: Tutorial paso a paso en Python

TL;DR: Selenium te permite scrapear sitios web con mucho JavaScript manejando un navegador real desde código Python. Este tutorial te guía a través de cada fase: instalación de Selenium, configuración de Chrome, localización e interacción con elementos, manejo de esperas y paginación, exportación de datos limpios y escalado de tu scraper con proxies, Selenium Grid y alternativas basadas en API.

Robert Sfichi33 min read
Apr 29, 2026

La guía definitiva para el web scraping con C++

El C++ se puede utilizar para muchas cosas, pero ¿alguna vez has visto un rastreador web escrito en C++? Pues aquí tienes uno, además de un tutorial sobre cómo crear el tuyo propio.

Raluca Penciuc13 min read
Apr 22, 2026