Perspectivas e ingeniería

Análisis en profundidad de la infraestructura de datos web, las técnicas de extracción y el futuro de los datos estructurados a gran escala.

Últimos artículos

Scrapy vs Selenium: ¿Quién gana?

TL;DR: Scrapy es un marco de rastreo asíncrono de alta velocidad construido para extraer datos estructurados de páginas estáticas a escala. Selenium automatiza los navegadores reales y gestiona los sitios con mucho JavaScript, pero con un coste de recursos mucho mayor. La mayoría de los proyectos de scraping de producción se benefician de saber cuándo usar cada uno, o cuándo combinarlos.

Gabriel Cioci11 min read
Apr 28, 2026

Scrapy vs Beautiful Soup: Qué Python Scraper elegir

TL;DR: Scrapy es un completo framework de rastreo que maneja peticiones, análisis y exportación de datos en un solo paquete. Beautiful Soup es una biblioteca ligera de análisis sintáctico que se combina con un cliente HTTP como requests. Elige Scrapy cuando necesites un rastreo concurrente a gran escala con pipelines integrados. Elige Beautiful Soup cuando quieras una configuración rápida y mínima para analizar un puñado de páginas.

Mihnea-Octavian Manolache12 min read
Apr 29, 2026

Tutorial de Scrapy Splash: Renderizar páginas JavaScript

TL;DR: Scrapy Splash empareja el rápido motor de rastreo de Scrapy con el navegador sin cabeza Splash para renderizar páginas con mucho JavaScript. Este tutorial de Scrapy Splash te guía a través de la configuración de Docker, la configuración del proyecto Scrapy, los conceptos básicos de SplashRequest, los scripts Lua para desplazarse y hacer clic, la integración de proxy y la solución de los errores más comunes que encontrarás.

Ștefan Răcilă13 min read
Apr 29, 2026

Scrapear datos de productos de Amazon con Python: Guía práctica

TL;DR: Las páginas de productos de Amazon están repletas de datos valiosos (precios, valoraciones, reseñas, ASIN), pero extraerlos de forma fiable requiere algo más que una petición HTTP básica. Esta guía te guía a través de la construcción de un scraper Python con Requests y BeautifulSoup, el manejo de la paginación y las defensas anti-bot, la exportación a CSV o JSON, y la alimentación de los resultados en los flujos de trabajo LLM. También aprenderás cuándo utilizar una API de scraping en lugar de desarrollar tu propia solución.

Raluca Penciuc18 min read
Apr 29, 2026