Perspectivas e ingeniería

Análisis en profundidad de la infraestructura de datos web, las técnicas de extracción y el futuro de los datos estructurados a gran escala.

Últimos artículos

Cómo extraer datos de los resultados de lugares de Google Maps

Descubre cómo extraer datos de los resultados de lugares de Google Maps con nuestra API utilizando Node.js: guía paso a paso, ventajas de un extractor profesional y mucho más. Obtén fácilmente el data_id, las coordenadas y el parámetro «build data».

Andrei Ogiolan7 min read
Apr 22, 2026

Web Scraping con Regex: Guía práctica

TL;DR: Web scraping con regex brilla cuando necesitas patrones de texto cortos y predecibles (precios, SKUs, correos electrónicos, fechas) de HTML en el que ya confías. Empareje el módulo re de Python con Beautiful Soup, extienda sus patrones a un nodo analizado en lugar de a una marca sin procesar y mantenga el regex fuera del camino del análisis completo del árbol HTML. Esta guía muestra un raspador de título y precio, características avanzadas de regex y los problemas que afectan a los raspadores reales en producción.

Mihai Maxim12 min read
May 7, 2026

Cómo utilizar un proxy con HttpClient en C#

TL;DR: Para usar un proxy con HttpClient en C#, construye un WebProxy, adjúntalo a un HttpClientHandler (o SocketsHttpHandler), y pasa ese handler al constructor de HttpClient. Para producción, cambia los bucles manuales por IHttpClientFactory, añade NetworkCredential para proxies autenticados, y envuelve las llamadas en reintentos con Polly para que las IPs muertas no tumben tu trabajador.

Suciu Dan19 min read
May 8, 2026

Cómo raspar tablas HTML con Python

TL;DR: La mayoría de las tablas HTML se pueden raspar con una sola línea de pandas.read_html. Cuando la tabla es paginada, JavaScript-rendered, o tiene cabeceras fusionadas, cambie a Requests + BeautifulSoup o un navegador headless como Playwright. Esta guía le da una matriz de decisión, código de trabajo para los tres enfoques, y los pasos de limpieza que convierten las filas raspadas en datos listos para la tubería.

Andrei Ogiolan18 min read
May 7, 2026