Perspectivas e ingeniería

Análisis en profundidad de la infraestructura de datos web, las técnicas de extracción y el futuro de los datos estructurados a gran escala.

Últimos artículos

Web Scraping sin que te bloqueen: Manual 2026

TL;DR: Los bloqueos modernos se producen en cuatro capas: red, firma de solicitud, navegador y comportamiento. Diagnostique primero la capa utilizando códigos de estado y páginas de desafío y, a continuación, arréglela con la combinación adecuada de proxies residenciales rotativos, cabeceras de navegador, suplantación TLS, navegadores invisibles y tiempos similares a los humanos. Cuando el volumen o la sofisticación del anti-bot hagan que el bricolaje no sea rentable, descargue la capa de solicitud a una API gestionada.

Sergiu Inizian39 min read
May 1, 2026