Perspectivas e ingeniería

Análisis en profundidad de la infraestructura de datos web, las técnicas de extracción y el futuro de los datos estructurados a gran escala.

Últimos artículos

Cómo hacer scraping en LinkedIn en 2026: una guía en Python

TL;DR: El raspado de LinkedIn significa trabajar alrededor de un muro de autenticación agresivo, seguimiento de comportamiento, y TLS fingerprinting. Esta guía te ofrece un árbol de decisiones método por método, patrones de trabajo en Python para trabajos, perfiles y empresas (API oculta, JSON-LD, Selenium cuando sea necesario) y una lista de comprobación antibloqueo consolidada para 2026.

Suciu Dan15 min read
May 13, 2026

las 12 mejores herramientas gratuitas de Web Scraping en 2026: Comparativa

TL;DR: Las 12 mejores herramientas gratuitas de web scraping en 2026 se dividen en cuatro categorías: APIs gestionadas con créditos gratuitos, frameworks de código abierto, extensiones de navegador sin código y extractores de IA. Elige primero por caso de uso (raspado puntual frente a pipeline programado) y luego por nivel de conocimientos. La mayoría de los niveles gratuitos cubren la evaluación, no la producción; en el momento en que su tasa de éxito caiga por debajo de ~90% o queme más horas en bloques que en datos, es hora de pasar a una API de pago.

Suciu Dan30 min read
May 13, 2026

¿Es legal el Web Scraping en 2026? Marco de cumplimiento

TL;DR: ¿Es legal el web scraping? Normalmente sí, con algunas salvedades. La legalidad depende del tipo de datos, la ruta de acceso, las jurisdicciones implicadas y lo que se haga con el resultado. Esta guía le ofrece un veredicto directo, un marco de cinco minutos previo al raspado, los casos que importan y una lista de comprobación que puede ejecutar antes de realizar el envío.

Suciu Dan16 min read
May 13, 2026