Perspectivas e ingeniería

Análisis en profundidad de la infraestructura de datos web, las técnicas de extracción y el futuro de los datos estructurados a gran escala.

Últimos artículos

Formulario de envío de Puppeteer: Guía Node.js para 2026

TL;DR: Utilice page.locator(selector).fill(value) para scripts de formularios de envio rapidos y deterministas de Puppeteer y page.type() cuando la pagina busca pulsaciones reales (autocompletar, anti-bot, validacion en vivo). Envie haciendo click en el boton, pulsando Enter, o llamando a form.requestSubmit(), y espere siempre una señal concreta de exito en lugar de un tiempo de espera fijo.

Mihnea-Octavian Manolache15 min read
May 8, 2026

Cómo crear un raspador web con Pyppeteer (Guía 2026)

TL;DR: Pyppeteer es el port no oficial a Python de Puppeteer y todavía funciona para manejar un Chromium real desde asyncio. En esta guía lo instalarás, escribirás un scraper web moderno con Pyppeteer usando asyncio.run y try/finally, manejarás esperas, formularios, capturas de pantalla, scroll infinito, cookies y proxies, y aprenderás cuándo migrar a Playwright, Selenium o una API de scraping alojada.

Mihnea-Octavian Manolache12 min read
May 12, 2026

Cómo raspar Walmart.com: Guía completa 2026

TL;DR: Esta guía explica cómo hacer web scrape de datos de productos Walmart de principio a fin en Python, desde analizar el JSON __NEXT_DATA__ oculto hasta escalar con proxies, reintentos y búsquedas asíncronas. También traza una línea honesta para cuando una API de raspado administrado supera DIY.

Raluca Penciuc14 min read
May 12, 2026

los 15 mejores navegadores antidetección en 2026: Comparativa honesta para marketeros, scrapers y gestores multicuenta

TL;DR: Los navegadores Antidetect te permiten ejecutar varios perfiles de navegador aislados, cada uno con una huella digital única, para que las plataformas no puedan vincular tus cuentas. Esta guía clasifica los 15 mejores navegadores antidetección de 2026 en función de la calidad de la huella digital, el soporte de automatización, el precio y la integración de proxy. También explicamos cómo funcionan realmente estas herramientas, cuándo una API de raspado es la opción más inteligente y qué tipo de proxy debe asociarse a cada caso de uso.

Mihnea-Octavian Manolache33 min read
Apr 28, 2026

¿Qué son los proxies ISP? Guía para el Web Scraping y la Automatización

TL;DR: ¿Qué son los proxies ISP? Son IPs residenciales estáticas alojadas en un centro de datos. Los sistemas de detección ven un ASN residencial; usted obtiene el rendimiento del centro de datos. Son la elección correcta cuando las sesiones, la vinculación de cuentas y los precios predecibles por IP importan más que el alcance geográfico bruto.

Mihnea-Octavian Manolache12 min read
May 8, 2026