Perspectivas e ingeniería

Análisis en profundidad de la infraestructura de datos web, las técnicas de extracción y el futuro de los datos estructurados a gran escala.

Todo Guías La ciencia del web scraping Casos de uso Ingeniería Otros

Últimos artículos

Guías

Los 11 mejores consejos para evitar que te bloqueen o te restrinjan la IP al realizar web scraping

Con estas 11 recomendaciones clave, aprenderás a extraer datos de la web sin que te incluyan en listas negras. ¡Se acabaron los mensajes de error!

Ștefan Răcilă10 min read

Apr 22, 2026

Ingeniería

La descentralización en su máxima expresión: el modelo DAO de ice Network frente a la falta de control de los usuarios en Pi Network

Tras comprender la diferencia entre dos modelos distintos de DAO para la descentralización, estamos analizando redes similares, pero totalmente diferentes, como ICE y Pi.

Anda Miuțescu11 min read

Apr 10, 2026

Guías

Cómo extraer datos de Idealista: Un manual para 2026

TL;DR: Idealista es el mercado inmobiliario más grande de España, Italia y Portugal, pero se encuentra detrás de una seria pila anti-bot que bloquea rápidamente a los scrapers ingenuos. Esta guía te guía a través de cómo raspar datos de Idealista de extremo a extremo en Python, cubriendo el mapeo del sitio, Selenium con undetected-chromedriver, manejo de DataDome, rotación de proxy y exportaciones limpias, con endurecimiento de producción que los competidores suelen omitir.

Raluca Penciuc17 min read

May 8, 2026

Guías

Cómo raspar Yelp con Python: Reseñas, listados y pipelines de datos listos para el LLM

TL;DR: Esta guía te guía a través de la construcción de un scraper completo de Yelp en Python, cubriendo los resultados de búsqueda, detalles de negocios y reseñas con código de trabajo. También aprenderás cómo manejar las protecciones anti-bot, exportar datos a CSV o JSON, y alimentar reseñas raspadas en un LLM para el análisis de sentimiento, algo que ningún otro tutorial de raspado de Yelp cubre.

Raluca Penciuc16 min read

Apr 28, 2026

La ciencia del web scraping

10 preguntas sobre raspado que todo equipo de datos debe responder antes de escribir un raspador

TL;DR: Un proyecto de web scraping falla en la planificación mucho antes de fallar en el código. Estas diez preguntas sobre el scraping le guiarán a través de la legalidad, las alternativas de API, las defensas anti-bot, el coste, la cadencia de actualización, la calidad de los datos y la gobernanza, para que pueda evaluar el trabajo, elegir la pila adecuada y evitar los modos de fallo que matan silenciosamente a los scrapers en producción.

Mihai Maxim13 min read

May 8, 2026

Guías

Cómo extraer datos de los vendedores cercanos de Google Shopping con Node.js

Descubre cómo utilizar Node.js y nuestra API para extraer datos de vendedores cercanos de Google Shopping. Extrae información valiosa de forma rápida y sencilla con nuestro extractor web profesional.

Andrei Ogiolan6 min read

Apr 22, 2026

1 2 37928 29 30