Author Profile

Sorin-Gabriel Marica

Desarrollador full-stack

Sorin Marica es ingeniero Full Stack y DevOps en WebScrapingAPI, donde se encarga de desarrollar funciones para los productos y de mantener la infraestructura que garantiza el buen funcionamiento de la plataforma.

Python web scrapingGuidesEngineering
Sorin-Gabriel Marica, Desarrollador full-stack @ WebScrapingAPI

Published Articles

6

Published Articles
Science of Web ScrapingMay 1, 202613 min read

Web Scraping con Node-Unblocker: Guía práctica

TL;DR: Node-unblocker convierte una aplicación Express en un proxy HTTP con prefijo URL que puedes hackear. Esta guía de node unblocker para web scraping explica cómo instalarlo, conectar middlewares de solicitud y respuesta, rotar instancias, desplegar en Docker o Heroku y reconocer el punto en el que una API de scraping gestionada es la respuesta más sensata.

Read article

GuidesApr 30, 202619 min read

Web Scraping con PHP: Guía práctica de bibliotecas, código y buenas prácticas

TL;DR: PHP es un lenguaje perfectamente apto para el web scraping, gracias a extensiones integradas como cURL y DOMDocument, además de un rico ecosistema Composer que incluye Guzzle, Symfony DomCrawler y Symfony Panther para la navegación headless. Esta guía te guía a través del flujo de trabajo completo: obtención de páginas, análisis sintáctico de HTML, almacenamiento de resultados en CSV/JSON/MySQL, gestión de errores y evitación de bloqueos.

Read article

EngineeringApr 10, 20266 min read

Restricciones arquitectónicas de la API REST

Las API pueden adoptar muchas formas y tamaños. De entre ellas, las API REST son quizá las más populares, pero ¿qué es lo que las define exactamente? ¡Pues vamos a averiguarlo!

Read article

GuidesApr 22, 20269 min read

Aprende a utilizar Node-Fetch (NPM) para realizar solicitudes HTTP en Node.js

Descubre cómo utilizar el recién lanzado node-fetch para realizar solicitudes HTTP directamente desde Node.js. Node-fetch es el equivalente a la API fetch en JavaScript.

Read article

GuidesApr 22, 20269 min read

La guía definitiva para iniciarse en el web scraping con Go

Esta es una guía completa sobre cómo utilizar Go para el web scraping. Aprende a crear un rastreador web rápido aprovechando la potente capacidad de concurrencia de Golang.

Read article

GuidesMay 12, 202619 min read

Tutorial de BeautifulSoup: Construir un raspador real de Python desde cero

TL;DR: Este tutorial de BeautifulSoup te guía a través de un scraper Python completo, desde la instalación pip hasta un script reforzado que pagina Hacker News, exporta a CSV y JSON, y se mantiene lo suficientemente educado como para no ser bloqueado. Cada fragmento es ejecutable, y señalamos los momentos exactos en los que BeautifulSoup es la herramienta equivocada.

Read article