Aunque el web scraping pueda parecer sencillo en la práctica, existen muchos escollos con los que puede tropezar un desarrollador sin experiencia. En lugar de insistir a la fuerza hasta quedarse sin proxies sin bloquear, me atrevo a pensar que sería mejor realizar el scraping de forma inteligente: obtener los datos que necesitas y salir sin que nadie se dé cuenta.
La verdadera pregunta es: ¿cómo se hace eso? ¿Cómo se obtiene información sin que te bloqueen la IP, sin toparte con CAPTCHAs, sin recuperar código JavaScript inútil y sin tener que retocar el código del scraper sin cesar? Bueno, no hay una regla de oro que seguir, pero sí hay buenas prácticas.
Hemos preparado doce consejos para ti. Úsalos y verás que todos los datos de Internet están a solo unos clics de distancia.




