Volver al blog
La ciencia del web scraping
Robert MunceanuLast updated on Mar 31, 20269 min read

Las 7 mejores listas de proxies gratuitos para el web scraping

Las 7 mejores listas de proxies gratuitos para el web scraping

En el web scraping, o bien utilizas proxies o bien no extraes los datos como es debido. Es cierto que quizá no necesites un proxy de conexión inversa con miles de direcciones IP de centros de datos y residenciales, pero al menos te convendrá contar con algunos proxies básicos.

El gran problema para los scrapers aficionados o principiantes es que las direcciones IP suelen costar dinero. Por suerte, existen los proxies gratuitos. De hecho, hay bastantes opciones entre las que elegir. Hemos analizado algunas de ellas y hemos seleccionado las 7 mejores para que solo obtengas calidad, al menos en lo que respecta a los proxies gratuitos.

En realidad, antes de entrar en la lista, deberíamos repasar algunos detalles. Los proxies gratuitos son estupendos porque no tienes que invertir dinero, pero no son perfectos.

Las ventajas y desventajas de los proxies gratuitos

En primer lugar, son gratis. Es algo obvio, pero supone una ventaja significativa. Piensa que puedes seguir cualquiera de las guías de nuestro blog, programar tu scraper y luego utilizarlo junto con los proxies.

Hay mucho que decir sobre las ventajas de los proxies en el web scraping, y no las repasaremos en este artículo. Pero, si quieres saber más, echa un vistazo a este artículo sobre proxies rotativos, en el que mostramos la gran diferencia que puede suponer un pool de IP.

Lamentablemente, esa es prácticamente la única ventaja que tienen los proxies gratuitos sobre los demás. Ahora, pasemos a las desventajas.

Dado que estas IP están disponibles gratuitamente, todo el mundo las conoce. Por lo tanto, es probable que los sitios web ya conozcan las direcciones y las hayan bloqueado. O bien alguien ya ha intentado acceder al sitio web que te interesa y ha conseguido que se bloquee la IP, o bien el administrador del sitio web ha encontrado el proveedor de proxies gratuitos, ha copiado todas las IP y las ha añadido a una lista negra. No siempre es así, pero ocurre a menudo.

Las IP gratuitas suelen ser lentas y carecen de anonimato. Mantener proxies cuesta dinero, así que no puedes esperar seriamente obtener IP de primera calidad sin coste alguno. Como dice el refrán, se obtiene lo que se paga.

Los proxies gratuitos pueden exponerte a los hackers. Como acabo de decir, es un poco inusual que alguien ofrezca direcciones gratuitas a cambio de nada. Una razón maliciosa por la que alguien podría hacer esto es para supervisar y copiar la información que pasa a través del proxy. Después, podrían utilizar esa información con fines maliciosos. De nuevo, esto no es una garantía, pero debes mantenerte alerta.

1. WebScrapingAPI

El factor clave que distingue a WebScrapingAPI de otros proveedores de esta lista es que la API solo utiliza proxies premium. Esto incluye tanto IP residenciales como de centros de datos, con numerosas opciones de geolocalización (7 para centros de datos, 40 para residenciales y más de 200 para planes personalizados). Aunque hay planes de pago, que van desde los 20 $ hasta los 200 $, cualquier usuario nuevo recibe un periodo de prueba gratuito de dos semanas, tiempo durante el cual puede utilizar cualquiera de las funciones de la API.

La rotación de proxies se gestiona automáticamente mediante la API, por lo que, a menos que se indique lo contrario, todas las solicitudes pasarán por diferentes IP. Además, se pueden enviar hasta 10 solicitudes simultáneas, lo que significa que se puede aprovechar al máximo el conjunto de proxies, extrayendo datos a una velocidad vertiginosa.

Naturalmente, WebScrapingAPI no solo ofrece proxies, sino también acceso al scraper. Así, obtienes todas las funciones de una herramienta de extracción de datos premium sin escribir una sola línea de código.

Una vez finalizada la prueba gratuita, no tendrás que gastar ni un céntimo a menos que quieras, ya que se te cambiará al paquete gratuito, con 1000 llamadas a la API al mes durante el tiempo que desees.

2. ProxyScan

ProxyScan es una colección de herramientas útiles reunidas en un único sitio web. Lo primero y más importante es la lista de proxies. Afirman tener más de 12 000 proxies en total. Aunque es una cifra impresionante, por lo que pude deducir, el número podría ser un poco menor, posiblemente porque los proxies gratuitos aparecen y desaparecen constantemente, por lo que la cifra puede variar.

De esos proxies, casi todos son SOCKS 4 o 5, y solo algo más de 100 son HTTP/S. Además, casi todos son anónimos o de élite, que son los únicos que realmente importan en el web scraping.

En cuanto a la geolocalización, ProxyScan ofrece direcciones IP de más de 100 países. Aunque no todos ellos contarán con un gran número de proxies, sigue siendo una buena cobertura. También puedes comprobar el tiempo de actividad y el ping de cada IP, lo que facilita la selección de las mejores direcciones IP.

3. Proxy-List

La idea general detrás de Proxy-List parece ser la cantidad por encima de la calidad. En total, cuentan con más de 17 000 proxies, la mayoría de los cuales son SOCKS 4. Digo que se presta menos atención a la calidad porque no se obtiene ninguna información sobre el tiempo de actividad o el ping de las IP. El sitio web actualiza sus listas cada dos horas y elimina las IP que no responden.

Al consultar sus listas, se obtiene la IP, el puerto, el nivel de anonimato y el país. En comparación con otros proveedores de esta lista, eso es algo insuficiente.

Puedes filtrar los resultados por nivel de anonimato (transparente, anónimo o élite) y por país. He observado que algunos de los países que se pueden seleccionar en el filtro en realidad no tienen ningún proxy disponible en la página web. Así que no esperes necesariamente encontrar direcciones IP de cualquier región. Dicho esto, sigue habiendo muchas opciones.

Además de navegar por sus numerosas páginas, también puedes descargar listas como texto sin formato o directamente al portapapeles. Aunque el proceso es mucho más rápido así, el archivo txt solo contiene las direcciones IP, por lo que si también quieres registrar los puertos o los países de origen, tendrás que obtenerlos directamente del sitio web. Como es de esperar, te sugiero que extraigas los datos de las páginas en lugar de obtenerlos manualmente.

4. Free Proxy

Aunque Free Proxy quizá no sea el sitio web más atractivo, cuenta con una gran cantidad de direcciones IP, sus detalles y todas las funciones de filtrado que necesitarás.

El número total de IP supera las 23 000, la mayoría de las cuales son SOCKS4/5. Estas IP se recopilan de un total de 160 países. La mayoría de las IP son de Asia, pero no tendrás ningún problema para encontrar proxies de cualquier rincón del mundo.

Si echas un vistazo a sus listas, verás una gran cantidad de información, incluyendo velocidad, tiempo de actividad, respuesta y cuánto tiempo ha pasado desde la última comprobación. Este último detalle es, de hecho, uno de los puntos débiles de este proveedor: muchas IP se comprueban con bastante poca frecuencia, y hay muchas posibilidades de encontrarte con numerosas IP inactivas, especialmente si han pasado días desde su último ping.

Para navegar, puedes filtrar por país, anonimato y protocolo. A continuación, también puedes ordenar la lista resultante por velocidad, tiempo de actividad, respuesta y «última comprobación». Así que no debería llevarte mucho tiempo encontrar lo que buscas. Además, hay un botón llamado «Exportar IP:Puerto» que te permite copiar rápidamente toda la dirección para que puedas añadirla a tu scraper.

5. Spys.one

Al igual que el proveedor anterior, Spys.one ofrece una amplia gama de IP de todo el mundo. En total, parecen tener más de 26 000 proxies, por lo que supera a Free Proxy. Pero muchas IP no se han comprobado en semanas o incluso meses, por lo que es posible que ya no funcionen.

En cuanto a la navegación, puedes elegir prácticamente cualquier criterio para filtrar la lista. Incluso puedes seleccionar por ciudad, aunque muchos proxies no tienen realmente una ciudad especificada. Por lo tanto, utiliza esa opción solo si es crucial para tu caso de uso. De lo contrario, podrías pasar por alto posibilidades valiosas.

Aunque el proveedor pueda parecer que tiene un gran número de direcciones IP, no puedo decir que me guste mucho la interfaz de usuario, por lo que conseguir todas esas direcciones IP podría ser más complicado de lo que esperas.

6. Genode

A diferencia de la mayoría de los demás sitios web de esta lista, Genode no obtiene ingresos por publicidad, sino alquilando proxies residenciales premium. Pero, además de eso, también mantienen una lista de proxies gratuitos que cualquier visitante puede utilizar.

Su lista contiene casi 5.000 proxies repartidos por un número impresionante de países. Para navegar por esta lista, puedes elegir el país, el nivel de anonimato, el protocolo de proxy, la organización, la velocidad, el tiempo de actividad y la fecha de la última comprobación. Así que, en esencia, filtras por todos los criterios diferenciadores que presentan.

Al comprobar la velocidad, obtienes un tiempo real (en milisegundos) y una barra que compara la velocidad de esa IP concreta con las demás de la lista. Además, si el tiempo de respuesta es anormalmente alto, el número aparecerá en rojo, lo que significa que probablemente sea demasiado lento para un uso adecuado.

Este tipo de pequeños detalles pueden influir en tus resultados generales, por lo que Genode merece un puesto en la lista, aunque el conjunto de proxies sea un poco reducido en comparación con el de la otra página web que he presentado.

7. Free Proxy Lists

Aunque no puedo decir que Free Proxy Lists sea el sitio web más bonito, sin duda va al grano, presentándote una extensa lista de direcciones IP.

Es digno de elogio que la plataforma cuente con proxies de 78 países diferentes, una cifra que quizá no consigas con los proveedores de servicios de pago. Por desgracia, muchos de estos países tienen menos de 10 direcciones IP cada uno. En muchos casos, solo hay un único proxy de la región.

En total, cuentan con más de 600 direcciones IP, todas ellas utilizando el protocolo HTTP o HTTPS, por lo que no tendrás suerte si necesitas SOCKS.

Pasar de una página a otra buscando el proxy adecuado puede resultar aburrido rápidamente, pero el sitio web te permite filtrar los resultados por país, puerto, protocolo, anonimato y tiempo de actividad. También puedes ver sus velocidades de respuesta y transferencia representadas por barras de carga de colores. Aunque no son muy explicativas, pueden ayudarte a elegir las direcciones IP más rápidas.

Elige tus proxies con prudencia

Aunque entiendo el atractivo de los proxies gratuitos y te recomiendo que al menos los pruebes, recuerda que tu tiempo también es un recurso. De hecho, puede ser más valioso que el dinero.

Déjame explicarlo con más detalle: ir cambiando entre miles de proxies gratuitos puede reducir los costes, ya que no estás pagando por proxies premium, pero requerirá una atención constante por tu parte. La IP a menudo dejará de funcionar o será bloqueada, y entonces tendrás que encontrar una nueva lista y añadirla a tu script. A medida que aparezcan nuevas IP gratuitas, tendrás que añadirlas, ya que las antiguas, tarde o temprano, dejarán de funcionar.

En esencia, los proxies gratuitos ahorran dinero, pero requieren un trabajo repetitivo. Recomendaría a cualquier entusiasta del scraping que creara al menos un scraper y lo utilizara con proxies gratuitos, ya que es una excelente experiencia de aprendizaje. Sin embargo, después de eso, es posible que solo quieras datos precisos entregados a tiempo, con poca o ninguna intervención humana.

Esa es la idea detrás de WebScrapingAPI. Hemos creado una API REST para que haga la mayor parte del trabajo por ti, de modo que puedas concentrarte en aprovechar los datos al máximo. Si aún no lo has hecho, ¡comienza tu prueba gratuita de WebScrapingAPI para tener en tus manos un scraper de primera categoría con proxies infalibles!

Acerca del autor
Robert Munceanu, Desarrollador full-stack @ WebScrapingAPI
Robert MunceanuDesarrollador full-stack

Robert Munceanu es desarrollador full stack en WebScrapingAPI, donde colabora en todas las áreas del producto y ayuda a crear herramientas y funciones fiables que respaldan la plataforma.

Empieza a crear

¿Estás listo para ampliar tu recopilación de datos?

Únete a más de 2000 empresas que utilizan WebScrapingAPI para extraer datos de la web a escala empresarial sin ningún gasto de infraestructura.