Ventajas e inconvenientes de los proxies gratuitos
En primer lugar, son gratuitas. Es algo obvio, pero supone una ventaja importante. Piénsalo: puedes seguir cualquiera de las guías de nuestro blog, programar tu rastreador y luego utilizarlo junto con los proxies.
Hay mucho que decir sobre las ventajas de los proxies en el web scraping, y no las vamos a tratar en este artículo. Pero, si quieres saber más, echa un vistazo a este artículo sobre la rotación de proxies, en el que mostramos la gran diferencia que puede suponer un conjunto de direcciones IP.
Por desgracia, esa es prácticamente la única ventaja que tienen los proxies gratuitos frente a los demás. Pasemos ahora a los inconvenientes.
Dado que estas direcciones IP son de libre acceso, todo el mundo las conoce. Por lo tanto, es probable que los sitios web ya conozcan esas direcciones y las hayan bloqueado. O bien alguien ya intentó acceder al sitio web que te interesa y provocó que se bloqueara la IP, o bien el administrador del sitio web encontró el proveedor de proxies gratuito, copió todas las direcciones IP y las añadió a una lista negra. No siempre es así, pero ocurre a menudo.
Las direcciones IP gratuitas suelen ser lentas y carecen de anonimato. El mantenimiento de los servidores proxy cuesta dinero, por lo que no se puede esperar realmente obtener direcciones IP de primera calidad sin coste alguno. Como dice el refrán, se obtiene lo que se paga.
Los proxies gratuitos pueden exponerte a los piratas informáticos. Como acabo de decir, resulta un poco extraño que alguien ofrezca direcciones gratuitas a cambio de nada. Una de las razones malintencionadas por las que alguien podría hacer esto es para vigilar y copiar la información que pasa por el proxy. Después, podrían utilizar esa información con fines maliciosos. Insisto, no es algo seguro, pero debes mantenerte alerta.
1. WebScrapingAPI

El principal factor que distingue a WebScrapingAPI del resto de proveedores de esta lista es que la API solo utiliza proxies premium. Esto incluye tanto direcciones IP residenciales como de centros de datos, con numerosas opciones de geolocalización (7 para centros de datos, 40 para residenciales y más de 200 para planes personalizados). Aunque hay planes de pago, que van desde los 20 $ hasta los 200 $, cualquier usuario nuevo recibe un periodo de prueba gratuito de dos semanas, durante el cual puede utilizar cualquiera de las funciones de la API.
La API gestiona automáticamente la rotación de proxies, por lo que, a menos que se indique lo contrario, todas las solicitudes se enviarán a través de direcciones IP diferentes. Además, puedes enviar hasta 10 solicitudes simultáneas, lo que significa que puedes aprovechar al máximo el conjunto de proxies y extraer datos a una velocidad vertiginosa.
Por supuesto, WebScrapingAPI no solo ofrece proxies, sino también acceso al rastreador. Así, dispones de todas las funciones de una herramienta de extracción de datos de primera categoría sin tener que escribir ni una sola línea de código.
Una vez finalizado el periodo de prueba gratuito, no tendrás que gastar ni un céntimo a menos que quieras, ya que se te cambiará al plan gratuito, con 1000 llamadas a la API al mes durante todo el tiempo que desees.
2. ProxyScan

ProxyScan es un conjunto de herramientas útiles reunidas en un único sitio web. Lo más destacado es la lista de proxies. Afirman contar con más de 12 000 proxies en total. Aunque se trata de una cifra impresionante, por lo que he podido deducir, el número podría ser algo menor, quizá porque los proxies gratuitos aparecen y desaparecen constantemente, por lo que la cifra puede variar.
De esos servidores proxy, casi todos son SOCKS 4 o 5, y solo algo más de 100 son HTTP/S. Además, casi todos son anónimos o de élite, que son los únicos que realmente importan en el web scraping.
En cuanto a la geolocalización, ProxyScan ofrece direcciones IP de más de 100 países. Aunque no todos ellos cuentan con un gran número de proxies, la cobertura sigue siendo buena. También puedes comprobar el tiempo de actividad y el ping de cada dirección IP, lo que facilita la selección de las mejores.
3. Lista de proxies

La idea general detrás de Proxy-list parece ser que prima la cantidad sobre la calidad. En total, cuentan con más de 17 000 proxies, la mayoría de los cuales son SOCKS 4. Digo que se presta menos atención a la calidad porque no se ofrece ninguna información sobre el tiempo de actividad ni el ping de las direcciones IP. La página web actualiza sus listas cada dos horas y elimina las direcciones IP que no responden.
Al consultar sus listas, se puede ver la dirección IP, el puerto, el nivel de anonimato y el país. En comparación con otros proveedores de esta lista, la información es algo escasa.
Puedes filtrar los resultados por nivel de anonimato (transparente, anónimo o élite) y por país. Me he dado cuenta de que algunos de los países que se pueden seleccionar en el filtro no tienen, en realidad, ningún proxy disponible en la página web. Por lo tanto, no esperes necesariamente encontrar direcciones IP de cualquier región. Dicho esto, sigue habiendo muchas opciones.
Además de navegar por sus numerosas páginas, también puedes descargar las listas en formato de texto sin formato o directamente al portapapeles. Aunque el proceso es mucho más rápido de esta manera, el archivo txt solo contiene las direcciones IP, por lo que, si también quieres registrar los puertos o los países de origen, tendrás que obtenerlos directamente del sitio web. Como es de esperar, te recomiendo extraer los datos de las páginas en lugar de recopilarlos manualmente.
4. Proxy gratuito

Aunque Free Proxy quizá no sea la página web más atractiva, cuenta con una gran cantidad de direcciones IP, información detallada sobre ellas y todas las funciones de filtrado que puedas necesitar.
El número total de direcciones IP supera las 23 000, la mayoría de las cuales son SOCKS4/5. Estas direcciones IP proceden de un total de 160 países. La mayoría de las direcciones IP son de Asia, pero no tendrás ningún problema para encontrar proxies de cualquier rincón del mundo.
Si echas un vistazo a sus listas, verás una gran cantidad de información, como la velocidad, el tiempo de actividad, la respuesta y cuánto tiempo ha pasado desde la última comprobación. Este último detalle es, de hecho, uno de los puntos débiles de este proveedor: muchas direcciones IP se comprueban con muy poca frecuencia, y es muy probable que te encuentres con muchas direcciones IP inactivas, sobre todo si han pasado varios días desde el último ping.
Para navegar, puedes filtrar por país, anonimato y protocolo. Además, puedes ordenar la lista resultante por velocidad, tiempo de actividad, tiempo de respuesta y «última comprobación». Así que no debería tardar mucho en encontrar lo que buscas. Asimismo, hay un botón llamado «Exportar IP:Puerto» que te permite copiar rápidamente la dirección completa para añadirla a tu rastreador.
5. Spys.one

Al igual que el proveedor anterior, Spys.one ofrece una amplia gama de direcciones IP de todo el mundo. En total, parece que cuentan con más de 26 000 proxies, por lo que supera a Free Proxy. Sin embargo, muchas direcciones IP no se han comprobado desde hace semanas o incluso meses, por lo que es posible que ya no funcionen.
En cuanto a la navegación, puedes elegir prácticamente cualquier criterio para filtrar la lista. Incluso puedes seleccionar por ciudad, aunque muchos proxies no tienen una ciudad específica. Por lo tanto, utiliza esa opción solo si es imprescindible para tu caso concreto. De lo contrario, podrías pasar por alto opciones interesantes.
Aunque el proveedor parezca tener un gran número de direcciones IP, no me convence demasiado su interfaz de usuario, por lo que conseguir todas esas direcciones podría resultar más complicado de lo que cabría esperar.
6. Genode

A diferencia de la mayoría de los demás sitios web de esta lista, Genode no obtiene ingresos por publicidad, sino mediante el alquiler de proxies residenciales premium. Sin embargo, además de eso, también mantienen una lista de proxies gratuitos que cualquier visitante puede utilizar.
Su lista contiene casi 5.000 servidores proxy repartidos por un número impresionante de países. Para navegar por esta lista, puedes seleccionar el país, el nivel de anonimato, el protocolo del servidor proxy, la organización, la velocidad, el tiempo de actividad y la fecha de la última comprobación. En definitiva, puedes filtrar según todos los criterios de diferenciación que ofrecen.
Al comprobar la velocidad, se muestra un tiempo real (en milisegundos) y una barra que compara la velocidad de esa IP concreta con la de las demás de la lista. Además, si el tiempo de respuesta es anormalmente largo, la cifra aparecerá en rojo, lo que indica que probablemente sea demasiado lenta para un uso adecuado.
Este tipo de pequeños detalles pueden influir en los resultados generales, por lo que Genode merece un puesto en la lista, aunque su conjunto de proxies sea un poco reducido en comparación con el de la otra página web que he presentado.
7. Listas de proxies gratuitos

Aunque no puedo decir que Free Proxy Lists sea la página web más bonita, sin duda va al grano y te ofrece una amplia lista de direcciones IP.
Es digno de elogio que la plataforma cuente con proxies de 78 países diferentes, una cifra que quizá no se encuentre en los proveedores de servicios de pago. Por desgracia, muchos de estos países tienen menos de 10 direcciones IP cada uno. En muchos casos, solo hay un único proxy por región.
En total, cuentan con más de 600 direcciones IP, todas ellas con el protocolo HTTP o HTTPS, por lo que no te servirá de nada si necesitas SOCKS.
Pasar de una página a otra buscando el proxy adecuado puede resultar aburrido enseguida, pero la página web te permite filtrar los resultados por país, puerto, protocolo, nivel de anonimato y tiempo de actividad. También puedes ver sus velocidades de respuesta y transferencia representadas mediante barras de carga de colores. Aunque no son muy explicativas, pueden ayudarte a elegir las direcciones IP más rápidas.
Elige bien tus proxies
Aunque entiendo el atractivo de los proxies gratuitos y te recomiendo que al menos los pruebes, recuerda que tu tiempo también es un recurso. De hecho, puede que sea más valioso que el dinero.
Te lo explico con más detalle: alternar entre miles de proxies gratuitos puede reducir los costes, ya que no estás pagando por proxies premium, pero te exigirá una atención constante. Las direcciones IP suelen dejar de funcionar o ser bloqueadas, por lo que tendrás que buscar una nueva lista e incorporarla a tu script. A medida que aparezcan nuevas direcciones IP gratuitas, tendrás que añadirlas, ya que las antiguas dejarán de funcionar tarde o temprano.
En esencia, los proxies gratuitos permiten ahorrar dinero, pero requieren cierto trabajo repetitivo. Recomendaría a cualquier aficionado al scraping que creara al menos un scraper y lo utilizara con proxies gratuitos, ya que es una experiencia de aprendizaje excelente. Sin embargo, una vez hecho esto, es posible que lo que busques sea disponer de datos precisos y puntuales, con poca o ninguna intervención humana.
Esa es la idea en la que se basa WebScrapingAPI. Hemos creado una API REST para que se encargue de la mayor parte del trabajo, de modo que puedas concentrarte en aprovechar al máximo los datos. Si aún no lo has hecho, ¡comienza tu prueba gratuita de WebScrapingAPI para disfrutar de un rastreador de primera categoría con proxies totalmente seguros!




