Volver al blog
Guías
Robert MunceanuLast updated on May 12, 202611 min read

Cómo probar proxies: 6 métodos prácticos

Cómo probar proxies: 6 métodos prácticos
En resumen: los proxies defectuosos salen caros. Agotan el ancho de banda, provocan bloqueos y corrompen silenciosamente los datos de los que dependen tus rastreadores. Esta guía muestra cómo probar proxies en función de cinco indicadores de estado (conectividad, IP de salida, velocidad, anonimato y reputación) utilizando ping, curl, herramientas de comprobación en línea, bases de datos de IP y un script de Python reutilizable que puedes integrar en tu canalización de integración continua (CI).

Si alguna vez has visto cómo un scraper fallaba silenciosamente a las 3 de la madrugada porque la mitad de sus proxies dejaron de responder, ya sabes por qué es importante aprender a probar los proxies antes de que entren en contacto con el tráfico de producción. La prueba de proxies es el proceso de verificar que un proxy realmente ofrece lo que anuncia su proveedor: un host accesible, la IP de salida correcta, una latencia aceptable, un nivel de anonimato creíble y una reputación limpia que los sitios de destino no bloqueen automáticamente.

Esto es válido tanto para los grupos de proxies gratuitos como para los de pago. Las listas de proxies gratuitos son notoriamente volátiles, e incluso los planes premium residenciales o de centros de datos se benefician de una rápida comprobación previa, ya que las configuraciones varían, las puertas de enlace rotan y los plazos del SLA suelen ser cortos.

En esta guía repasaremos seis métodos concretos para probar proxies, desde una línea ping hasta un script de pruebas de Python reutilizable, además de una matriz de decisión que te indica qué método utilizar en cada caso. Todas las recetas están listas para copiar y pegar, y cada comando da por hecho que te preocupa más detectar problemas que contar herramientas.

Por qué es importante probar los proxies antes de que entren en contacto con el tráfico de producción

Un proxy defectuoso rara vez pasa desapercibido. Se manifiesta en forma de scrapes fallidos, cuentas bloqueadas, geolocalización misteriosamente errónea o páginas que parecen CAPTCHAs en lugar de productos. Incluso los proxies premium se benefician de una rápida comprobación previa, ya que los errores de configuración (puerto incorrecto, protocolo incorrecto, credenciales caducadas) representan una proporción sorprendente de los fallos en el mundo real. Considera las pruebas de proxies como un seguro barato: unos pocos segundos de curl ahora ahorran horas de depuración de un rastreo de 30 000 páginas más adelante, independientemente de si el grupo de proxies es gratuito o de pago.

Cómo probar proxies: las cinco señales de estado que toda comprobación debe cubrir

La mayoría de las guías sobre cómo probar proxies te ofrecen una lista genérica de herramientas. Un modelo más útil son las cinco señales de estado que todo proxy debe superar:

  1. Conectividad. El servidor proxy acepta una conexión TCP en el puerto anunciado.
  2. IP de salida y ubicación geográfica. El tráfico sale desde la IP, el país y el ISP que esperas.
  3. Velocidad y latencia. El tiempo de ida y vuelta está dentro de tu margen de tolerancia para el sitio de destino.
  4. Nivel de anonimato. El proxy oculta tu IP real y no se da a conocer.
  5. Tipo de IP y reputación. La IP es del tipo adecuado y no está en la lista negra.

Método 1: Confirma la conectividad con ping y un curl rápido

Empieza con la comprobación más sencilla. Desde tu terminal:

ping pr.example-proxy.com
curl -x http://proxy.example.com:8000 https://httpbin.org/ip --connect-timeout 10

Un ping devuelve métricas de tiempo de respuesta, lo que te indica que el host está activo. La curl llamada va un paso más allá: en realidad enruta una solicitud a través del proxy y muestra la IP de salida que httpbin.org/ip ha visto. Si obtienes una IP diferente a la real, el proxy HTTP está reenviando el tráfico.

El ping por sí solo no es suficiente. Solo confirma la accesibilidad del host, no si el proxy aceptará tráfico HTTP o SOCKS, te autenticará o mostrará el sitio de destino sin un CAPTCHA.

Método 2: Verifica la IP de salida con un verificador de IP en línea

Configura tu navegador o shell para usar el proxy y carga cualquier página genérica de comprobación de IP. La página revelará la IP pública desde la que sale tu solicitud, además del país, la ciudad y el proveedor de servicios de Internet (ISP).

Tres cosas que debes comprobar: que el país coincida con lo que te vendió tu proveedor, que el ISP sea plausible para el tipo de proxy (ASN residencial para planes residenciales, no un ASN de centro de datos) y que la página no haya marcado ya la IP como un proxy conocido. Los verificadores en línea son limitados, así que combina esta prueba de humo con las comprobaciones de la base de datos del Método 3.

Método 3: Verificar el tipo de IP y su reputación con bases de datos

Aquí son importantes dos tipos diferentes de bases de datos, y confundirlas es un error común.

Las bases de datos de ubicación y tipo de IP, como IP2Location y MaxMind, te indican cómo es una IP: país, ASN y si parece pertenecer a un centro de datos o a una conexión residencial. Si has comprado proxies residenciales y MaxMind clasifica la IP como de centro de datos, tu sitio de destino detectará la misma señal y te bloqueará más rápido.

Las bases de datos de reputación de IP, como AbuseIPDB, te indican si la IP se ha comportado de forma indebida: informes de spam, abuso de scraping, intentos de fuerza bruta o historial de DDoS. Una IP residencial puede parecer impecable en MaxMind y, aun así, tener un montón de informes de abuso recientes. Una mala reputación activa bloqueos automáticos en muchos WAF, así que considera la reputación como una prueba de proxy de primer orden.

Método 4: Utiliza un verificador de proxy basado en web para comprobar la velocidad y el anonimato

Los comprobadores web van más allá de una simple página de IP. Herramientas como FOGLDN Proxy Tester y hidemy.name informan sobre la velocidad y el anonimato. Según la documentación actual, cabe esperar compatibilidad con HTTP, HTTPS y, en algunos casos, SOCKS, además de una lectura de anonimato de cuatro niveles:

  • Sin anonimato: el destino ve tu IP real y el proxy.
  • Anonimato bajo: se detecta el proxy, pero tu IP real queda oculta.
  • Anonimato medio: el destino recibe una IP falsa, pero sigue detectando el proxy.
  • Anonimato alto (de élite): no se detecta ni tu IP real ni el proxy.

Una regla innegociable: nunca pegues credenciales autenticadas en una herramienta web de terceros. Utiliza el Método 5 para cualquier proxy que requiera un nombre de usuario y una contraseña.

Método 5: Prueba los proxies autenticados de forma segura desde la línea de comandos

Para los proxies autenticados, la línea de comandos es el único lugar sensato. Las credenciales permanecen en tu equipo y accedes a la URL exacta que planeas rastrear, no httpbin.org.

Proxy HTTP/HTTPS:

curl -x http://YOUR_USERNAME:YOUR_PASSWORD@proxy.your-provider.com:PORT \
     -L https://target-website.com \
     --connect-timeout 10 --head

proxy SOCKS5 (fíjate en la --socks5-hostname , que fuerza la resolución de DNS a través del proxy):

curl --socks5-hostname YOUR_USERNAME:YOUR_PASSWORD@proxy.your-provider.com:PORT \
     -L https://target-website.com \
     --connect-timeout 10 --head

El manual oficial de curl documenta ambas opciones. -L sigue las redirecciones, --head mantiene las respuestas ligeras, --connect-timeout 10 elimina los hosts inactivos. Así es como se prueban los proxies con autenticación sin filtrar credenciales: HTTP/2 200 OK es la luz verde; 407, 403 o un tiempo de espera agotado son señales reales, no ruido que requiera un nuevo intento.

Método 6: Crea un pequeño script en Python para pruebas de proxy repetibles

Para más de un puñado de proxies, los scripts son la mejor opción. La forma más fiable de probar proxies a gran escala es tu propio verificador: accede a una URL conocida, valida el estado y el cuerpo, registra la latencia y guarda los datos en un CSV.

import csv, time, requests
PROXIES = ["http://user:pass@p1.example.com:8000"]
TARGET, EXPECT = "https://target.example.com/page", "expected text"
w = csv.writer(open("report.csv", "w", newline=""))
for p in PROXIES:
    t0 = time.perf_counter()
    try:
        r = requests.get(TARGET, proxies={"http": p, "https": p}, timeout=30)
        ok = r.status_code == 200 and EXPECT in r.text.lower()
        w.writerow([p, r.status_code, int((time.perf_counter()-t0)*1000), ok])
    except Exception as e:
        w.writerow([p, "ERR", "", False, str(e)[:80]])

Utiliza un tiempo de espera de unos 10 segundos para los proxies de centros de datos, y de hasta 30 segundos para los residenciales. La validación del cuerpo es la parte que la mayoría de los probadores se saltan: es la diferencia entre hacer ping a las IP y saber realmente cómo probar los proxies frente al objetivo real.

¿Qué método de prueba de proxies deberías utilizar? Una matriz de decisión rápida

Los diferentes escenarios merecen diferentes pruebas. Esta matriz sustituye la habitual tabla plana de pros y contras por una visión centrada en la decisión.

Escenario

Método(s) recomendado(s)

Comprobación puntual de un proxy gratuito

Método 1 (ping + curl), Método 2 (comprobador de IP)

Pool autenticado de pago, preimplementación

Método 5 (autenticación curl), Método 3 (reputación)

Puerta de enlace rotativa con sesiones persistentes

Método 6 (bucle Python), Método 3

Rastreo geolocalizado (p. ej., solo EE. UU.)

Método 2 + Método 3 (validación de país de MaxMind)

Perfil de velocidad y anonimato

Método 4 (comprobador web), Método 6

Cómo interpretar los resultados fallidos o ruidosos de las pruebas de proxy

Los diferentes modos de fallo requieren soluciones diferentes. Identifica la causa y actúa en consecuencia.

  • Tiempo de espera agotado: el proxy está inactivo, sobrecargado o bloqueado en la capa de red.
  • HTTP 407: la autenticación es incorrecta, ha caducado o tiene un formato incorrecto.
  • HTTP 403 o 429: el destino está bloqueando o limitando la velocidad de esa IP.
  • HTML de CAPTCHA en el cuerpo: se ha identificado el proxy; cámbialo.
  • País incorrecto en la IP de salida: la configuración de geolocalización o de sesión persistente está desactivada.

Nuestra guía de errores de estado del proxy asocia cada código HTTP a una solución concreta.

De pruebas puntuales a la supervisión continua del estado del proxy

La calidad de los proxies no es estática. Las listas gratuitas pueden pasar una comprobación y fallar diez minutos después, e incluso las puertas de enlace residenciales rotativas dejan de ser válidas con el tiempo. Programa el script de Python del Método 6 en un cron, intégralo en la CI de tu scraper y apóyate en un flujo de trabajo de gestión de proxies para que las nuevas pruebas, la rotación y la retirada se realicen automáticamente.

Puntos clave

  • Cualquiera que aprenda a probar proxies debe comprobar cinco cosas, no solo una: conectividad, IP de salida, velocidad, anonimato y reputación de la IP.
  • ping y una curl -x confirmar que se puede acceder a un proxy, pero no dice nada sobre si el sitio de destino lo aceptará.
  • Utiliza bases de datos de IP como MaxMind para el tipo y servicios al estilo de AbuseIPDB para la reputación; una IP residencial marcada como centro de datos queda efectivamente quemada.
  • Prueba los proxies autenticados localmente con curl (HTTP y --socks5-hostname para SOCKS5) para que las credenciales nunca salgan de tu máquina.
  • Para cualquier cosa que supere un puñado de proxies, un pequeño script de Python con validación del cuerpo, tiempos de espera y registro en CSV superará en rendimiento a cualquier herramienta de interfaz de usuario.

Preguntas frecuentes

¿Con qué frecuencia debo volver a probar los proxies de un grupo rotativo?

Vuelve a comprobar de forma pasiva en cada solicitud y de forma activa según un calendario. Trata cualquier 407, 403, 429, tiempo de espera o cuerpo inesperado como una señal de estado en tiempo real y pon en cuarentena la IP problemática. Además, realiza un barrido completo del grupo cada 15 a 60 minutos para listas gratuitas o compartidas, y al menos una vez al día para planes residenciales de pago o de centros de datos.

¿Por qué mi proxy pasa una comprobación en línea pero falla en mi sitio de destino?

Los verificadores en línea acceden a una URL de prueba genérica, no a tu sitio de destino. El proxy puede ser accesible y anónimo en general, pero seguir estando en la lista de denegados del sitio de destino, haber sido identificado por su sistema antibots o tener limitada la velocidad de acceso para ese dominio. Confirma siempre que un proxy funciona con el sitio real que pretendes rastrear, idealmente en una página representativa en lugar de la página de inicio.

¿Cuál es la diferencia en la práctica entre los proxies transparentes, anónimos y de élite?

Los proxies transparentes reenvían tu IP real en encabezados como X-Forwarded-For, por lo que el destino ve tanto a ti como al proxy. Los proxies anónimos ocultan tu IP, pero siguen exponiendo los encabezados relacionados con el proxy, por lo que el destino sabe que se está utilizando un proxy. Los proxies de élite (de alto anonimato) eliminan esas señales: el servidor de destino no detecta ni tu IP real ni ningún indicio de que haya un proxy involucrado.

¿Es seguro pegar credenciales de proxy autenticadas en un comprobador de proxies web?

No. Pegar user:pass@host:port en un formulario web de terceros envía esas credenciales a un servidor que no controlas, y muchas de esas herramientas registran las solicitudes con fines analíticos. Para los proxies autenticados, utiliza la línea de comandos con curl o ejecuta un script local de Python. Reserva los comprobadores web para proxies abiertos no autenticados, donde la filtración de credenciales no es un problema.

¿Cómo puedo probar un proxy SOCKS5 desde la línea de comandos?

Utiliza curl --socks5-hostname user:pass@host:port -L https://target.example.com --connect-timeout 10 --head. El --socks5-hostname opción fuerza la resolución de DNS a través del proxy, lo que evita que tu resolutor local filtre el nombre de host. Añade -v si necesitas ver el protocolo de enlace SOCKS. Una HTTP/2 200 OK respuesta significa que tanto el túnel SOCKS5 como la autenticación funcionan.

Conclusión

Saber cómo probar los proxies consiste principalmente en sustituir las ilusiones por cinco comprobaciones concretas. Confirma que se puede acceder al host, confirma la IP de salida y la ubicación geográfica, mide la velocidad, verifica el nivel de anonimato y comprueba el tipo de IP y su reputación. Utiliza ping y herramientas básicas curl para comprobaciones puntuales, bases de datos de IP para el tipo y la reputación, herramientas de prueba web (con cuidado) para lecturas de velocidad y anonimato sin autenticación, la línea de comandos curl para proxies HTTP y SOCKS5 autenticados, y un pequeño script de Python para cualquier cosa que requiera escalabilidad. Interpreta las señales de fallo en lugar de reintentar a ciegas, e integra las nuevas pruebas en la CI de tu scraper para que el estado del proxy se supervise, no se dé por sentado.

Si prefieres evitar por completo la carga de las pruebas y la rotación, la red de proxies residenciales de WebScrapingAPI se encarga de la rotación de IP, la segmentación geográfica y el mantenimiento de la reputación detrás de un único punto de acceso, de modo que tu rastreador vea salidas limpias en lugar de un CSV de hosts inactivos. En cualquier caso, adquiere el hábito de probar los proxies antes de que entren en producción. Tu yo de guardia en el futuro te lo agradecerá.

Acerca del autor
Robert Munceanu, Desarrollador full-stack @ WebScrapingAPI
Robert MunceanuDesarrollador full-stack

Robert Munceanu es desarrollador full stack en WebScrapingAPI, donde colabora en todas las áreas del producto y ayuda a crear herramientas y funciones fiables que respaldan la plataforma.

Empieza a crear

¿Estás listo para ampliar tu recopilación de datos?

Únete a más de 2000 empresas que utilizan WebScrapingAPI para extraer datos de la web a escala empresarial sin ningún gasto de infraestructura.