Volver al blog
La ciencia del web scraping
Raluca PenciucLast updated on May 13, 202613 min read

¿Qué son los proxies rotatorios? Guía de rotación de IP para Web Scraping

¿Qué son los proxies rotatorios? Guía de rotación de IP para Web Scraping
En resumen: ¿Qué son los proxies rotativos, en pocas palabras? Son servidores proxy que asignan una IP diferente a cada solicitud a partir de un conjunto gestionado; así es como los rastreadores eluden los límites de velocidad por IP, los CAPTCHA y los filtros geográficos. Esta guía explica cómo funciona la rotación, los cuatro tipos de conjuntos, el código de configuración en tres lenguajes y cómo elegir un proveedor.

¿Qué son los proxies rotativos? En una frase: servidores proxy que cambian automáticamente tu IP de salida de un conjunto gestionado, ya sea en cada solicitud o tras un intervalo de tiempo configurable. Ese sencillo truco es lo que hace que el scraping web a gran escala, el seguimiento de SERP y la verificación de anuncios sean viables sin que tus scrapers sean bloqueados tras las primeras cientos de solicitudes.

Si has dedicado algo de tiempo al scraping, habrás experimentado el modo de fallo. Una IP, un User-Agent fijo, y el sistema antibots del objetivo te cierra la puerta en menos de un minuto. Un proxy rotativo soluciona la mitad del problema relacionada con la IP al distribuir las solicitudes entre muchas direcciones, de modo que ninguna IP individual parezca lo suficientemente sospechosa como para ser bloqueada.

Esta guía es la versión práctica del tema. Definiremos qué es un proxy rotativo, lo diferenciaremos de los proxies estáticos y las VPN, repasaremos los cuatro tipos de pools que verás hoy, mostraremos código de configuración funcional en cURL, Python y Node.js, y terminaremos con una lista de verificación para el comprador y los errores comunes que frustran la rotación en la práctica.

¿Qué son los proxies rotativos? Una definición en lenguaje sencillo

Un proxy rotativo es un servidor proxy que asigna automáticamente una IP de salida diferente a cada solicitud, o tras un intervalo de tiempo establecido, seleccionándola de un conjunto gestionado de direcciones. En lugar de enrutar tu tráfico a través de una IP fija, el proveedor se sitúa entre tú y el sitio de destino, cambia la IP sobre la marcha y expone un único punto de acceso de puerta de enlace a tu código.

Así que, cuando los desarrolladores preguntan qué son los proxies rotativos en términos prácticos, la respuesta breve es: una forma de distribuir las solicitudes entre muchas IP sin tener que escribir su propia lógica de rotación. Esa única elección arquitectónica es lo que hace que el scraping a gran escala, las pruebas geodistribuidas y la evasión de bots sean viables para un equipo pequeño.

Proxies rotativos frente a estáticos: diferencias clave

Aspecto

Proxy rotativo

Proxy estático

IP por solicitud

Nueva IP de un grupo

La misma IP fija

Persistencia de sesión

Solo con modo sticky

Sí, por defecto

Resistencia a los bloqueos

Alta

Baja una vez marcado

Modelo de costes

Por GB o por solicitud

Por IP al mes

Ideal para

Rastreo, SERP, monitorización

Inicios de sesión, aplicaciones de cuentas

Un proxy de sesión fija es el término medio: un proveedor rotativo que asigna la misma IP durante un intervalo de tiempo configurable. La mayoría de los debates entre proxies estáticos y rotativos se desvanecen en cuanto te das cuenta de que las sesiones fijas cubren esa brecha.

Cómo funciona realmente la rotación de proxies (basada en solicitudes frente a basada en tiempo)

La rotación funciona en uno de dos modos. La rotación basada en solicitudes cambia la IP de salida en cada nueva conexión TCP. La puerta de enlace del proveedor acepta tu solicitud, elige una IP del grupo, abre una conexión con el destino y devuelve la respuesta. La siguiente solicitud se dirige a una IP diferente.

La rotación basada en el tiempo, o modo de sesión persistente, mantiene la misma IP durante un intervalo configurable, normalmente de 30 segundos a 30 minutos. Para activarla, hay que añadir un ID de sesión al nombre de usuario del proxy, lo que indica a la puerta de enlace que mantenga esa sesión en una IP de origen hasta que expire el intervalo. En ambos modos, la lógica de rotación reside en la puerta de enlace de conexión inversa del proveedor, por lo que nunca se toca la lista de proxies subyacente.

Tipos de proxies rotativos

La composición del grupo varía, al igual que la fiabilidad, la velocidad y el precio. Las cuatro categorías que encontrarás hoy en día son residenciales, de centros de datos, móviles y de ISP. Las definiciones de los proveedores siguen variando entre unos y otros.

Proxies residenciales rotativos

Los proxies residenciales rotativos se nutren de las IP que los ISP asignan a hogares reales. Dado que la IP está registrada a nombre de un suscriptor real, los servidores finales no pueden detectar fácilmente que hay un proxy delante de ti, y la rotación hace que el tráfico parezca provenir de muchos usuarios residenciales distintos en lugar de un único cliente activo. Esa es la señal de confianza práctica más alta, solo superada por la de los móviles. La contrapartida es el coste y la velocidad: el ancho de banda residencial es más difícil de obtener que la capacidad de los centros de datos, por lo que los precios por GB son más elevados. Elige un proveedor con un conjunto de direcciones basado en el consentimiento transparente, ya que la situación legal de tu rastreador depende de ello.

Proxies de centros de datos rotativos

Los proxies de centros de datos rotativos se emiten desde servidores en la nube o en instalaciones de alojamiento. Son rápidos y baratos, por lo que dominan el scraping ligero y el rastreo de gran volumen contra objetivos menos defendidos. Pero cada IP de centro de datos lleva un ASN que los sistemas antibots pueden identificar, y los proveedores que se toman en serio la prohibición de proxies pueden bloquear rangos enteros de forma generalizada. Úsalos cuando la velocidad importe más que el sigilo, y ten preparada una alternativa residencial para el momento en que tu tasa de éxito baje.

Proxies móviles rotativos

Los proxies móviles rotativos se enrutan a través de IP asignadas por los operadores de telefonía móvil. Dado que los operadores reutilizan la misma IP entre muchos suscriptores mediante CGNAT, las direcciones móviles son muy difíciles de identificar como un único actor. Algunos proveedores las describen como casi indetectables, aunque eso depende del objetivo y del resto de tu huella digital. Son la opción más lenta y cara, así que resérvalas para los objetivos más difíciles, como las plataformas sociales y los lanzamientos de zapatillas.

Proxies ISP rotativos

Los proxies ISP rotativos se sitúan a medio camino: alojados en un centro de datos pero registrados a nombre de un ISP real, lo que les permite mantener la velocidad del centro de datos al tiempo que heredan una señal de confianza más cercana a la de una conexión residencial. Las definiciones de los proveedores sobre esta categoría aún están en evolución en el momento de redactar este artículo, así que confirma cómo clasifica un proveedor un determinado grupo de direcciones antes de comprometer tu presupuesto.

Cuándo y por qué utilizar un proxy rotativo

Rara vez se necesita un proxy rotativo para una única solicitud curl. Se necesita uno cuando un flujo de trabajo supera dos umbrales: un volumen suficiente como para que una sola IP sufra una limitación de velocidad, o una sensibilidad suficiente como para que el objetivo identifique a los clientes. Entonces, ¿para qué sirven realmente los proxies rotativos? Utilícelos según la tarea:

  • Scraping a gran escala y monitorización de precios. Residencial para catálogos protegidos, de centro de datos para el resto.
  • Seguimiento de SERP y resultados de búsqueda. Residencial rotativo o ISP; los motores de búsqueda marcan agresivamente los rangos de centros de datos.
  • Verificación de anuncios y protección de marca. Residenciales rotativos con segmentación geográfica por mercado.
  • Compra de zapatillas y venta de entradas. Móviles rotativos; esos sitios se basan más en la reputación de la IP.
  • Automatización de redes sociales. Móviles rotativos con sesiones persistentes por cuenta.
  • Pruebas de control de calidad y localización. Cualquier tipo de rotación con controles geográficos a nivel de país.

Ventajas e inconvenientes de los proxies rotativos de un vistazo

¿Qué te aportan los proxies rotativos en la práctica? Aquí tienes un análisis honesto.

Ventajas

  • Alta resistencia a los bloqueos de IP, ya que el tráfico se distribuye entre muchas direcciones.
  • Fáciles de escalar; el proveedor gestiona el conjunto por ti.
  • Diversidad geográfica integrada para datos específicos de cada región.
  • A menudo, la única forma práctica de superar los límites de velocidad por IP y los CAPTCHAs.

Contras

  • Más lento por solicitud que un proxy estático en la misma ruta.
  • No es adecuado para sesiones con inicio de sesión sin modo persistente.
  • Mayor coste por GB que los proxies de centros de datos estáticos.
  • Más difícil de depurar, ya que rara vez dos fallos comparten una misma IP.

Cómo configurar un proxy rotativo (con ejemplos de código)

El patrón es el mismo en todas las pilas: dirige tu cliente HTTP a la puerta de enlace de un proveedor, autentícate con tu nombre de usuario y contraseña, y deja que el proveedor rote las IP. Para fijar una sesión persistente, añade un ID de sesión al nombre de usuario. Así es como se ven los proxies rotativos en código.

cURL

curl --proxy "http://USER-session-12345:PASS@gateway.example.com:8000" \
     https://httpbin.org/ip

Python (requests)

import requests

proxy = "http://USER-session-12345:PASS@gateway.example.com:8000"
proxies = {"http": proxy, "https": proxy}

r = requests.get("https://httpbin.org/ip", proxies=proxies, timeout=10)
print(r.json())

Node.js (axios)

import axios from "axios";
import { HttpsProxyAgent } from "https-proxy-agent";

const agent = new HttpsProxyAgent("http://USER-session-12345:PASS@gateway.example.com:8000");
const { data } = await axios.get("https://httpbin.org/ip", { httpsAgent: agent });
console.log(data);

Elimina el -session-12345 segmento para volver a la rotación por solicitud.

Alternativas a los proxies rotativos

No todos los trabajos requieren un grupo de rotación gestionado. Las alternativas realistas:

  • Proxies estáticos o fijos más un rotador de IP. Útil si ya dispone de un rango de direcciones de un centro de datos limpio y desea rotación bajo demanda.
  • VPN. Ocultarán tu IP y cifrarán el tráfico, pero la mayoría no rota automáticamente y las pocas que lo hacen suelen ser demasiado lentas para el scraping.
  • Tor. Gratuito y rotativo por diseño, pero lento y ampliamente bloqueado. Rara vez es la elección adecuada para producción.
  • API de scraping gestionadas. Ocultar la rotación, los encabezados y la resolución de CAPTCHA tras un único punto de acceso, con facturación por éxito.

Cómo elegir un proveedor de proxies rotativos

Una vez que sepa qué son los proxies rotativos, elegir el mejor proveedor de proxies rotativos para su entorno se reduce a cinco aspectos:

  • Tamaño del pool y cobertura geográfica. La cobertura en tus países de destino es más importante que el número total de IP.
  • Origen ético. Confirma que los grupos residenciales se crean con consentimiento informado.
  • Controles de rotación. Deben documentarse tanto las ventanas fijas por solicitud como las configurables.
  • Concurrencia y tasa de éxito. Solicita una prueba con tu objetivo real antes de firmar.
  • Modelo de precios. El modelo por GB es adecuado para HTML denso; el modelo por solicitud, para objetivos de tipo API.

¿Son legales y seguros los proxies rotativos?

En la mayoría de las jurisdicciones, el uso de un proxy para recuperar páginas web de acceso público es generalmente legal, aunque las leyes locales y los contratos pueden cambiar esto. La legalidad es independiente de los términos de servicio del objetivo, que pueden seguir prohibiendo el scraping. El mayor riesgo diario es de qué proxies se utilizan: los grupos públicos gratuitos se han relacionado con la interceptación de tráfico y la inserción de anuncios, así que limítese a proveedores comerciales verificados.

Errores comunes con los proxies rotativos que hay que evitar

  • Rotar direcciones IP mientras se reutilizan encabezados, cookies o huellas TLS.
  • Omitir las sesiones persistentes en los flujos de inicio de sesión.
  • Rotar en exceso en API con límite de velocidad que se basan en la cuenta, no en la IP.
  • Confiar en listas de proxies gratuitas para cualquier dato sensible.

Puntos clave

  • Los proxies rotativos se sitúan detrás de un único punto de acceso de puerta de enlace e intercambian la IP de origen por solicitud o por ventana de sesión persistente.
  • Los cuatro tipos de grupos (residencial, centro de datos, móvil e ISP) ofrecen diferentes niveles de confianza, velocidad y coste; elígelos según el objetivo, no por costumbre.
  • Las sesiones persistentes no son opcionales para los inicios de sesión; la rotación sin modo persistente te desconectará en mitad de una tarea.
  • La rotación solo ayuda si el resto de su huella digital también rota, así que haga coincidir los encabezados y el perfil TLS con la IP.
  • A la hora de comprar, sopese el tamaño del grupo, la ética de abastecimiento, los controles de rotación, la tasa de éxito en su objetivo y el modelo de precios.

Preguntas frecuentes

¿Con qué frecuencia cambia realmente de dirección IP un proxy rotativo?

Por defecto, los pools basados en solicitudes cambian de IP en cada nueva conexión TCP, lo que suele significar una vez por solicitud HTTP. Los pools basados en tiempo mantienen la misma IP durante un intervalo configurable, a menudo de 30 segundos a 30 minutos. El intervalo real depende del proveedor y de si has establecido un identificador de sesión en el nombre de usuario del proxy.

¿Pueden los sitios web seguir detectando que estoy utilizando un proxy rotativo?

A veces. La IP es una señal, no el panorama completo. Los sistemas antibots también inspeccionan los encabezados, las huellas TLS, las cookies, los patrones de navegación y los retos de JavaScript. Si rotas las IP pero reutilizas el mismo User-Agent y el mismo comportamiento, los sistemas de detección seguirán marcándote. La rotación funciona mejor junto con la aleatorización de encabezados, huellas de navegador realistas y una sincronización de solicitudes a ritmo humano.

¿Necesito un proxy rotativo si solo estoy rastreando unos cientos de páginas?

Probablemente no, si el objetivo no tiene protección antibots y tus solicitudes son respetuosas. Una sola IP residencial u oficina suele gestionar unos cientos de solicitudes con retrasos razonables. Empiezas a necesitar rotación cuando superas las miles de solicitudes por hora, te topas con un objetivo protegido o necesitas IP de varios países.

¿Puedo usar proxies rotativos con navegadores sin interfaz gráfica como Playwright, Puppeteer o Selenium?

Sí. Los navegadores sin interfaz aceptan un proxy HTTP a través de un indicador de inicio. En Playwright se pasa proxy: { server, username, password } al iniciar; Puppeteer requiere --proxy-server además de la autenticación por página; Selenium utiliza un Proxy objeto en las capacidades del controlador. Utiliza un ID de sesión persistente para que la carga de una sola página se mantenga en una misma IP.

¿Cómo mantengo la misma IP en varias solicitudes cuando realmente necesito una sesión?

Utiliza sesiones persistentes, que la mayoría de los proveedores ofrecen añadiendo un identificador de sesión a tu nombre de usuario del proxy. La puerta de enlace redirige entonces todas las solicitudes que llevan ese identificador a través de la misma IP de origen hasta que la ventana caduca, normalmente de 1 a 30 minutos. Esto mantiene los inicios de sesión, los formularios de varios pasos y los carritos de la compra en una única dirección mientras el resto de tu tráfico se alterna.

Conclusión

¿Qué son, en definitiva, los proxies rotativos? Una superficie de control, no una función. Tú decides si cada solicitud obtiene una IP nueva, si un flujo de trabajo necesita una ventana persistente, qué tipo de grupo le conviene a tu objetivo y qué señales, además de la IP, los encabezados, el TLS y las cookies, deben rotar junto con ella. Toma bien esas cuatro decisiones y la mayoría de los rastreadores dejarán de ser bloqueados.

El mercado de los proxies está fragmentado y los modelos de precios varían mucho, así que resiste la tentación de fijarte solo en el tamaño del grupo que anuncian. Realiza una prueba de pago en tu objetivo real, mide la tasa de éxito y el coste por solicitud exitosa, y compara lo comparable antes de comprometerte.

Si estás ampliando un proceso que necesita una rotación de IP fiable, los proxies residenciales rotativos de WebScrapingAPI cubren 195 países con modos tanto por solicitud como de sesión persistente, por lo que puedes colocar la capa de proxy detrás de tu código de scraper existente y seguir adelante. Empieza por ahí si quieres un grupo gestionado, o crea el tuyo propio con el patrón de puerta de enlace mostrado arriba si ya tienes IP en las que confías.

Acerca del autor
Raluca Penciuc, Desarrollador full-stack @ WebScrapingAPI
Raluca PenciucDesarrollador full-stack

Raluca Penciuc es desarrolladora full stack en WebScrapingAPI, donde se dedica a crear rastreadores, mejorar las técnicas de evasión y buscar formas fiables de reducir la detección en los sitios web de destino.

Empieza a crear

¿Estás listo para ampliar tu recopilación de datos?

Únete a más de 2000 empresas que utilizan WebScrapingAPI para extraer datos de la web a escala empresarial sin ningún gasto de infraestructura.