Los mejores navegadores antidetección para un web scraping seguro y eficaz
Mihnea-Octavian Manolache el 23 de febrero de 2023

La detección es un gran problema en la industria del web scraping. Es como un juego constante del gato y el ratón entre los scrapers y los sistemas anti-bot. Y el uso de un navegador antidetección se ha convertido en un requisito para cualquiera que desee raspar datos. Pero los navegadores antidetección no se limitan al scraping web. La gente los ha utilizado para cosas como la gestión de múltiples cuentas de redes sociales, el comercio electrónico, etcétera. Incluso los usuarios interesados en la privacidad pueden beneficiarse de un navegador antidetección.
El artículo de hoy cubrirá exactamente esta área. Vamos a hablar de los navegadores antidetección, sus casos de uso, su eficacia y qué proveedor elegir en 2023. También voy a presentarles la huella digital de los navegadores. Así que prepárense, hay mucho de qué hablar hoy.
¿Qué es un navegador antidetección?
En parte, la definición de un navegador antidetección viene dada por el propio nombre. Cada navegador normal (por ejemplo, Chrome o Firefox) tiene su propia identidad en línea. A esto lo llamamos huella digital. La forma en que tu navegador tiene una huella digital es muy compleja. Tiene que ver con cosas como
- Su dirección IP
- El agente de usuario que envía con sus solicitudes
- Propiedades de sus navegadores
La última es la más importante, diría yo. Esto es porque cualquiera en internet puede construir un script relativamente simple para obtener ciertas propiedades de un navegador. Y lo más importante es que casi siempre, la combinación de estos valores genera una configuración única del sistema. En la práctica, se puede generar un hash de los valores combinados stringificados de estas propiedades y crear una huella digital. Tomemos por ejemplo FingerprintJS o CreepJS.
Además, la detección no está limitada a la ventana. Incluso he creado esta herramienta que puede detectar evasiones como las implementadas con `puppeteer-extra-plugin-stealth` comparando los valores recogidos de la ventana y los trabajadores. Pero esa es una discusión más compleja. Por ahora, parece que la mejor manera de pasar desapercibido online es usar un navegador antidetección.
Y volvemos al tema. Los navegadores Antidetect son aplicaciones basadas en navegadores conocidos que han sido modificados para aceptar valores personalizados para las propiedades que hemos discutido antes. Dado que proyectos como Chromium o Mozilla son de código abierto, cualquiera puede bifurcarlos y crear su propia versión de un navegador. Y eso es exactamente lo que ocurre también con los navegadores antidetección.
Tú también puedes clonar Chromium, por ejemplo, y modificarlo para que sirva valores aleatorios para varias propiedades del navegador. Pero en la práctica, esto requiere muchos conocimientos y recursos. Por eso hay algunos proveedores conocidos y llegaremos a ellos en un momento. Pero antes:
¿Para qué sirve un navegador antidetección?
Hay muchos casos de uso para los navegadores antidetección. Sin embargo, hay industrias que dependen de estos navegadores más que otras. Por eso voy a ser específico sobre cuáles son los casos de uso de los navegadores antidetección y por qué utilizarlos. Así que entendiendo que su mayor fortaleza es el anonimato, aquí están los casos de uso más comunes para un navegador web anti detección:
- Agencias de marketing: Los vendedores afiliados o las agencias de redes sociales suelen tener que gestionar varias cuentas de redes sociales. En la práctica, las plataformas de redes sociales prohíben el acceso a este tipo de actividades. Lo ideal, desde su punto de vista, es que un solo dispositivo gestione una sola cuenta. Más podría dar lugar a abusos. Dado que los navegadores antidetección crean más de una identidad, puedes utilizarlos fácilmente para gestionar este tipo de actividades.
- Vendedores de comercio electrónico: Hay una práctica común (aunque tácita) entre los vendedores de Amazon o drop-shippers de utilizar múltiples cuentas para vender sus productos. Esto aumenta su alcance e implícitamente sus ventas. De nuevo, las grandes plataformas de comercio electrónico no suelen permitir estas prácticas. Y de nuevo, los navegadores antidetección pueden entrar en juego.
- Web scraping: En los últimos años, el web scraping se ha convertido en un verdadero reto. Tomar las huellas dactilares de un controlador web (navegador automatizado) es más fácil hoy que hace un par de años. Y como probablemente ya habrá adivinado, casi todos los sitios web intentan evitar los bots. Dado que los web scrapers entran en esta categoría, los sitios web suelen intentar bloquear su acceso.
¿Qué eficacia tienen en la práctica los navegadores antidetección?
Dependiendo del proveedor, los navegadores antidetección pueden ser bastante eficientes. Trabajando en el modo oculto de Web Scraping API, tuve que jugar con varias técnicas de evasión. Una de ellas consistió en probar un navegador antidetección. Puede ser una sorpresa, pero hemos sido capaces de identificar los navegadores automatizados para Puppeteer parcheado y Selenium, pero no para los navegadores anti detección.
Como una capa extra de eficiencia, descubrimos mediante pruebas que los valores utilizados para generar huellas personalizadas también son importantes para detectar controladores web. Por ejemplo, los valores aleatorios son un "no-no". En su lugar, al generar una huella digital, intente:
- Utilizar agentes de usuario reales
- Utilizar plataformas de dispositivos que coincidan con el agente de usuario
- Añadir matrices de plugins de navegador reales
Y eso sólo por nombrar algunos. Lo más importante es utilizar información real y contrastada. Además, si eliges un proveedor, intenta ceñirte a sus recomendaciones.
Los principales navegadores antidetección en 2023
En un artículo relacionado dije que el mejor navegador antidetección es el que construyes tú mismo. Pero honestamente hablando, construir un navegador, incluso cuando tienes un proyecto de código abierto como punto de partida, requiere mucho esfuerzo. Así que si no tienes los recursos para formar un equipo, es mejor que optes por uno de estos proveedores:
#1: GoLogin

GoLogin es nuevo en la escena de los navegadores antidetección. Sin embargo, esto no lo hace menos eficiente. Lo primero que me llamó la atención fueron los canales de soporte. Están disponibles no sólo por correo electrónico o chat, sino también a través de WhatsApp, Telegram y Facebook Messenger. La segunda mención honorífica sobre GoLogin es su soporte de proxy. Su navegador está repleto de proxies por defecto. Y la tercera está relacionada con el acceso. GoLogin tiene una aplicación de escritorio, una aplicación móvil y una aplicación web que puedes utilizar. Puedes acceder a su herramienta desde la nube y eso es bastante impresionante.
El navegador en sí está basado en Google Chrome. Se modificó para generar nuevas huellas digitales para cada perfil. Una desventaja es que en lugar de falsificar todos los valores, también añaden ruido a algunos. Y las pruebas indican que esto puede dar lugar a más captchas, lo que indica que los sistemas antibot aún pueden captar alguna actividad automatizada.
En cuanto al precio, GoLogin comienza en 49 USD al mes y llega hasta 199 USD. También ofrecen un nivel personalizable. Sube hasta 1999 USD al mes por 10.000 perfiles en la nube y otras ventajas. Y también obtienes un 50% de descuento si pagas anualmente. Puedes consultar su página de precios para obtener más información. Para terminar:

#2: Multilogin

Según su sitio web, Multilogin ofrece "personalización completa de la huella digital". Esto significa que tienes acceso completo a las propiedades del navegador y puedes modificarlas de muchas maneras. Además, son uno de los pocos proveedores que no deshabilitan las funciones del navegador. Deshabilitar las características del navegador (como los trabajadores de servicio) no es un regalo instantáneo para un navegador automatizado. Sin embargo, los usuarios normales rara vez o nunca desactivan estas funciones. Y eso puede levantar una bandera roja para los detectores de bots.
Ahora volvamos a Multilogin. Lo que hicieron fue bifurcar Chrome y Firefox y crear sus propias versiones personalizables. Su interfaz gráfica de usuario te permite generar un perfil rápido (con una huella digital asociada) o falsificar ciertos valores tú mismo. El único inconveniente de Multilogin es el precio. Empieza en 99 USD al mes y puede llegar hasta 399 USD al mes. Eso es en el momento en que estoy escribiendo esto. Para precios actualizados, visita su página de precios. Ahora para terminar, aquí hay algo de información comprimida:

#3: AdsPower

Al igual que Multilogin, AdsPower ofrece dos navegadores antidetección. Uno está basado en Chromium y se llama Sun Browser. El segundo está basado en Firefox y se llama Flower Browser. Ambos tienen la capacidad añadida de gestionar la huella digital del navegador. Lo interesante de este navegador antidetección es que incorpora funciones de automatización. Poco o nada de programación se requiere para automatizar tareas utilizando AdsPower's Robotic Process Automation.
La empresa comenzó en 2019 en Hong Kong y rápidamente creció hasta convertirse en uno de los principales competidores de Multilogin. Parte de su éxito radica en las increíbles capacidades que ofrecen los navegadores. La otra parte creo que está impulsada por los bajos precios. AdsPower incluso tiene un nivel gratuito que te da acceso a dos perfiles y su plan pro es de sólo 50 USD al mes. A título personal, me parece la solución más atractiva. Y con eso, vamos a envolverlo:

#4: X-Browser

Con X-Browser, el navegador antidetección en sí es gratuito. Y eso puede ser una característica muy atractiva. El navegador es ofrecido por smartproxy y su descarga es gratuita. La "pega" es que hay que pagar por los proxies. Sin embargo, en realidad no hay ningún inconveniente. Y es que, con cualquiera de las dos opciones, necesitas proxies para ocultar tu IP y evitar que te bloqueen.
Limitar X-Browser a sus propios proxies puede ser algo bueno y malo al mismo tiempo. Por una parte, el usuario puede confiar en que smartproxy ofrecerá una solución optimizada para sus proxies. Por otro lado, sólo puede utilizar proxies de smartproxy. Estar atado a un único proveedor significa estar atado a la calidad de su servicio. Y si quieres escalar tu actividad, creo que necesitas más flexibilidad.
Como sólo pagas por los proxies, el precio de X-Browser es bastante decente. Sus proxies para centros de datos oscilan entre 10 y 45 USD al mes. Los proxies residenciales pueden ser un poco caros, pero todo depende de cuánto utilices. Consulta los precios aquí. Así que terminemos con X-Browser:

#5: Kameleo

Kameleo es todo un camaleón. Es compatible con los principales navegadores web (Chrome, Safari, Firefox y Edge) y se puede utilizar con los principales marcos de automatización (Puppeteer, Selenium y Playwright). Y más que esto, también ofrecen personalización de huellas digitales para dispositivos móviles. Según su sitio web, Kameleo Mobile se puede utilizar para falsificar tu huella dactilar en cualquier dispositivo Android.
A diferencia de sus competidores, el servicio de Kameleo no se centra en los navegadores, sino en los perfiles de navegadores. Es decir, no necesariamente realizan cambios en un navegador de código abierto para crear su propia versión.
Hicimos algunos experimentos con su plataforma y la principal desventaja que encontramos fue la atención al cliente. Puede ser muy lento. Aparte de eso, el precio es bueno: de 59 a 199 USD de pago mensual. Así que terminemos con esto:

#6: Incógnito
Incognito es otro navegador antidetección con un nivel gratuito. Y a diferencia de AdsPower, ofrece acceso a 10 perfiles de navegador gratuitos. Su navegador está basado en Chromium y ofrece prácticamente las mismas características que el resto de los navegadores antidetección. El producto también cuenta con una API que le permite interactuar con el navegador sin cabeza. Aparte del generoso nivel gratuito, su precio oscila entre 29,99 y 149,99 USD al mes. Yo diría que es un precio justo para lo que ofrecen. Para terminar:

#7: Esfera de Linken

Linken Sphere es un navegador antidetección basado en Chromium y ofrecido por el grupo ruso Tenebris. Fue lanzado en 2017, por lo que es una de las soluciones más antiguas del mercado. La principal pega que tiene es que parece bastante turbio. Por el momento solo aceptan pagos en bitcoin y el soporte se centra en su canal de Telegram. Además, es conocido por ser utilizado en actividades ilegales, como el hacking o el fraude. Aparte de eso cumple bastante bien su función. Y con esto, doy por finalizado el tema:

Conclusiones
Las huellas dactilares de los navegadores pueden dificultar enormemente el web scraping. Si quieres pasar desapercibido, necesitas cubrir muchos aspectos. Los proxies, los solucionadores de captchas y un navegador sin cabeza sigiloso son sólo algunos de los "ingredientes" de un raspador web fiable. Sumarlo todo puede generar unos costes de desarrollo y mantenimiento muy elevados. La alternativa es utilizar un servicio establecido de raspado web de terceros. Y Web Scraping API ofrece exactamente eso. Y me atrevería a decir que todo a una fracción del coste.
Noticias y actualidad
Manténgase al día de las últimas guías y noticias sobre raspado web suscribiéndose a nuestro boletín.
We care about the protection of your data. Read our <l>Privacy Policy</l>.Privacy Policy.

Artículos relacionados

Recopile sin esfuerzo datos en tiempo real de los motores de búsqueda mediante la API SERP Scraping. Mejore el análisis de mercado, el SEO y la investigación temática con facilidad. ¡Empiece hoy mismo!


Conozca cuál es el mejor navegador para eludir los sistemas de detección de Cloudflare mientras hace web scraping con Selenium.


Descubra cómo extraer y organizar datos de forma eficaz para el raspado web y el análisis de datos mediante el análisis sintáctico de datos, las bibliotecas de análisis sintáctico HTML y los metadatos de schema.org.
