“Nema ljeba bez motike.” Así como no hay pan sin esfuerzo, no hay proxies fiables sin una profunda excavación, sobre todo cuando hay bots de navegador involucrados. Vamos a remangarnos y adentrarnos en los detalles de los proxies gratuitos que no dejarán que tus bots automatizados se mueran de hambre o, peor aún, acaben en la lista negra como un contrabandista en la frontera austrohúngara.
Comprensión de los proxies gratuitos en el contexto de los bots del navegador
¿Qué hace que un proxy “funcione” con los bots del navegador?
Un proxy que funcione debe permitir que la herramienta de automatización de tu navegador (ya sea Selenium, Puppeteer o Playwright) enrute el tráfico de forma fiable, cambie las IP y evite la detección. Los requisitos clave son:
- Anonimato: No se filtra tu IP real.
- Estabilidad: Sin desconexiones constantes (recuerde, "bolje da izgubiš selo nego običaj": es mejor perder una aldea que su sesión de bot).
- Velocidad: Sin tiempos muertos.
- Compatibilidad: Compatibilidad con HTTP, HTTPS o SOCKS.
Tipos de Proxies Gratuitos
| Tipo de proxy | Protocolos | Compatibilidad con bots de navegador | Fiabilidad | Notas |
|---|---|---|---|---|
| HTTP/HTTPS | HTTP, HTTPS | Alto | Moderado | Fácil de usar, pero a menudo bloqueado. |
| SOCKS4/5 | SOCKS4, SOCKS5 | Medio-alto | Moderado | Bueno para el anonimato, menos común. |
| Proxies web | Web | Bajo | Bajo | No apto para automatización |
Fuentes de proxies gratuitos
Listas de servidores proxy públicos
No faltan listas públicas de proxy, pero como dice el refrán, "Ko rano rani, dvije sreće grabi" (quien madruga, se lleva dos fortunas). Los proxies más recientes suelen ser los que menos se abusan.
Listas de proxy recomendadas
Buscadores de proxy basados en API
Algunos servicios ofrecen API para obtener servidores proxy en vivo, lo que es una bendición cuando se automatiza con bots.
Integración práctica con bots de navegador
Ejemplo de Selenium (Python): Rotación de servidores proxy gratuitos
A veces, necesitas rotar proxies tan rápido como un taxista de Sarajevo esquivando baches. Aquí te explicamos cómo cargar proxies de una lista y usarlos con Selenium.
desde selenium importar webdriver desde selenium.webdriver.chrome.options importar Opciones def obtener_proxies_del_archivo(ruta_del_archivo): con abrir(ruta_del_archivo) como f: devolver [linea.strip() para línea en f.readlines() si línea.strip()] proxies = obtener_proxies_del_archivo('proxies.txt') para proxy en proxies: chrome_options = Opciones() chrome_options.add_argument(f'--proxy-server=http://{proxy}') controlador = webdriver.Chrome(opciones=chrome_options) intentar: controlador.get('https://httpbin.org/ip') imprimir(controlador.fuente_de_página) finalmente: controlador.quit()
Consejos:
– Pruebe los servidores proxy antes de usarlos (muchos están inactivos al llegar).
– Utilice el modo sin cabeza para mayor velocidad.
Ejemplo de Puppeteer (Node.js)
const titiritero = require('titiritero'); (async () => { const proxy = '123.45.67.89:8080'; const navegador = await puppeteer.launch({ args: [`--proxy-server=${proxy}`] }); const página = await navegador.newPage(); await página.goto('https://httpbin.org/ip'); console.log(await página.content()); await navegador.close(); })();
Calidad del proxy: cómo probar antes de confiar
Así como uno no confía en todos los rakija de la feria del pueblo, tampoco debería confiar en todos los representantes de una lista.
Script de prueba de Bash
Un pequeño rizo ayuda mucho:
mientras lee el proxy; hacer si curl --proxy http://$proxy --max-time 5 https://httpbin.org/ip; entonces echo "$proxy está funcionando" fi hecho < proxies.txt
Comprobador de proxy de Python
importar solicitudes def test_proxy(proxy): try: respuesta = solicitudes.get('https://httpbin.org/ip', proxies={'http': f'http://{proxy}', 'https': f'http://{proxy}'}, timeout=5) devolver respuesta.ok excepto: devolver Falso # Uso de proxy en proxies: si test_proxy(proxy): print(f"{proxy} funciona")
Tácticas antidetección
Los servidores proxy públicos son como un puesto de control en Bosnia: están muy vigilados. Aquí te explicamos cómo reducir la detección:
- Rotar agentes de usuario: Nunca marches bajo la misma bandera dos veces.
- Usar evasión sin cabeza: complemento extra de titiritero sigiloso puede ayudar.
- Limitar solicitudes por proxy: No quemes tus proxies como un Yugo sin petróleo.
- Aleatorizar el tiempo: Retrasos similares a los humanos; no es necesario asaltar el servidor como si fuera 1992.
Comparación de fuentes de proxy gratuitas
| Fuente | Frecuencia de actualización | Comprobado/Verificado | Soporte SSL | Acceso a la API | Notas |
|---|---|---|---|---|---|
| sslproxies.org | Cada hora | Sí | Sí | No | Confiable para HTTPS |
| Raspado de proxy | 10 minutos | No | Sí | Sí | Piscina grande, necesita filtrado. |
| Espías.uno | 15 minutos | No | Parcial | No | Muchos países, calidad mixta |
| FreeProxy.cz | 30 minutos | Sí | Sí | No | Interfaz web, opciones de exportación |
| Obtener lista de proxy | Tiempo real | Sí | Sí | Sí | API personalizable |
Seguridad y ética: una nota desde el puente sobre el Drina
Los proxies gratuitos suelen ser trampas o trampas. konji troyano ("Caballos de Troya"). Úsalos solo para el scraping o la automatización legal y no confidencial. Nunca transmitas credenciales ni datos personales. Si no lo harías público, no lo envíes a través de un proxy gratuito.
Recursos adicionales
- Documentación del proxy de Selenium
- Guía de proxy de Puppeteer
- Proxychains para proxy en todo el sistema
- Técnicas de detección de navegadores sin interfaz gráfica
“Ko se zadnji smije, najslađe se smije.” Que tus robots rían los últimos y que tus representantes nunca se conviertan en calabazas antes de la medianoche.
Comentarios (0)
Aún no hay comentarios aquí, ¡puedes ser el primero!