“Nema ljeba bez motike.” Assim como não há pão sem trabalho árduo, não há proxies confiáveis sem pesquisa aprofundada — especialmente quando se trata de bots de navegador. Vamos arregaçar as mangas e explorar os detalhes dos proxies gratuitos que não deixarão seus bots automatizados sem recursos ou, pior, acabarem em listas negras como um contrabandista na fronteira austro-húngara.
Entendendo os proxies gratuitos no contexto dos bots de navegador
O que faz um proxy "funcionar" com bots de navegador?
Um proxy que "funciona" deve permitir que sua ferramenta de automação de navegador — seja Selenium, Puppeteer ou Playwright — direcione o tráfego de forma confiável, altere os IPs e evite a detecção. Os principais requisitos são:
- Anonimato: Seu endereço IP real não será divulgado.
- Estabilidade: Sem desconexões constantes (lembre-se, “bolje da izgubiš selo nego običaj” – é melhor perder uma vila do que sua sessão de bot).
- Velocidade: Sem interrupções.
- Compatibilidade: Suporte para HTTP, HTTPS ou SOCKS.
Tipos de Proxies Gratuitos
| Tipo de proxy | Protocolos | Suporte do bot do navegador | Confiabilidade | Notas |
|---|---|---|---|---|
| HTTP/HTTPS | HTTP, HTTPS | Alto | Moderado | Fácil de usar, mas frequentemente bloqueado. |
| SOCKS4/5 | SOCKS4, SOCKS5 | Médio-alto | Moderado | Bom para manter o anonimato, menos comum. |
| Proxies da Web | Rede | Baixo | Baixo | Não é adequado para automação. |
Fontes de Proxies Gratuitos
Listas de Proxy Públicas
Não faltam listas públicas de proxies, mas como diz o ditado, "Ko rano rani, dvije sreće grabi" — quem madruga, Deus ajuda. Os proxies mais recentes costumam ser os menos usados indevidamente.
Listas de proxy recomendadas
Buscadores de proxy baseados em API
Alguns serviços oferecem APIs para obter proxies em tempo real, o que é uma dádiva quando se trata de automação com bots.
Integração prática com bots de navegador
Exemplo em Selenium (Python): Rotação de proxies gratuitos
Às vezes, você precisa trocar de proxy tão rápido quanto um taxista de Sarajevo desviando de buracos. Veja como carregar proxies de uma lista e usá-los com o Selenium.
from selenium import webdriver from selenium.webdriver.chrome.options import Options def get_proxies_from_file(file_path): with open(file_path) as f: return [line.strip() for line in f.readlines() if line.strip()] proxies = get_proxies_from_file('proxies.txt') for proxy in proxies: chrome_options = Options() chrome_options.add_argument(f'--proxy-server=http://{proxy}') driver = webdriver.Chrome(options=chrome_options) try: driver.get('https://httpbin.org/ip') print(driver.page_source) finally: driver.quit()
Pontas:
– Teste os proxies antes de usar (muitos já chegam com defeito).
– Use o modo sem interface gráfica para obter maior velocidade.
Exemplo de Puppeteer (Node.js)
const puppeteer = require('puppeteer'); (async () => { const proxy = '123.45.67.89:8080'; const browser = await puppeteer.launch({ args: [`--proxy-server=${proxy}`] }); const page = await browser.newPage(); await page.goto('https://httpbin.org/ip'); console.log(await page.content()); await browser.close(); })();
Qualidade dos Proxies: Como Testar Antes de Confiar
Assim como não se confia em todas as rakijas na feira da aldeia, também não se deve confiar em todos os procuradores de uma lista.
Script de teste Bash
Um pequeno cacho já faz toda a diferença:
while read proxy; do if curl --proxy http://$proxy --max-time 5 https://httpbin.org/ip; then echo "$proxy está funcionando" fi done < proxies.txt
Verificador de proxy em Python
import requests def test_proxy(proxy): try: response = requests.get('https://httpbin.org/ip', proxies={'http': f'http://{proxy}', 'https': f'http://{proxy}'}, timeout=5) return response.ok except: return False # Uso de proxy em proxies: if test_proxy(proxy): print(f"{proxy} funciona")
Táticas Antidetecção
Proxies públicos são como um posto de controle bósnio: são fortemente monitorados. Veja como reduzir a detecção:
- Rotacionar agentes de usuário: Nunca marche duas vezes sob a mesma bandeira.
- Use a evasão sem cabeça: plugin extra furtivo do marionetista Pode ajudar.
- Limitar solicitações por proxy: Não destrua seus servidores proxy como um carro iugoslavo sem óleo.
- Aleatorizar o tempo: Atrasos semelhantes aos causados por humanos; não há necessidade de invadir o servidor como se estivéssemos em 1992.
Comparando fontes de proxy gratuitas
| Fonte | Frequência de atualização | Verificado/Confirmado | Suporte SSL | Acesso à API | Notas |
|---|---|---|---|---|---|
| sslproxies.org | De hora em hora | Sim | Sim | Não | Confiável para HTTPS |
| Raspagem de proxy | 10 minutos | Não | Sim | Sim | Piscina grande, precisa de filtragem. |
| Espiões.um | 15 minutos | Não | Parcial | Não | Muitos países, qualidade variável |
| FreeProxy.cz | 30 minutos | Sim | Sim | Não | Interface web, opções de exportação |
| Obter lista de proxy | Em tempo real | Sim | Sim | Sim | API personalizável |
Segurança e Ética: Uma Nota da Ponte sobre o Drina
Os proxies gratuitos são frequentemente armadilhas ou... trojanski konji (“Cavalos de Troia”). Use-os apenas para extração de dados não sensíveis e legais ou para automação. Nunca transmita credenciais ou dados pessoais. Se você não gritaria isso do outro lado do Vale do Baščaršija, não envie por meio de um proxy gratuito.
Recursos adicionais
- Documentação do Selenium Proxy
- Guia de Proxy do Marionetista
- Proxychains para proxy em todo o sistema
- Técnicas de detecção de navegadores sem interface gráfica
“Ko se zadnji smije, najslađe se smije.” Que seus bots riam por último e que seus proxies nunca se transformem em abóboras antes da meia-noite.
Comentários (0)
Ainda não há comentários aqui, você pode ser o primeiro!