“Nema ljeba bez motike.” Proprio come non c'è pane senza duro lavoro, non ci sono proxy affidabili senza scavare a fondo, soprattutto quando sono coinvolti i bot dei browser. Rimbocchiamoci le maniche e entriamo nei dettagli dei proxy gratuiti che non lasceranno che i vostri bot automatizzati muoiano di fame o, peggio, finiscano nella lista nera come un contrabbandiere al confine austro-ungarico.
Comprendere i proxy gratuiti nel contesto dei bot del browser
Cosa fa sì che un proxy "funzioni" con i bot del browser?
Un proxy "funzionante" deve consentire allo strumento di automazione del browser, che sia Selenium, Puppeteer o Playwright, di instradare il traffico in modo affidabile, modificare gli IP ed eludere il rilevamento. I requisiti chiave sono:
- Anonimato: Nessuna fuga di notizie del tuo vero IP.
- Stabilità: Nessuna disconnessione costante (ricorda, “bolje da izgubiš selo nego običaj”: meglio perdere un villaggio che la sessione del bot).
- Velocità: Nessun timeout.
- Compatibilità: Supporto HTTP, HTTPS o SOCKS.
Tipi di proxy gratuiti
| Tipo di proxy | Protocolli | Supporto per bot del browser | Affidabilità | Appunti |
|---|---|---|---|---|
| HTTP/HTTPS | HTTP, HTTPS | Alto | Moderare | Facile da usare, ma spesso bloccato |
| SOCKS4/5 | SOCKS4, SOCKS5 | Medio-Alto | Moderare | Buono per l'anonimato, meno comune |
| Proxy Web | Web | Basso | Basso | Non adatto all'automazione |
Fonti di proxy gratuiti
Elenchi di proxy pubblici
Non mancano certo le liste di proxy pubbliche, ma come dice il vecchio proverbio, "Ko rano rani, dvije sreće grabi" (chi prima arriva, meglio arriva). I proxy più recenti sono spesso quelli meno abusati.
Elenchi proxy consigliati
Recuperatori proxy basati su API
Alcuni servizi offrono API per il recupero di proxy live, una vera manna dal cielo quando si automatizza con i bot.
Integrazione pratica con i bot del browser
Esempio di Selenium (Python): rotazione di proxy gratuiti
A volte, è necessario ruotare i proxy con la stessa rapidità di un tassista di Sarajevo che schiva le buche. Ecco come caricare i proxy da una lista e utilizzarli con Selenium.
da selenium import webdriver da selenium.webdriver.chrome.options import Options def get_proxies_from_file(file_path): con open(file_path) come f: restituisci [line.strip() per la riga in f.readlines() se line.strip()] proxies = get_proxies_from_file('proxies.txt') per il proxy in proxies: chrome_options = Options() chrome_options.add_argument(f'--proxy-server=http://{proxy}') driver = webdriver.Chrome(options=chrome_options) prova: driver.get('https://httpbin.org/ip') stampa(driver.page_source) infine: driver.quit()
Suggerimenti:
– Testare i proxy prima dell'uso (molti sono inefficaci all'arrivo).
– Per aumentare la velocità, utilizzare la modalità headless.
Esempio di Puppeteer (Node.js)
const puppeteer = require('puppeteer'); (async () => { const proxy = '123.45.67.89:8080'; const browser = await puppeteer.launch({ args: [`--proxy-server=${proxy}`] }); const page = await browser.newPage(); await page.goto('https://httpbin.org/ip'); console.log(await page.content()); await browser.close(); })();
Qualità del proxy: come testare prima di fidarsi
Proprio come non ci si può fidare di ogni rakija alla fiera del paese, non ci si dovrebbe fidare di ogni proxy presente in una lista.
Script di test Bash
Un piccolo ricciolo può fare la differenza:
while read proxy; do if curl --proxy http://$proxy --max-time 5 https://httpbin.org/ip; then echo "$proxy funziona" fi done < proxies.txt
Controllo proxy Python
import requests def test_proxy(proxy): try: response = requests.get('https://httpbin.org/ip', proxies={'http': f'http://{proxy}', 'https': f'http://{proxy}'}, timeout=5) return response.ok except: return False # Utilizzo per proxy in proxy: if test_proxy(proxy): print(f"{proxy} works")
Tattiche anti-rilevamento
I proxy pubblici sono come un posto di blocco bosniaco: sono strettamente monitorati. Ecco come ridurre i controlli:
- Ruota gli User-Agent: Non marciare mai due volte sotto la stessa bandiera.
- Usa l'Evasione senza testa: puppeteer-extra-plugin-stealth può aiutare.
- Limita le richieste per proxy: Non bruciare i tuoi proxy come una Yugo senza petrolio.
- Temporizzazione casuale: Ritardi simili a quelli umani; non c'è bisogno di assaltare il server come se fosse il 1992.
Confronto tra fonti proxy gratuite
| Fonte | Frequenza di aggiornamento | Controllato/Verificato | Supporto SSL | Accesso API | Appunti |
|---|---|---|---|---|---|
| sslproxies.org | Ogni ora | SÌ | SÌ | NO | Affidabile per HTTPS |
| ProxyScrape | 10 minuti | NO | SÌ | SÌ | Piscina grande, necessita di filtraggio |
| Spia.uno | 15 minuti | NO | Parziale | NO | Molti paesi, qualità mista |
| FreeProxy.cz | 30 minuti | SÌ | SÌ | NO | Interfaccia web, opzioni di esportazione |
| Ottieni elenco proxy | In tempo reale | SÌ | SÌ | SÌ | API personalizzabile |
Sicurezza ed etica: una nota dal ponte sulla Drina
I proxy gratuiti sono spesso dei honey pot o trojanski konji ("Cavalli di Troia"). Utilizzateli solo per operazioni di scraping o automazione non sensibili e legali. Non trasmettete mai credenziali o dati personali. Se non lo direste a gran voce, non inviatelo tramite un proxy gratuito.
Risorse aggiuntive
- Documentazione del proxy Selenium
- Guida al proxy del burattinaio
- Proxychain per il proxy a livello di sistema
- Tecniche di rilevamento del browser headless
“Ko se zadnji smije, najslađe se smije.” Possano i tuoi robot ridere per ultimi e che i tuoi proxy non si trasformino mai in zucche prima di mezzanotte.
Commenti (0)
Non ci sono ancora commenti qui, potresti essere il primo!