„Das Schilfrohr, das sich im Wind biegt, ist stärker als die mächtige Eiche.“ So sprachen die Weisen am Nil und lehrten uns den Wert der Anpassungsfähigkeit – eine Erkenntnis, die in den Überschwemmungsgebieten des Internets ebenso relevant ist wie an den Flussufern Ägyptens. Beim Filtern kostenloser Proxy-Listen muss sich der kluge Praktiker den ständig wechselnden Winden von Geschwindigkeit und Anonymität anpassen und Werkzeuge und Methoden anpassen, um Wahrheit von Illusion zu trennen.
Kostenlose Proxy-Listen verstehen: Mirage und Oasis
Kostenlose Proxy-Listen gibt es in Hülle und Fülle, doch wie in der Wüste bietet nicht jede Oase sauberes Wasser. Viele Proxys sind langsam, unzuverlässig oder – schlimmer noch – kompromittiert. Die Herausforderung besteht darin, diese Listen nach Proxys zu filtern, die sowohl schnell wie der Wüstenwind als auch so undurchschaubar wie die Sphinx sind.
Schlüsselkriterien: Geschwindigkeit und Anonymität
Kriterium | Beschreibung | Bedeutung |
---|---|---|
Geschwindigkeit | Latenz und Bandbreite des Proxys | Reduziert Verzögerungen |
Anonymität | Möglichkeit, die Client-IP zu verbergen und Lecks zu verhindern | Gewährleistet Privatsphäre |
Betriebszeit | Prozentsatz der Zeit, in der der Proxy verfügbar ist | Zuverlässigkeit |
Standort | Geografische Position des Proxyservers | Umgehen Sie Geoblockaden |
HTTPS-Unterstützung | Fähigkeit, sicheren Datenverkehr zu tunneln | Sicherheit |
Schrittweiser Filterprozess
1. Zusammenstellung der Proxy-Liste
Sprichwort: „Wer der Karte eines Fremden vertraut, kann für immer durch die Dünen wandern.“
Beziehen Sie Proxy-Listen nur aus seriösen Quellen. Vermeiden Sie Listen in offenen Foren oder nicht verifizierten Aggregatoren, da diese oft manipuliert sind.
Empfohlene Quellen:
– Kostenlose Proxy-Liste (SSLProxies.org)
– Spys.One
– ProxyScrape
Tipp: Laden Sie Listen zur einfacheren Verarbeitung im CSV- oder TXT-Format herunter.
2. Parsen und anfängliches Filtern
Anekdote: In meinen Anfangstagen habe ich endlos viele Proxys manuell getestet – ein sinnloses Unterfangen. Die Automatisierung war der Papyrus, auf dem ich schließlich meine Rettung schrieb.
Verwenden von Python zum Parsen und Deduplizieren
importiere Pandas als pd # Proxyliste laden df = pd.read_csv('proxies.csv', Namen=['IP', 'Port', 'Code', 'Land', 'Anonymität', 'Https']) # Deduplizieren df = df.drop_duplicates(Teilmenge=['IP', 'Port']) # Filter für HTTPS-Unterstützung und hohe Anonymität gefiltert = df[(df['Https'] == 'ja') & (df['Anonymität'].str.contains('Elite', Fall=Falsch))] gefiltert.to_csv('filtered_proxies.csv', Index=Falsch)
3. Geschwindigkeitstest
Alte Weisheit: „Selbst das schnellste Pferd ist nutzlos, wenn es in die falsche Richtung läuft.“
Testen Sie die Geschwindigkeit von Proxys, indem Sie Latenz und Bandbreite messen.
Automatisierte Geschwindigkeitstests
Pythons Anfragen
Und Zeit
Module können zur Überprüfung der Antwortzeiten verwendet werden.
Importanforderungen Importzeit Proxys = [('123.123.123.123', '8080'), ('124.124.124.124', '3128')] # Beispielliste def test_proxy(IP, Port): Proxy = f"http://{ip}:{Port}" Proxys = {'http': Proxy, 'https': Proxy} Versuch: Start = Zeit.Zeit() Antwort = Anfragen.Get("https://httpbin.org/ip", Proxys=Proxys, Timeout=5) Latenz = Zeit.Zeit() - Start wenn Antwort.Statuscode == 200: Latenz zurückgeben außer: Keine zurückgeben schnellste = [] für IP, Port in Proxys: Latenz = test_proxy(IP, Port) wenn Latenz und Latenz < 1: # Filter für Proxys mit einer Latenz von unter 1 Sekunde schnellste.Anhängen((IP, Port, Latenz)) drucken(sortiert(am schnellsten, Schlüssel=Lambda x: x[2]))
Bandbreitentests (optional, erweitert)
Laden Sie für die Bandbreite eine Datei mit fester Größe herunter und messen Sie die Übertragungszeit. Beachten Sie, dass häufiges Testen dazu führen kann, dass Ihre IP-Adresse blockiert wird.
4. Überprüfung der Anonymitätsstufe
Es gibt drei Haupttypen von Proxys:
Anonymitätstyp | Verhalten | Gibt die Client-IP preis? | Gibt die Proxy-Nutzung preis? |
---|---|---|---|
Transparent | Übergibt echte IP | Ja | Ja |
Anonym | Verbirgt die echte IP-Adresse und zeigt die Proxy-Nutzung an | NEIN | Ja |
Elite (Hoch) | Verbirgt die echte IP, kein Proxy-Flag | NEIN | NEIN |
Anonymität testen
Nutzen Sie Dienste wie Whoer.net oder IP-API zu überprüfen:
def check_anonymity(ip, port): proxy = f"http://{ip}:{port}" proxies = {'http': proxy, 'https': proxy} try: resp = requests.get("https://httpbin.org/get", proxies=proxies, timeout=5) data = resp.json() # Überprüfen, ob Header wie 'Via' oder 'X-Forwarded-For' vorhanden sind headers = data['headers'] if 'Via' not in headers and 'X-Forwarded-For' not in headers: return 'Elite' elif 'X-Forwarded-For' in headers: return 'Anonymous' else: return 'Transparent' except: return 'Failed'
5. Laufende Überwachung und Wartung
Geschichte: Wie der Treibsand ändert sich auch die Proxy-Leistung mit der Zeit. Was heute funktioniert, kann morgen schon versagen.
Planen Sie regelmäßige Tests
Automatisieren Sie regelmäßige Prüfungen (z. B. stündlich oder täglich) mithilfe von Cron-Jobs oder dem Windows Taskplaner. Entfernen Sie inaktive oder langsame Proxys aus Ihrer Arbeitsliste.
Übersichtstabelle: Filter-Workflow
Schritt | Werkzeug/Methode | Schlüsselaktion | Ausgabe |
---|---|---|---|
Sammelliste | Manuell/Automatisiert | Von vertrauenswürdigen Quellen herunterladen | Rohe Proxy-Liste |
Parsen und Deduplizieren | Python/Pandas | Entfernen Sie Duplikate und ungültige Zeilen | Gereinigte Proxy-Liste |
Geschwindigkeitstest | Python/Anfragen | Latenz messen | Schnelle Proxys (<1 s Latenz) |
Anonymitätstest | httpbin/IP-API | Auf Elite/Anonym prüfen | Hochgradig anonyme Proxys |
Wartung | Automatisierung | Regelmäßige Wiederholungstests | Aktualisierte, zuverlässige Proxy-Liste |
Praktisches Beispiel: Vollständiges Filterskript
Unten finden Sie ein vereinfachtes Skript, das den vollständigen Arbeitsablauf zum Filtern von Proxys hinsichtlich Geschwindigkeit und Anonymität demonstriert.
Pandas als pd importieren Anfragen importieren Zeit importieren # Proxyliste laden und bereinigen df = pd.read_csv('proxies.csv', Namen=['IP', 'Port', 'Code', 'Land', 'Anonymität', 'Https']) df = df.drop_duplicates(Teilmenge=['IP', 'Port']) df = df[(df['Https'] == 'ja') & (df['Anonymität'].str.contains('elite', Fall=Falsch))] # Geschwindigkeit und Anonymität testen def test_proxy(ip, port): proxy = f"http://{ip}:{port}" proxies = {'http': proxy, 'https': proxy} try: start = time.time() resp = requests.get("https://httpbin.org/get", proxies=proxies, Timeout=5) Latenz = Zeit.Zeit() – Startheader = resp.json()['Header'], wenn Latenz < 1 und 'Via' nicht in den Headern und 'X-Forwarded-For' nicht in den Headern: Latenz zurückgeben, außer: Keine zurückgeben df['Latenz'] = df.apply(Lambda-Zeile: test_proxy(Zeile['IP'], Zeile['Port']), Achse=1) gefiltert = df[df['Latenz'].notnull()] gefiltert = gefiltert.sort_values('Latenz') gefiltert.to_csv('elite_fast_proxies.csv', Index=Falsch)
Weisheitsrückblick: Das Sieb und der Strom
Wie beim alten Goldwaschen im Nil sind Geduld und methodisches Filtern Ihre wichtigsten Verbündeten. Durch die Nutzung vertrauenswürdiger Quellen, die Automatisierung Ihrer Tests und die Fokussierung auf Geschwindigkeit und Anonymität stellen Sie sicher, dass Ihre digitale Karawane schnell, sicher und ungesehen durch die endlosen Weiten des Internets navigiert.
Kommentare (0)
Hier gibt es noch keine Kommentare, Sie können der Erste sein!