Automatisiert und verschleiert durchs Netz

te one

Lt. Commander
Registriert
Apr. 2009
Beiträge
1.255
Nabend,

habe ein kleines Skript mit Ruby und Mechanize gebaut - die Frage jedoch ist eher allgemein:
Ich möchte nicht unbedingt große Spuren hinterlassen, insbesondere soll nicht erkennbar sein, dass im Hintergrund ein Skript abläuft.

3 Punkte sind mir bereits eingefallen:
1. IP-Adresse mittels Proxy anpassen (eher unwichtig, wer ich bin darf man wissen - nur nicht, dass ich ein Skript bin :p )
2. UserAgent-String (nutze ich eben einen ausm aktuellen Chrome)
3. "Klickzeiten" (Mittels Zufallsgenerator bestimme ich die Dauer zwischen der Ausführung neuer Requests)

Was gibt es noch zu bedenken? Sendet ein Browser noch weitere Infos außer dem UserAgent? Könnte mir vorstellen, dass halt auffällt, dass mir in Mechanize kein Java-Gedöns angezeigt werden kann - aber die meisten Seiten sollten ja ohne dergleichen laufen.

Wäre über ein paar Ideen und Tipps dankbar :)
Ist übrigens nichts böses geplant. Es geht um das regelmäßige Auslesen einiger Parameter verschiedener Seiten und eventuelle Benachrichtigung per Mail - weiß nur nicht wie erwünscht soetwas ist...

Danke & Gruß
 
Ein Anfang ist Panopticlick, der Browsertest der EFF. Auch ohne Javascript erfährt eine Seite einiges über dich.

Du scheinst einen Crawler benutzen zu wollen. Wenn der nicht als solcher erkannt werden soll, ist es wohl vernünftig, aus einem Satz der sagen wir fünf am häufigsten auftretenden User-Agent-Kombinationen zufällig bei jedem Seitenbesuch eine auszuwählen. Achte bei der Wahl des Proxys außerdem darauf, daß er kein X-Forwarded-For überträgt. Die Besuchszeiten sollten ebenfalls ausgewürfelt werden.
 
Frag doch mal an, vielleicht ist es ja erwünscht und du kriegst unterstützung (Zugriff direkt auf die Schnittstelle oder sowas...)...

Und falls es nicht erwünscht ist, ist der fall auch klar hier ;)
 
@GaTeXx: Wie oben erwähnt will ich z.B. keinen Proxy verwenden ("Verschleierung" war das falsche Wort). Es geht mir nur darum, dass niemand den automatisiertem Abruf erkennt - ist ja häufig nicht erwünscht (will es auch nicht übertreiben - es geht nur um ein paar Link-Klicks alle paar Stunden).

Danke, DeusoftheWired. Sehr wertvolle Infos

Eine Möglichkeit zur Unterstützung mit offiziellen Schnittstellen sehe ich nicht, da frage ich erst lieber gar nicht :lol:
 
Zurück
Oben