Suche Programm, was URLs öffnet und Button klickt!

Arjab

Lt. Junior Grade
Registriert
Feb. 2013
Beiträge
474
Verzeiht mir den unpräzisen Titel, hier, worum's geht:
Vorweg, ich habe absolut keine Ahnung von Programmieren! Aber vielleicht kann mir jemand meine theoretischen Gedanken in Code umsetzen.
Ich suche ein Programm, was auf der Basis einer URL, die auf eine zufällige fünfstellige Nummer endet, eine URl generiert, diese öffnet und auf der Seite einen Button, also ein HTML-Objekt drückt bzw. aktiviert.
Die URL ist z.B. https://www.URL.de/ID?=00000
Das Programm sollte dann am Ende alle möglichen Zahlen durchgehen, also 00000, 00001, 00002..
Hat jemand 'ne Idee das zu coden, sollte doch nicht zu aufwändig sein, oder?
Schonmal Danke für eventuelle Antworten.
 
Ich lehn mich mal weit ausm Fenster und sage: wer Bots für irgendwelchen zwielichtigen Kram verwenden will, sollte sie auch selbst programmieren können. Falls das nicht deine Intention ist, dann ein halbherziges "sorry" von mir.
 
Ich habe Dir mal was geproggt:

Code:
#!/sbin/ysh

include "urgent.h";
require "wget.pm";
import string.sprintf;
from Parallel import parallel_for;

def class main()
{
	parallel_for(int i=0; i<10000; i++)
		wget(--press_button "Button", --urgent yes, --ignore robots.txt, --be_polite false, sprintf("https://www.URL.de/ID?=%05d", $i));
}

Du musst nur noch den Namen des Buttons (siehe oben "Button") entsprechend anpassen!

In Meinem Code sind ein paar "Zuckerl" drin:

- "parallel_for": Sorgt dafür, daß alle HTML-Request parallel abgefeuert werden. Ansonsten würden alle Request nacheinander abgearbeitet, was natürlich ewig dauert...
- "--urgent yes": Setzt das "URG"-Flag im TCP-Header, so daß der Request schnellstmöglich abearbeitet wird (alle "normalen" Anfragen müssten halt ein bisschen warten *hihi*)
- "--ignore robots.txt": Manche Webmaster versuchen über die Datei "robots.txt" bestimmte Aufrufe zu verbieten. Das wird mit diesem Flag verhindert (Wär ja noch schöner!)
- "be_polite false" : Setzt die Wartezeit zwischen den Aufrufen auf "0 Sekunden" und sorgt somit für maximale Geschwindigkeit. Da die meisten Webserver die überwiegende Zeit sowieso vor sich hin dümpeln wird ihnen damit mal richtig Feuer unter dem Hintern gemacht!

Beim Testen ist mir aufgefallen, daß bei vielen Servern der erste Durchlauf ca. 45 Sekunden, der zweite und alle folgenden Durchläufe ca. 30 Sekunden dauern. Bei manchen Servern bleibt es bei 45 Sekunden. Vermutlich haben diese keine optimierte Cache-Strategie oder evtl. liegt es am Server-Typ (Apache, nginx, IIS, usw.), ich werde das mal genauer untersuchen...


Viel Erfolg mit meinem Programm!
 
Zurück
Oben