Parsen von Preisen einer Webseite?

FrazeColder

Lt. Commander
Registriert
Okt. 2013
Beiträge
1.718
Guten Tag zusammen,

Ich würde gerne mir ein Script oder ähnliches, ich kann leider nur Java, schreiben, welches mich Benachrichtig, sobald ein Produkt bei einem gewissen Anbieter günstiger ist, als bei einem anderen.

In dem HTML Code sieht das ganze so aus:
Unbenannt.JPG

Da ich leider keine Ahnung von Scirpts oder PHP habe, würde ich euch gerne mal fragen, wie viel Aufwand das ist und wie ich das denn umsetzten/lernen kann?

MfG und Vielen Dank
 
Und was hat das mit seiner Frage zu tun? Er will Anbieter vergleichen - nicht wissen wann das Produkt einen Preis unterschreitet.
 
An für sich sollte sowas relativ schnell geschrieben sein, soweit ich mich zurück erinnere würde ich folgende Funktion benutzen:

PHP:
@fopen();

PHP:
trim();

PHP:
feof();

PHP:
strstr();


Im Prinzip öffnest Du eine Webseite, lädst den kompletten Inhalt in eine Variable, und durchsuchst dann den Inhalt.

Filterst Dir die passenden Teile mittel schleife raus ( Start und Ende definiert ) und gibst am Ende nur das gewünschte Resultat aus.

** Und jetzt stelle ich gerade feste, es bringt Dir absolut nichts xD
Sorry!
 
Zuletzt bearbeitet: (... Aktualisiert)
Mit RegEx könntest du alle Preise und deren Anbieter im html matchen und dann eben vergleichen..

Sofern die Website sich nicht mit Javascript aufbaut, ist das kein Problem.
 
Bagbag schrieb:
Mit RegEx könntest du alle Preise und deren Anbieter im html matchen und dann eben vergleichen..

Sofern die Website sich nicht mit Javascript aufbaut, ist das kein Problem.

Meine Frage ist halt, da ich kein Script kann, wie mache ich das...? :/
 
Wurde doch bereits erwähnt mit Java, dass du wohl kannst und jsoup. Jsoup unterstützt dich dabei beim parsen des Website-Quelltexts. "Script" brauchst du da nicht können nur Java ;)

https://jsoup.org
 
RegEx hat nichts mit Skripten zu tun. Du musst eben einen passenden Ausdruck "entwickeln", den du dann mit Java nutzen kannst.
 
obwohl es funktioniert.
Auch der Fall ist dort als Antwort 2 zu lesen:
http://stackoverflow.com/a/1733489
Die Voraussetzung "it's sometimes appropriate to parse a limited, known set of HTML" ist hier beim TE aber nicht erfüllt, oder? Er generiert die Preisübersicht schließlich nicht selbst.
Ist doch eine tolle Gelegenheit sich direkt jsoup anzugucken, womit man das scheinbar machen sollte unter Java anstatt es irgendwie mit RegEx hinzumurkes und beim nächsten mal, wenn der TE wieder eine website parsen muss, auf die Nase zu fallen. Bringt ja auch nix wenn ers hinbekommt und dann zB auf der Arbeit so eine Aufgabe versucht wieder mit RegEx anzugehen und alle ihn schief angucken ;)
 
Zuletzt bearbeitet:
Endoro schrieb:
Ich habe auf Stackoverflow das Parsen von HTML bzw. XML mit Batch, sed oder awk häufiger empfohlen und regelmäßig eins auf den Deckel bekommen, obwohl es funktioniert. :D

Natürlich kann man damit eine Lösung basteln, aber mit einer spezialisierten Lib braucht es viel weniger Aufwand (und ggf. Wissen). Mit jsoup benötigt man drei Zeilen Code, um die gewünschten Preise zu ermitteln. Und robuster und leichter wartbar dürfte die Lösung damit auch sein. Aber jeder wie er mag ;)
 
Zurück
Oben