Produktverfügbarkeit abrufen mittles Phyton, Javascript?!

gabdev

Newbie
Registriert
Jan. 2020
Beiträge
1
hallo,
es geht um einige hunderte links zu jeweiligen produktseiten.
Dort ist bei manchen das Wort "ausverkauft" zu finden. Diese würde ich gerne herausfiltern. das ganze könnte als ausgabe in einer tabelle geschehen wo der link in einer spalte ist und in der benachbarten Zeile. Ein "Wahr" oder "Falsch" je nachdem ob das Wort "ausverkauft" auf diesem Link auftaucht. welche Programmier sprache würde sich dazu bestenfalls eignen? Über ideen Vorschläge, wäre ich sehr dankbar.
Gruß
 
Das geht mit jeder Programmiersprache PHP, python, Java etc. Mit JavaScript geht das bestimmt auch irgendwie, ist aber nicht sehr performant.

Mit php lädst du das html einfach:
$html = file_get_contents('http://stackoverflow.com/questions/ask');

und machst dann strpos mit "ausverkauft".
 
  • Gefällt mir
Reaktionen: Makso und han123
Geht mit absolut allem.
Einfach nach folgendem Muster googlen, auf englisch:
Code:
<Sprache> <Vorgang>
für Vorgang setzt du dann zu deinem Beispiel passend ein:
  1. Über urls iterieren
  2. Website downloaden
  3. Text in String finden
  4. Tabelle in <html|excel|sonstwas> ausgeben
Ich würd's mit Python probieren.

Viel Erfolg.
 
Knito schrieb:
Mit JavaScript geht das bestimmt auch irgendwie, ist aber nicht sehr performant.
Mit Javascript und der EventLoop (Stichwort asynchron) gebe ich dir das Ergebnis schneller als du mit PHP und einer for loop über die links gefolgt von deinem Ansatz.
 
  • Gefällt mir
Reaktionen: Rassnahr und new Account()
Bagbag schrieb:
Mit Javascript und der EventLoop (Stichwort asynchron) gebe ich dir das Ergebnis schneller als du mit PHP und einer for loop über die links gefolgt von deinem Ansatz.

Es gibt auch für php eventLoops (nur eben nicht buildin) (reactphp(braucht keine extra extension allerdings skalliert es besser mit einer extension wie libevent) oder swoole (sehr mächtig aber muss nachinstaliert werden und Xdebug funktioniert nicht damit)), ansonsten gebe ich dir recht Standardmäsig ist das mit nodejs besser umzusetzen.
 
Zuletzt bearbeitet:
gabdev schrieb:
es geht um einige hunderte links zu jeweiligen produktseiten.
Hauptsache nicht bei jedem Seitenaufruf alle hunderte von Links überprüfen, das wird dir der Betreiber sonst übel nehmen und kann auch als Beeinträchtigung/Angriff seines Server gewertet werden.
Lieber einen Daemon im Hintergrund der alle 30 Sekunden einen Link prüft, so dass jeder Link über den Tag 2-3x aktualisiert wird.
 
  • Gefällt mir
Reaktionen: gabdev
Das geht mit jeder x beliebigen höheren Programmiersprache. Waehle diejenige die du am besten beherrscht.
Was genau möchtest Du denn für einen Hinweis haben?
 
Zurück
Oben