RED-Bit schrieb:
Vergiss das sofort wieder, so programmiert man nicht. Wie ich bereits sagte, ohne Zugriff auf das CMS sehe ich da keine vertretbaren Möglichkeiten
Dem kann ich kaum zustimmen. Vor allem für den privaten Gebrauch, bei dem man niemand Garantien für irgendetwas geben muss, ist das Auslesen sehr wohl eine vertretbare Möglichkeit. Zumal man leicht Validierungen einbauen kann, die die Plausibilität der Daten einwandfrei prüfen können.
Ein Skript auf meinem Homeserver holt sich beispielsweise zu allen unbekannten eingehenden Rufnummern die Details über eine Rückwärtssuche im Netz. Läuft seit Jahren, geändert werden musste nie was. Klar, das muss bei den Seiten des TS nicht so laufen, aber dass die ihre Struktur wöchentlich oder monatlich ändern, ist dann doch eher unwahrscheinlich. Und möglicherweise anfallende Änderungen sind eine Sache von 5 Minuten.
edit: gerade einfach mal zum Spaß drei Seiten mit Lottozahlen aus der Google-Suche analysiert und alle präsentieren die Zahlen (HTML-technisch betrachtet) auf dem Silbertablett...
edit2: über
http://web.archive.org/ hat sich außerdem ergeben, dass die Struktur von 2 der 3 Seiten im Januar 2013 genau gleich aussah.
Wenn du dich mit deiner Aussage jedoch darauf beziehst, die Daten von beliebigen, im voraus unbekannten Seiten zu holen, dann stimme ich dir natürlich zu. Der Anwendungskontext ist aus dem gegebenen Text eh kaum herauszulesen.
can320 schrieb:
Regex und sich durch den html Code wühlen ist nichts für Leute die überhaupt nicht programmieren können.....
Genauso wenig, wie Regex für HTML gemacht wurde.