Hi,
langer Weihnachtsurlaub steht an und ich möchte mein bisheriges Skript (loggt sich auf Webseiten ein und sucht einige Informationen zusammen) mal erneuern. Das bisherige Skript wurde vor Jahren in Ruby + Mechanize geschrieben und wird als Cronjob auf meinem Windows-Server ausgeführt. Damals war ich blutiger Anfänger - heute würde ich es gerne schöner lösen.
Am liebsten würde ich die neue Version im Python schreiben (damit wollte ich eh mal mehr machen)? Spricht das etwas dagegen?
Gibt es hier eine Art Standard/häufig genutzte Library für solches Web-Crawling?
Sehr hilfreich wäre es auch, wenn man irgendwie mit JavaScript-Inhalten umgehen könnte (oder vielleicht sogar mal einen Screenshot von einer der gecrawlten Seiten erstellen kann... Falls das überhaupt denkbar ist).
Zu guter Letzt wäre es noch ganz nett, wenn das Skript am Ende unter Linux und Windows laufen könnte.
Viele Fragen - ich weiß. Ich erhoffe mir einfach eine Antwort von jemandem mit Erfahrung, ob das der Weg ist, den ich nun Richtung Python gehen sollte.
langer Weihnachtsurlaub steht an und ich möchte mein bisheriges Skript (loggt sich auf Webseiten ein und sucht einige Informationen zusammen) mal erneuern. Das bisherige Skript wurde vor Jahren in Ruby + Mechanize geschrieben und wird als Cronjob auf meinem Windows-Server ausgeführt. Damals war ich blutiger Anfänger - heute würde ich es gerne schöner lösen.
Am liebsten würde ich die neue Version im Python schreiben (damit wollte ich eh mal mehr machen)? Spricht das etwas dagegen?
Gibt es hier eine Art Standard/häufig genutzte Library für solches Web-Crawling?
Sehr hilfreich wäre es auch, wenn man irgendwie mit JavaScript-Inhalten umgehen könnte (oder vielleicht sogar mal einen Screenshot von einer der gecrawlten Seiten erstellen kann... Falls das überhaupt denkbar ist).
Zu guter Letzt wäre es noch ganz nett, wenn das Skript am Ende unter Linux und Windows laufen könnte.
Viele Fragen - ich weiß. Ich erhoffe mir einfach eine Antwort von jemandem mit Erfahrung, ob das der Weg ist, den ich nun Richtung Python gehen sollte.