Für Aufgaben in denen Text zwepflückt werden muss emfpehle ich Perl.
Außerdem gibt es da sogar Module/Packages, die den Zugriff ins Netzwerk erlauben. Html Seiten als Textdatei runterladen sollte da kein großen Problem sein.
Ein Kumpel hat mal in Tcl/Tk, auch so eine scriptartige Srache wie Perl, ein Programm geschrieben, das Webseiten runterlädt zum Offline-Browsen.