Hi CB`ler,
ich möchte einen ziemlich simplen (Tree-based?) Wrapper erstellen, weiß aber noch nicht in welcher Sprache bzw. allgemein wie ich das am besten realisieren könnte. Der Wrapper muss nur eine einzige Sache können: Aus einer HTML-Datei bestimmte Dinge in eine XML-Datei extrahieren. Zum Beispiel den Text im <p>-Element der HTML-Datei in ein <xyz>-Element der XML-Datei. Es geht dabei nur um eine einzige HTML-Datei. Es geht also nicht darum, eine Datenbank im Internet zu durchforsten oder ähnliches.
Ich brauche nur ein paar Anhaltspunkte oder vielleicht gibt es irgendwo ein Tutorial?
ich möchte einen ziemlich simplen (Tree-based?) Wrapper erstellen, weiß aber noch nicht in welcher Sprache bzw. allgemein wie ich das am besten realisieren könnte. Der Wrapper muss nur eine einzige Sache können: Aus einer HTML-Datei bestimmte Dinge in eine XML-Datei extrahieren. Zum Beispiel den Text im <p>-Element der HTML-Datei in ein <xyz>-Element der XML-Datei. Es geht dabei nur um eine einzige HTML-Datei. Es geht also nicht darum, eine Datenbank im Internet zu durchforsten oder ähnliches.
Ich brauche nur ein paar Anhaltspunkte oder vielleicht gibt es irgendwo ein Tutorial?