Java Java SAXParser, "Leerzeichen erforderlich"

fritz222

Cadet 4th Year
Registriert
Sep. 2011
Beiträge
71
Hallo zusammen,

Ich möchte ein HTML-File von einer Webseite im Internet mit dem SAX-Parser durchgucken. Ich krieg jedoch diesen Fehler:

- org.xml.sax.SAXParseException: Zwischen publicId und systemId sind Leerzeichen erforderlich.

Soweit ich mich bisher schlau gemacht habe liegt dies am HTML-File, ist das so? Wenn ja, kann ich den Parser irgendwie so konfigurieren, dass er diese Überprüfung der System-ID nicht macht?

Herzlichen Dank für eure Hilfe.
MfG fritz222
 
Du könntest probieren, die Validierung auszuschalten. Wobei es wie bereits gesagt, sinnvoller sein sollte für HTML einen HTML-Parser zu verwenden. Je nach Webseite wirst Du mit einem XML-Parser kein Glück haben.

SAX-Parser gibt es übrigens viele...
 
Lol. Da hät ich ja gleich drauf kommen können, dass es ein HTML-Parser gibt.:freak:

Herzlichen Dank für den Tipp.:daumen:

Gruss fritz222
 
Zurück
Oben