VeraPDF - Error bei Ausgabe des HTML Reports

Thukydides · 3. Februar 2021

Hallo,

ich beschäftige mich gerade innerhalb meines Informatikstudiums mit der Lanzgzeitarchivierung und hier im speziellen mit VeraPDF. Dies ist ein Tool das PDF/A Dateien auf ihre Richtigkeit validiert. PDF/A ist ein spezielles PDF Format das speziell für die Langzeitarchivierung entwickelt wurde um auch noch nach Jahrzehnten der Lagerung eine Lesbarkeit gewährleisten zu können.

PDF/A: https://de.wikipedia.org/wiki/PDF/A

VeraPDF: https://openpreservation.org/products/verapdf/

Mein Problem ist jetzt, dass wenn ich eine Validierung in VeraPDF durchführe, ich immer den folgenden Fehler bekomme: "IOException when saving the HTML report".

Diesen HTML Report brauche ich aber, da ich hier genau sehen kann, welche Probleme möglicherweise vorliegen oder auch die Richtigkeit so bestätigen kann. Man bekommt zwar auch die kurze Info das es in Ordnung ist, aber ich muss da mehr ins Detail gehen können.

Alternativ kann man auch einen XML Report lesen, aber der ist doch sehr unübersichtlich für die alltägliche Nutzung. Wisst ihr wo das Problem liegen kann? Ich glaube VeraPDF läuft auf Java und hier wird ja auch eine Esception geworfen.

System:

Windows 10 Pro 2004
Java SE 11

Würde mich über Hilfe sehr freuen

Demon_666 · 3. Februar 2021

Schreibrechte für den save-Ordner vorhanden?
bugreport an die Entwickler?

dj-melo · 3. Februar 2021

versuch mal https://www.pdf-online.com/osa/validate.aspx

Thukydides · 3. Februar 2021

@Demon_666

Bugreport habe ich mal bei Github erstellt, aber jetzt noch keine Antwort (Ist auch erst 30 Minuten her).

Mhm ich schau mal nach wo das gespeichert werden könnte. Wie genau würdest du das dann einstellen? Über Ordner -> Eigenschaften?

@dj-melo

Ich muss mich ganz spezfisich mit VeraPDF als Open-Source Validierer beschäftigen, deshalb kann ich jetzt nichts anders nutzen.

Vasdada · 3. Februar 2021

dann fangen wir mal klein an. (was für ein informatikstudium traurig ist)

verapdf welche Version?
java -v welche version ist aktiv?
Administrator rechte vorhanden?
Funktioniert es an einem anderen notebook (oder freund) auch/auch nicht? (windows)
Schonmal mit CLI probiert und geklappt?
Installier bitte mal JAVA JDK

https://docs.verapdf.org/

ist der output pfad denn richtig gesetzt?
\ und nicht /

was passiert denn, wenn du view html auswählst?

pfad:

ach und ps, bitte die ZIP datei entpacken und alle 3 dateien in ein verzeichnis kopieren.
\

wie oben beschrieben einmal mit cli testen.
https://docs.verapdf.org/cli/

https://docs.verapdf.org/install/

gerade als informatiker...(heul)

"Alternativ kann man auch einen XML Report lesen, aber der ist doch sehr unübersichtlich für die alltägliche Nutzung. Wisst ihr wo das Problem liegen kann? Ich glaube VeraPDF läuft auf Java und hier wird ja auch eine Esception geworfen."

ist XML wichtiger! du kannst das xml einfach per Powershell/programmiersprache parsen und somit in sekundenschnelle prüfen lassen ob es einen ERROR gab oder nicht! und diese dir dann auch per email z.b. zuschicken lassen oder push oder oder, was du noch in deinem informatikstudium so lernst.
PDF ist müll und nutzt nur jemand der zuviel zeit hat.

eigentlich solltest du ohne gui areiten.
einen arbeitsordner anlegen, taskplaner aktivieren mit CLI verapdf. dort dann stündlich die dokumente die im arbeitsordner drinliegen verarbeiten und dann verschieben. ergebnis dann per xml in das log verzeichnis und dann hier nochmals per xml parser prüfen lassen ob error vorliegt. alles automatisiert.

Demon_666 · 3. Februar 2021

Thukydides schrieb:
Mhm ich schau mal nach wo das gespeichert werden könnte. Wie genau würdest du das dann einstellen? Über Ordner -> Eigenschaften?

Ich kannte das Programm bis eben nicht

und habe es auch nicht installiert. Das sind nur die "Standard-ToDos", die ich grundsätzlich bei so einem Problem versuche als erstes auszuschließen.

Es könnte auch daran liegen, dass bspw. versucht wird auf einem Netzwerklaufwerk mit einem Laufwerksbuchstaben zu speichern. Manche Programme kommen dann mit der Netzpfadauflösung nicht zurecht.
Mach mal auf c: einen Unterordner und versuche dort den Report speichern zu lassen.

dj-melo · 3. Februar 2021

bei mir liest der browser das html aus \Local\Temp\veraPDF-tempHTMLReport3749280612115970288.html was versucht er bei dir?

Demon_666 · 3. Februar 2021

Vasdada schrieb:
PDF ist müll und nutzt nur jemand der zuviel zeit hat.

Das ist jetzt doch etwas übertrieben

Vasdada · 3. Februar 2021

leider doch, ein mensch macht fehler, ein algorithmus in sofrwaredargesetllt macht keien fehler(der arbeitet strikt so wie er entwicklet wurde) , vorausgestzt die quelldaten sind richtig.

dann ändere bitte einmal das netzlauufwerk in einen lokalenpfad um. bitte

Thukydides · 8. Februar 2021

@dj-melo Bei mir kann er das gar nicht erst abspeichern, dass ist das Problem.

Aber versuche es jetzt mal in einer VM zu öffnen. Werde sonst halt die XML Datei verwenden, ist ja auch nicht so wild.

Danke schon mal für die Hilfe.

Suche

VeraPDF - Error bei Ausgabe des HTML Reports

Thukydides

Lt. Commander

Demon_666

Commodore

dj-melo

Lt. Junior Grade

Thukydides

Lt. Commander

Vasdada

Gast

Demon_666

Commodore

dj-melo

Lt. Junior Grade

Demon_666

Commodore

Vasdada

Gast

Thukydides

Lt. Commander