Welche Archiven lassen sich auf ihre Integrität überprüfen?

Bruce_L

Cadet 4th Year
Registriert
Okt. 2010
Beiträge
67
Hallo,

bin mir nicht ganz sicher, in welches Unterforum das gehört, ich schreib's mal hier rein, weil es ja auch mit Datensicherung/-wiederherstellung zu tun hat.

"Archiv" meine ich jetzt mal ganz allgemein, also einmal natürlich die typischen Kompressionsformate:

.zip
.rar
.7z

aber auch CD-Images, also

.iso
.img
.bin
.uif

und die gängigsten Installer, also die auf InstallShield basieren oder die .msi (Windows Installer).


Welche bringen Informationen mit sich (z. B. Prüfsummen) mit denen man sie auf ihre Integrität überprüfen kann? Die allermeisten, oder?

Aber .iso ja z. B. anscheinend nicht, da hab ich mal ein ein .iso-Image unvollständig runtergeladen, das ließ sich mounten ohne dass irgendeine Warnung angezeigt wurde.

Gibt's da irgendwo eine Übersicht online?
 
mmh... scheint wohl keinen zu interessieren... :D

Ich hab mal mit einem Hexeditor ein paar Experimente gemacht:

1. Lässt sich nicht auf Integrität überprüfen:
.iso

2. Lässt sich mit 7-Zip auf Integrität überprüfen, 1-Byte Fehler wird erkannt, (mit 7z.exe t <Archiv>):
.rar
.zip
.7z
.cab

3. Lässt sich mit anderen Programmen auf Integrität testen:
.uif (MagicDisc)
.msi (der Installer führt eine Überprüfung durch, das .msi Archiv lässt sich zwar mit 7zip testen, aber es erkennt keine Fehler, liegt wahrscheinlich daran, dass die .cab-Archive, die in dem .msi-Archiv liegen, von 7-Zip nicht noch mal einzeln getestet werden)




.img (mit .ccd und .sub) werde ich bei Gelegenheit auch noch testen.
 
Ich will dir ja nicht deinen spieltrieb kaputt machen, aber sinnvoller wäre es vielleicht zu einer jeden datei die MD5-checksumme mit zu speichern. Das kann ein mini-skript schnell erledigen.
Dann weiß man natürlich nicht ob jetzt die daten oder die checksumme kaputt sind, aber das ist auch egal, fehler treten häufig in einem ganzen bereich auf, auf festplatten wie auf optischen medien.

dadurch machst du dich auch von seltsamen formaten unabhängig, von denen man nie weiß ab wie viel fehler sie überhaupt nicht mehr funktionieren. vor allem in bezug auf kompression.
ich persönlich steh ja nicht so auf kompression bei backups und sichere lieber datei für datei, aber das musst du selbst entscheiden ;)

noch schöner wäre es das gechecksumme auf die dateisystemebene auszulagern. leider gibt es da gerade noch nicht viele optionen, für windows schon gar nicht.

PS: falls du komprimieren möchtest kann ich LZMA2 empfehlen (im xz format, kp obs das auch für windows gibt^^). Das speichert auch ein paar paritätsdaten zum wiederherstellen defekter blöcke, kann also mehr als sie nur zu erkennen. Und die kompressionsrate ist die beste die ich bisher gesehen hab, bei einem schnellen vergleich sogar deutlich besser als das neuste rar, was natürlich zufall gewesen sein kann.
 
Zuletzt bearbeitet von einem Moderator:
Hallo nochmal (nach drei Wochen ;-) )...

du hast recht, das mit den Prüfsummen bei Dateien, an denen man nix mehr ändern will und die nur archiviert werden sollen, ist the way to go... Hätte ich es nur gleich so gemacht !!! :pcangry:

Problem ist, meine Festplatte hat den Geist aufgegeben und ich hatte die neueren Dateien noch nicht auf DVDs gesichert... sie ließ sich aber noch teilweise auslesen, hat sich aber wirklich übel dabei angehört.

Festplatten machen, so hab ich gehört, irgendwie schon von selbst so einen Prüfsummencheck, d. h. sie melden I/O-Fehler, wenn die berechnete Prüfsumme des gelesene Blocks nicht mit der gespeicherten übereinstimmt... hab ich recht? ... wo kann man sich eigentlich informieren zu dem Thema?

Nun ist es aber so gekommen, dass anscheinend einige "Dateipointer" kaputtgegangen sind, die der Platte sagen, wo sich die zu einer Datei gehörigen Daten auf der Platte befinden.

Also ich kopiere z. B. die Datei x.mp3 und merke, , wenn ich sie abspiele, dass die aus zwei mp3-Dateien zusammenverschmolzen ist (ist natürlich erstaunlich, dass diese Datei überhaupt noch abgespielt werden konnte... foobar2000 verzeiht anscheinend recht viel).

Ich konnte also nur noch Dateien rüberkopieren, die ich nachher auf ihre Integrität prüfen konnte, sonst hätte ich eine Datenmüllhalde gehabt!

Das meiste davon waren eben nun zum GLÜCK Archive (die hatte ich nocht, weil ich sie nach dem Entpacken nicht gelöscht hatte), und ein paar CD-Images.

Also rüberkopiert und mit 7zip automatisiert überprüft, 98% waren noch ganz, die restlichen 2% TOTAL kaputt... puh!

Ich hätte mir aber das Rumspielen wirklich sparen können:
http://en.wikipedia.org/wiki/Comparison_of_archive_formats

Da steht, welche Archivtypen einen "Integrity check" haben.
 
Ja festplatten erkennen defekte sektoren mittels CRC. mir ist aber keine durchgehend verlässliche toolchain bekannt die selbstgemachte checksummen ersetzen kann. vielleicht meldet die hdd den fehler auch erst gar nicht um den hersteller nicht in misskredit zu bringen?

Simple mp3 basieren rein auf frames, also eigentlich ein leichtes die auch zusammengewürfelt abzuspielen ;)
Videos sind da schon komplexer.

Bei der kompression musst du halt aufpassen, dass nach einem fehler nicht plötzlich alle nachfolgenden daten müll sind, wie beim DEFLATE algorithmus (zip/gzip). Aber LZMA(2) macht das besser.
 
Danke für die Tipps, hast mir sehr geholfen!
 
Zurück
Oben