gea schrieb:
1S3 heißt ja nicht, dass nur eine Kopie auf S3 liegt. Jeder kommerzielle S3 Dienst ist als Hochverfügbarkeits Cluster konfiguriert, bei dem die Daten selbsständig im Cluster repliziert werden. Privat oder Inhouse hat man die Option, nur einen einfachen S3 Server zu nutzen oder auch mit mehreren einen Cluster zu bilden, der automatisch die Daten mehrfach hält, inkl. Versionierung so wie lokale ZFS Snaps. Der manuelle Aufwand des 321 Verfahrens entfällt.
[...]
gea schrieb:
Redundanz bei S3 erfolgt auf Node Ebene, auch mit einfacher Hardware. Fällt ein Node aus, arbeitet der Cluster weiter.
Ich glaube du hast meinen Punkt nicht verstanden. Mit dieser Argumentation könnte man sich auch ein einzelnes Storage-System schönreden. Von wegen, "Das besteht aus mehreren Nodes, Controllern, whatever... ist also redundant... da passiert nichts".
Kann man alles so machen. Aber das zeigt dann nur, dass man entweder den Kern hinter der 3-2-1 Strategie nicht verstanden hat bzw. es dir nie darum ging bzw. zukünftig nicht mehr darum gehen wird.
Bei der 3-2-1 Strategie ist der Hauptgedanke/Hauptanspruch, dass du drei physisch komplett unabhängige Kopien deiner Daten hast. Damit, vereinfacht gesagt, das täglich genutzte Storage ausfallen kann und während du vom eigentlichen Backup wiederherstellst auch einen Ausfall des vermeintlichen Backup-Storages überstehst.
In der Praxis sind die
ersten beiden Kopien, also der Ort wo die Daten täglich verwendet werden und auch wo sie täglich als Sicherung abgelegt werden, meistens
am gleichen Ort. Jetzt braucht es aber nur ein Feuer, eine Naturkatastrophe, teilweise nur einen Blitzvolltreffer oder einen Ransomeware-Incident um diese beiden Kopien mit einem Schlag unbrauchbar zumachen. Und in dem Moment hilft dir dann die
dritte Kopie an einem
ganz anderen Ort.
Ich bezweifle stark, dass du ein Ceph, S3 oder was auch immer mit 3 Nodes an verschiedenen Orten betreiben wirst. Das ist illusorisch. Es gibt Gründe wieso das niemand macht. Der nennt sich Latenz. Und selbst wenn du das wirklich machen würdest hast du eben nicht wirklich 3 völlig unabhängige Kopien: Wenn dir auf einer Node eine Datei kaputt geht, repliziert sich diese Änderung im Idealfall auf alle anderen Nodes und du hast jetzt 4 unbrauchbare Kopien (das "Original" + die 3 Kopien von deinen S3 Nodes).
gea schrieb:
Ein Problem des S3 Backups könnten ACL Permissions sein. Die landen nicht so ohne weiteres im S3 Backup.
Hier geht man hin und erstellt unter Windows bspw. mit icacls oder unter Linux mit getfacl ein Textfile in welchem die ACLs gespeichert sind was selbst wiederum normal gesicht wird.
gea schrieb:
Problem kann es mit jeder Software geben. Meist sind aber Daten gut, kann man ja mit dem unabhängigen Tool Restic Browser testen (Ich werde wohl auf das Multi-OS CLI Tool Restic setzen).
Ich fürchte, auch hier konntest du mir nicht folgen. Selbst wenn ich meine Daten in vermeintlich einfache ZIP-Archiven ablege (das Windows Backup hat dies ja einmal so gemacht) ist das bereits ein Komplexitätslayer der Probleme machen kann. Und wenn wir von Dateien sprechen, sprechen wir irgendwann unweigerlich von Bitrot/CRC Fehlern. Und nein, dem kann man nicht damit begegnen indem das jeweilige Backup-Programm von Haus aus Reed-Solomon oder ähnliches unterstützt. Wieso nicht? Schau' dir an was genau passiert, wenn eine Datei kaputt geht. Nutzt du NTFS wird also ein kompletter Cluster (Standardmäßig 4KB, kann aber größer sein) ausfallen. Wenn diese 4KB an der falschen Stelle fehlen, ist mitunter das gesamte Archiv/Chunk kaputt. D.h. du bist zwar irgendwie etwas geschützt, aber nicht wirklich. Und genau das ist nicht der Sinn von einem Backup. Ein Backup muss vorhersagbar und verlässlich sein.
gea schrieb:
Rsync ist local schnell, nicht so sehr bei großen Internet Backups
Auch hier scheinst du mich nicht verstanden zu haben. Dein Restic/kopia legt irgendwo das Backup ab (bspw. in D:\Kopia-Backup). In der kopia-Fachsprache wird der Ort "Repository" genannt. Dieses Verzeichnis, in dem jetzt die deduplizierten und meinetwegen komprimierten Chunks liegen (D:\Kopia-Backup) dupliziere ich in meinem Falle auf das Storage von rsync.net. Um die Verzeichnisse synchron zu halten verwende ich rsync. Ich verwende rsync
nicht um das eigentliche Backup zu erstellen.
Analogie: Statt D:\Kopia-Backup hönnte ich das Backup auch auf der lokalen MinIO-Instanz ablegen. Statt rsync würde ich dann bspw. rclone nutzen um das lokale Bucket zusätzlich auf an einem anderen, entfernten Ort vorzuhalten.
Wenn du bislang die Wiederherstellung noch gar nicht getestet hast empfehle ich dir sehr, dich damit zu erst auseinander zusetzen bzw. mit allem was essentiell ist, bevor du dich um Quality-Of-Life Verbesserungen wie kümmerst. Denn wenn das Konzept an sich schon nicht aufgeht, weil bspw. die Mean Time To Recover zu hoch ist, interessiert der Rest nicht mehr.
PS: Von welchen Datenmengen sprechen wir eigentlich, die du mit deinem Konzept sichern möchtest? GB? 1-5TB? 50TB? 100TB? Und wie häufig ändern sich die Daten?