eehm schrieb:
Und mir bringt nur ein fehlerfreies Backup im Ernstfall etwas und für den Ernstfall will jetzt beide Backups auf ZFS haben und nicht nur den Master Server und dann immer per robocopy kopieren!
Die snapshots sind zumindest bei uns RO. Wenn müsste er die also alle entfernen und das traue ich jetzt im Allgemeinen keiner ransomware zu.
Aber selbst dann kann man die snapshots vor löschen sichern.
Dann wird es ziemlich schwer da was zu machen. Außer halt die Platten komplett platt machen. Aber das sollte dann nicht auf das remote System gehen meines Wissens nach.
PHuV schrieb:
Machst Du das ernsthaft bei jedem Servern, daß Du das RAM vorher explizit prüfst? Auf Consumerboard hatte ich schon fehlerhafte RAMs, aber bei ECC und Registered RAM ist mir sowas in 30 Jahren noch nicht untergekommen.
Ja machen wir. Jeder Server dreht erst mal ne kleine Runde HPL, Stream usw. Wir lassen jetzt keinen Memtest explizit laufen, aber Fehler fallen auch so schon auf da die Performance nicht passt. Wenn es nur z.b. 10 ECC am Tag sind, fällt das beim Logging auf und der Server dreht halt noch ne Runde.
Wichtig ist halt sie Totalausfälle zu sehen, die die Leistung nicht bringen und das ist in <30 Min erledigt.
rg88 schrieb:
Der Trojaner kann dir dein ganzes System verschlüsseln, einschließlich deiner Snapshots. Ist zwar kein allzu wahrscheinliches Szenario, aber genau das ist es ja, was man versucht mit einem Backup zu machen: Für einen unwahrscheinliches Ausfall eine Sicherheit zu haben
Siehe oben. Das sollte nicht möglich sein mittels remote SYNC per ZFS Mechanismen.
PHuV schrieb:
Also Du bootest dann wirklich per CD/DVD/USB auf dem Server ein eigenes OS mit Memtest? Gut, wäre eine Überlegung wert. Aber nochmals die Frage, hast Du jemals im Serverbereich ein fehlerhaftes UDIMM oder RDIMM gehabt? Gut, ich hab jetzt nicht hundere von Servern gehabt, aber schon einige über die Jahre, und hier hatte ich bisher noch keinen einzigen fehlerhaften Riegel.
Warum nen anderes OS? Das ist maximal ein anderer Eintrag im Bootloader den man auswählen muss. Alternativ im gebotenen Zustand das System testen und gut ist. Etwas testen sollte man schon. Memtest jetzt für 24h laufen lassen ist übertrieben.
Und Mem Fehler sind nicht selten. Wir haben so 0.1-1% die Ram Fehler zeigen. Da reicht es oft schon den Riegel neu zu stecken, aber es sind auch alle paar hundert Server mal nen wirklich kaputter dabei. Wir treten die Kisten daher auch immer kräftig. Gerade während der burnin Phase hat das System auch viele Lastwechsel. Da wird schon kräftig geschüttelt bis alles stabil ist.
In den ersten Monaten Betrieb hat man recht viel zu tun. Danach wird es ruhig. Meistens so für 2-3 Jahre und dann merkt man das es wieder langsam mehr wird.