Backuprechenzentrum (Blades + SAN mit VMWare)

Zensai

Boba Fett
Administrator
Registriert
Aug. 2008
Beiträge
13.003
Hallo zusammen,

meine Frage richtet sich an die erfahrenen Profis hier, da es leider (noch?) kein passendes Unterforum gibt.

Folgende Situation liegt vor.

Unser aktuelles Serversystem ist eine IBM DS 4400 mit 4 Blades (jeweils 2 DC Xenons), einem SAN mit 4 LUNs und ca 6 TB an Daten die im RAID 1/0 laufen. Dementsprechend also zuzüglich Kapazitäten für das Spiegeln und die HotSpares. Auf dem System laufen ca 40 VServer mit VMWare ESXi 4.x.

Es soll nun in einer externen Lokation ein Backupsystem aufgestellt werden, welches im Katastrophenfall eine bestmögliche Verfügbarkeit aufweist, so dass wir minimale Ausfallzeiten bei einem Brand, Einsturz, Weltuntergang(:D) haben und schnell weiterarbeiten können. Dieses Projekt habe ich mit zwei anderen Azubis nun bekommen und wir sollen das in Angriff nehmen.

Wir sind im Dienstleistungsgewerbe für IT unterwegs (Serverwartung und Instandhaltung, Hardwaresupport. Im Groben: Wenn bei jemandem die Systeme ausfallen, dürfen wir rennen.)


Was wir also definitiv brauchen:

Einen Cage in einem Rechenzentrum, bzw x Höheneinheiten (ich schätze mal ca 24)
Eine Standleitung von unserem Unternehmenssitz ins RZ (100 Mbit/s)

Welche Optionen wir nun für die Bewältigung dieser Aufgabe in Betracht gezogen haben.

1)
Ein zweites SAN inkl Blades ins RZ, Replikation über das VMWare Copy Feature. Sendet im Prinzip wohl nur die veränderten Dateiteile über das Netz. Ich frage mich jedoch, ob die Dateien auf lange sicht auch unbeschädigt bleiben, wenn ständig dran rumgefuchtelt wird, bzw zur Backupzeit die Datei exklusiv gesperrt ist o.ä.?

2)
Ein zweites SAN inkl Blades ins RZ, Replikation über "VEEAM Backup and Restore". Diese Software schickt wohl ganze Snapshots übers Netz.

3)
Ein komplettes System (in dem Fall die EMC Clariion AX4/CX4) welche dann in die lokation gestellt werden würde und per EMC RecoverPoint die Daten repliziert. Das System ist voll VMWare kompatibel(kein Wunder, ist ja auch EMC :D) und funktioniert wohl auch in Zusammenarbeit mit unserer DS 4400.


Die Replizierung soll asynchron im 15-30 Minutentakt erfolgen.

Was sind eure Meinungen? Habt ihr noch weitere Ideen?


LG,
Zensai
 
Wir haben bei uns "einfach" einen kompletten Spiegel. Einmal ein SAN mit den Storages und einmal ein LAN mit den Servern. Mit 2 VPN Tunneln sollte sich das ohne Probleme auch über weite Entfernungen Räumlich trennen lassen. Allerdings würden mir die 100MBit Bauchschmerzen machen... Wir haben alles in verschiedenen Gebäudekomplexen mit Gigabit angebunden. Das SAN Syncronisiert sich immer / aktuell (ein Spiegel halt) und die Server sind als VMWare Failover Cluster zusammengeschaltet.
 
Eine GBit Standleitung? Ich bin mir nicht sicher, in welchem finanziellen Rahmen sich das bewegen soll, dass solche Kosten mit drin sind...
 
ich sags mal so Gbit ist definitiv zu teuer ;-) alleine die 100Mbit Leitung kostet 2000 € monat + 2000 Anschaffung.

Wir peilen Gesamtfixkosten von 50000 €+-10000€ an. Oder ist das arg verschätzt? Laufende kosten natürlich nicht eingerechnet

Wir haben 150 Mitarbeiter und im Hauptsitz sind ca 90 davon vertreten.
 
Die Optionen sind schonmal die richtigen Ansätze.

Prinzipiell hast du hier die Möglichkeit die Daten von der SAN selbst, von VMware mit Hilfe des Site Recovery Managers oder mit einem Drittanbieterprodukt wie Veeam Backup and Replication oder Quest (ehemals Vizioncore) vRanger zu replizieren. Jede Möglichkeit hat Vor- und Nachteile:

- Replikation mit der SAN:
Ist Warscheinlich die teuerste Lösung da die meisten SAN Hersteller sind die Optionen die dafür benötigt werden teuer bezahlen lassen und außerdem auf der anderen Seite auch wieder ein komplettes SAN vorhanden sind muss. Hat dafür allerdings den Vorteil, dass es potentiell die schnellste Lösung ist, allerdings dürfte hier ohnehin die Bandbreite der Querverbindung limitieren. Darüber hinaus mus die SAN die Replikation auch über iSCSI machen können, da ihr sonst noch eine FC Verbindung zwischen den Standorten braucht oder eine Box die von FC auf iSCSI umsetzt.

- Replikation mit Site Recovery Manager:
Ist meiner Meinung nach die zurzeit am besten funktionierende und robusteste Lösung da sie direkt von VMware kommt und sehr gut in die Umgebung integriert ist. Damit lassen sich Maschinen in bestimmten Intervallen über Netzwerk replizieren. Bei der nächsten Replikation müssen nur noch die Änderungen übertragen werden. Da passiert mit Hilfe des Changed Block Tracking Features des VMkernel, es müssen also nicht permanent Snapshots offen gehalten werden.

- Replikation mit Drittanbietern
Ist wahrscheinlich die günstigste Lösung. Hier übernimmt Veeam oder der vRanger die Replikation was ähnlich effizient funktioniert wie mit dem Site Recovery Manager. Die Replikation muss nicht unbedingt auf einen shared Storage erfolgen, in der Backup Umgebung reicht für den Notfall auch ein Server (oder mehrere) mit viel lokalem Storage, das spart zusätzlich Kosten ein.

Bei allem Aufwand muss man sicher aber nimmer vor Augen führen ob man im Disasterfall das andere RZ überhaupt nutzen kann bzw. dann braucht. Wenn das Gebäuse abgebrannt ist und keine Arbeitsplätze mehr da sind nützt es wenig wenn die Server in 15 min wieder laufen.
Wenn die Verbindung ins zweite RZ im gleichen RZ aufläuft das abgebrannt ist kommen die Mitarbeiter im Hauptgebäude überhaupt nicht mehr an die Ersatzserver ran…. Soll so ein Konzept wirklich funktionieren muss an weit mehr gedacht werden als nur die VMs an einem anderen Standort wieder zu starten.
 
Das Projekt läuft momentan nur Freitags.

Kennt hier jemand dieses Copy Feature von VMWare? Oder ist das der "Site Recovery Manager"?

Hat hier jemand im besten Fall irgendwo eine EMC Clariion oder ähnliches sogar in Benutzung?

Danke erstmal für die tollen Antworten =)

Post #1 schrieb:
Ich frage mich jedoch, ob die Dateien auf lange sicht auch unbeschädigt bleiben, wenn ständig dran rumgefuchtelt wird, bzw zur Backupzeit die Datei exklusiv gesperrt ist o.ä.?
Wie siehts damit aus?
Wenn die Verbindung ins zweite RZ im gleichen RZ aufläuft das abgebrannt ist kommen die Mitarbeiter im Hauptgebäude überhaupt nicht mehr an die Ersatzserver ran…. Soll so ein Konzept wirklich funktionieren muss an weit mehr gedacht werden als nur die VMs an einem anderen Standort wieder zu starten.
Das soll so gelöst werden, dass im Disasterfall die öffentlichen IPs unserer Server auf das Backup-RZ umgestllt werden, sodass dann im Zweifelsfall per Home-Office oder zugemietetes Büro(auf jeden Fall eine externe Lokation) darauf zugegriffen werden kann. Im prinzip also so eine"Dreieckslösung".
 
Zuletzt bearbeitet:
"Copy Feature" ist leider kein offizieller Begriff von VMware daher ist es schwer zu sagen was gemacht gemeint war... Warscheinlich die Replikation und die ist im Site Recovery Manager enthalten.

Die VMs selbst bleiben beim Replizieren in Takt, auch wenn sie alle 10 Minuten "angefasst" werden. Was allerdings nicht unbedingt für die Daten innerhalb der VM gelten muss. Läuft dort z.B. ein Datenbankserver der in dem Moment nicht ganz konsistent war könnten Daten verloren gehen. Die Warscheinlichkeit ist hier zwar sehr gering, sie ist aber gegeben.
Verhinden kann man das durch einen VSS Snapshot innerhalb der VM kurz bevor die Replikation los läuft. Ob der SRM das kann weiß ich aus dem Kopf nicht, ich vermute aber schon. Klappt natürlich auch nur bei Datenbanken die einen entsprechenden VSS Provider mitbringen.
 
Ich nehme mal an, dass es sich bei dem gemeinten Feature um "SAN Copy" handelt.

Nun bin ich ja grade drauf gekommen, dass wenn ich zum Bleistift eine Clariion da hinstelle und schön Hardwareseitig oder mit Recoverpoint replizieren lasse, mir ja immernoch der host fehlt auf dem ich dann auch VMWare laufen lassen kann. Also doch noch Serverhardware. Oder hab ich jetzt nen Denkfehler?
 
Oder hab ich jetzt nen Denkfehler?
Nein... auf der Clariion liegen nur die Daten... bzw. die LUNS. VMWare läuft dann auf X hosts.

Edit:
Wobei da dann natürlich auch die Möglichkeit besteht das SAN ins "housing" zu stellen und bei Bedarf X hosts hinzumieten zu können. Da wird dann VMWare drauf geworfen und die Maschinen eingebunden.
Wenn ihr euch die 1-2 Tage Ausfall leisten könnt, wäre das wohl eine recht günstige Geschichte.
 
Zuletzt bearbeitet:
Sehr gut, dann hab ich meine eigene temporäre unfähigkeit ja wenigstens selbst erkannt :-O.

Hmm irgendwelche Empfehlungen diesbezüglich?

Aktuell sind es im hauptsystem wie gesagt :
IBM DS 4400 mit 4 Blades (jeweils 2 DC Xenons)
Dürften noch aus der Core 2-Generation stammen. Sind HP BL480C Blades.

Soll aber jetzt aufgerüstet werden, da uns die performance flöten geht.

Das Backup-RZ soll dann sowieso mehr Power haben, damit wir nicht jedesmal beim aufrüsten das Backup mitaufrüsten müssen.
 
Wie im edit würde ich das entweder im Bedarfsfall mieten oder gleich auf den selben Stand bringen. Ich hab hier ziemlich gemischte Hardware (HP / IBM / BULL / DELL) und bin mit BULL vom Preisleistungsverhältnis sehr zufrieden. Lasst euch von nem Reseller doch mal nen Angebot machen. http://www.bull.de/
 
Ist Rackplatz bei euch ein Problem oder warum die Blades? Eigentlich rentiert sich das erst wenn man eine gewisse Anzahl davon beisammen hat, bei gerade mal vier Servern ist dieser Punkt aber noch nicht erreicht.

Ein aktueller HP Server mit zwei CPUs (DL 380 G7) lässt sich mit zwei mal Hexa Core und (bezahlbaren) 144 GB RAM ausstatten, was die vier alten Blades auf einen Schlag alle ersetzen könnte...

Dem Backup RZ mehr Power als dem Produktiv RZ zu geben macht meistens allerdings keinen Sinn, da du im Notfall, wenn wirklich auf die Backupumgebung zurückgegriffen werden muss, unwichtigere Systeme einfach weg lässt.
 
Rackplatz ist bei uns tatsächlich ein Problem, abgesehen davon, dass ALLE unsere Server bis auf einen und ein NAS komplett virtualisiert sind (unser jetziger Teamleiter ist so ein Virtualisierungs-Fanboy..)
im Prinzip haben wir zwei 19" Schränke, indem die Blades und das SAN drin sind. Dazu in einem Weiteren Schrank TK-Anlage und Patchpanels für Netzwerk. 2 Klimas und Buff war der Raum voll..

Wenn ihr weitere Infos o.ä. aus ESX braucht, sagt Bescheid, ich werde sie natürlich entsprechend zensieren.
 
Naja... wir brauchen die Infos nicht... ;) Du brauchst Sie... miss einfach mal deinen kompletten Ram verbrauch und dann haste da schonmal ne Hausnummer. Das dann auf ne runde Summe aufstocken und fertig. Dazu min. 2 Quad Xeons und schon rennt die Kiste. In dem Rahmen lass dir Angebote der Hersteller / Reseller kommen und dann order 3 davon.

1x fürs Backup.
2x bei euch in den Serverraum - diese lässt du dann als VM High Availability "Cluster" laufen und bindest das Clariion an.

Mit der 3er Lösung hättest du dann auch kleinere Ausfälle und Wartungen abgedeckt und musst nicht gleich aufs "Notfall" RZ ausweichen.
 
Zuletzt bearbeitet:
Ich weiß zwar, dass die Desktop Sandys schneller pro Takt als die Core 2 Zweikerner sind, allerdings kann ich mir nur schwer vorstellen, wie ich mit 2 Quads 8 Dual Cores ersetzen kann, selbst bei mehr Geschwindigkeit pro Takt.
Es sind ja immerhin 4 Blades mit jeweils zwei Dualcores verbaut, Und die Kratzen langsam am Limit. Ich denke cniht, dass da 2 Quad-Xeons ausreichen?
 
Kratzen die denn am CPU Limit? Bei mir Kratzen alle VM's immer nur am Ram Limit. Kannst ja im vCenter (falls vorhanden) sehen wie die Auslastung ausschaut.

edit: gerade geschaut... bei jedem meiner Hosts sind von den 8 Kernen der 2x Quad Xeons immer zwischen 500mhz und 1500mhz in Benutzung - also weit entfernt vom CPU Limit.
 
Zuletzt bearbeitet:
Zurück
Oben