Verfügbarkeit prüfen Snapshot unter ESXi

Nilson

Grand Admiral
Registriert
Dez. 2008
Beiträge
25.105
Hallo zusammen,

ggf. habt ihr eine kreative Idee.
Ich bin gerade dabei zu Prüfen welchen Einfluss das Erstellen eines Snapshots auf die Erreichbarkeit einer VM (unter ESXi 7.0 über vCenter) hat.
Bei den Optionen
  • Include virtual machine's memory
  • Quiesce guest file system(requires VM tools)
Lässt sich das ganz einfach nachweisen. Beim Erstellen langt ein simpler ping über die CMD um zu sehen, dass die VM kurz nicht antwortet.
Ohne die beiden Optionen sind alle Pings <1m. Ist schon mal gut, aber ich hätte es gern etwas feiner.
Hat da einer eine Idee?
 
Ich hoffe doch, vmware gibt einem eine Info, wie lange die VM für das Speicherabbild angehalten wurde. Die Info ist dann mehr wert, als ein (ausbleibender) Ping.
Die andere Geschichte (Quiesce) sollte keinerlei Unterbrechung der VM bewirken. Lediglich Anwendungen, die auf das fs-freeze und fs-thaw reagieren (z.B. Datenbanken), stehen dann ggf. kurz still.

Nilson schrieb:
Ohne die beiden Optionen sind alle Pings <1m. Ist schon mal gut, aber ich hätte es gern etwas feiner.
Der Windows-Ping löst nicht feiner auf. Mit nem Linux sieht das schon besser aus oder schau nach einem vernünftigen Tool für Latenzmessungen. Aber was willst du damit zeigen? Dass während des Snapshots der IP-Stack der VM kurzzeitig nicht reagiert!?

Hier noch ein passender KB-Artikel von VMWare selbst, was bei einem Snapshot genau passiert:
https://kb.vmware.com/s/article/1015180
 
  • Gefällt mir
Reaktionen: konkretor und snaxilian
  • Include virtual machine's memory
Benutzt man in der Praxis so gut wie nie. Das verlängert wie du schon festgestellt hast den Prozess je nach Arbeitsspeicher der VM enorm und in der Regel will man nur einen Snapshot der Festplatten haben.
 
  • Gefällt mir
Reaktionen: snaxilian
KillerCow schrieb:
Aber was willst du damit zeigen? Dass während des Snapshots der IP-Stack der VM kurzzeitig nicht reagiert!?
Das frage ich mich auch gerade... Im Zweifel ist es ja wirklich nur kurz der IP-Stack, wenn überhaupt. Wenn würde ich hier auch nicht per icmp testen sondern direkt gegen die Anwendung die auf der VM läuft ob da überhaupt etwas ersichtlich ist, also ggf. kurzzeitig höhere Latenzen oder ein Drop von Verbindungen und selbst wenn: Jede halbwegs bessere Anwendung auf Client-Seite sollte reconnect-fähig sein oder mal kurzfristig mit einer etwas höheren Latenz klar kommen.
Virtualisierung erhöht ja auch nicht magisch die Zuverlässigkeit eines Dienstes sondern kann lediglich unabhängiger von der genutzten Hardware machen sofern man 2 oder mehr ESXi Hosts hat.

Nilson schrieb:
ein simpler ping über die CMD um zu sehen, dass die VM kurz nicht antwortet.
Gleiches gilt übrigens wenn du eine VM per vMotion verschiebst. Ja, und? Ich sehe da kein Problem sondern works as intended.
Nilson schrieb:
aber ich hätte es gern etwas feiner.
Ich denke vor allem, du hast ein XY-Problem. WAS genau willst du eigentlich erreichen und warum glaubst du, dass Snapshots damit etwas zu tun haben? Was genau willst du feiner haben? Die "Downtime" während der Erstellung eines Snapshots reduzieren? Dann reduziere die VM. Je weniger in den Snapshot muss, desto kürzer dauert es.
 
  • Gefällt mir
Reaktionen: KillerCow
Ok, ich hohl mal weiter aus.

Ist mehr oder weniger persönliches Interesse getriggert über eine Kundenanfrage.

Kunde hat ein System von uns am laufen. Wollte dort was testen und hat "auf die Schnelle" ein Snapshot mit "Include virtual machine's memory" gemacht. Das hat das System nicht vertragen und war erstmal strubbelig worauf ich ein halben Tag darauf verwenden musste das wieder zum laufen zu bekommen.

Ich wollte die Situation darauf hin bei uns im Test-System reproduzieren und daraus ist dann oben genannte Fragestellung entstanden.
 
Kunde hat also keine Testumgebung und testet lieber in Produktion und dann ist ein einzelner nicht beantwortet Ping untersuchenswert?^^ 🙈

Aber ja: arbeitet man an den VMs (Snapshot, vMotion und vmtl noch andere Dinge) dann kann es zu solchen minimalen Aussetzern kommen. Normales Verhalten und was dies beeinflussen oder ggf optimieren kann steht ja schon im Thread.
Für feinere Messungen musst dir andere Messmethoden als "Ping per cmd" überlegen oder suchen. Das Google Stichwort dazu lautet: application performance monitoring

Da dann welche suchen die feiner als 1ms auflösen, wird aber vermutlich nicht ganz billig werden. Hinzu kommt: wer viel misst, misst viel Mist. Auch solch exzessives Monitoring erzeugt Systemlast, die die Messdaten beeinflussen kann.
 
snaxilian schrieb:
Da dann welche suchen die feiner als 1ms auflösen, wird aber vermutlich nicht ganz billig werden. Hinzu kommt: wer viel misst, misst viel Mist. Auch solch exzessives Monitoring erzeugt Systemlast, die die Messdaten beeinflussen kann.
Selbst mit WSL2 auf Windows kann ich den Ping in unter 1 ms messen, teuer ist da garnix.... ob das sinnig ist steht auf einem andern Papier.

1657194760122.png
 
Das Zitat ist aus dem Kontext gerissen. Ich sprach zuvor von Applikation Performance Monitoring.
Ping ist das nicht. Ping prüft weder ob ein Service erreichbar ist, noch ob dieser sinnvoll reagiert/antwortet und mit welcher Geschwindigkeit.
 
Zurück
Oben