porenbeton
Lt. Junior Grade
- Registriert
- Nov. 2014
- Beiträge
- 290
Hallo zusammen,
folgende Situation: ich arbeite auf einem Cluster bestehend u.a. aus GPU-Knoten mit jeweils 2 CPUs, 4 GPUs, 64 GB RAM. Ich ermittle mit einem Benchmark von NVIDIA die Rechenleistung dieser Knoten. Soweit funktioniert das auch alles.
Um den Einfluss des RAMs zu testen hat der Cluster-Administrator einen Knoten vom Netz genommen und den RAM in den Knoten GPU03 umgesteckt, welcher jetzt 128 GB RAM hat/haben sollte.
Der Befehl "free -m" liefert das folgende Ergebnis:
Kann es sein, dass obwohl der Arbeitsspeicher hier angezeigt wird, er dennoch nicht von einem Programm genutzt werden kann? Für den Benchmark gebe ich eine einheitenlose Problemgröße N vor, die ungefähr mit
abgeschätzt werden kann. Mit 64 GB auf einem Knoten konnte ich N=85.000, mit 256 GB auf vier Knoten N=159.000 und mit 320 GB auf fünf knoten N=185.000 erreichen. Mit 128 GB auf einem Knoten habe ich eigentlich mit einem N jenseits von 100.000 gerechnet. Allerdings führt alles größer N=85.000 zu Fehlern (nicht genug Speicher), exakt wie bei 64 GB.
Wie kann ich testen, ob der Speicher wirklich nutzbar ist? Aufgrund eingeschränkter Nutzerrechte nach Möglichkeit ohne sudo oder Pakete installieren zu müssen..
Ich bin für alle Hinweise dankbar und kann falls nötig gerne noch weitere Angaben machen.
Viele Grüße
folgende Situation: ich arbeite auf einem Cluster bestehend u.a. aus GPU-Knoten mit jeweils 2 CPUs, 4 GPUs, 64 GB RAM. Ich ermittle mit einem Benchmark von NVIDIA die Rechenleistung dieser Knoten. Soweit funktioniert das auch alles.
Um den Einfluss des RAMs zu testen hat der Cluster-Administrator einen Knoten vom Netz genommen und den RAM in den Knoten GPU03 umgesteckt, welcher jetzt 128 GB RAM hat/haben sollte.
Der Befehl "free -m" liefert das folgende Ergebnis:
Code:
free -m
total used free shared buff/cache available
Mem: 128831 925 101431 2691 26474 123992
Kann es sein, dass obwohl der Arbeitsspeicher hier angezeigt wird, er dennoch nicht von einem Programm genutzt werden kann? Für den Benchmark gebe ich eine einheitenlose Problemgröße N vor, die ungefähr mit
Code:
vorhandener RAM muss >= N*N*8 Bytes sein
abgeschätzt werden kann. Mit 64 GB auf einem Knoten konnte ich N=85.000, mit 256 GB auf vier Knoten N=159.000 und mit 320 GB auf fünf knoten N=185.000 erreichen. Mit 128 GB auf einem Knoten habe ich eigentlich mit einem N jenseits von 100.000 gerechnet. Allerdings führt alles größer N=85.000 zu Fehlern (nicht genug Speicher), exakt wie bei 64 GB.
Wie kann ich testen, ob der Speicher wirklich nutzbar ist? Aufgrund eingeschränkter Nutzerrechte nach Möglichkeit ohne sudo oder Pakete installieren zu müssen..
Ich bin für alle Hinweise dankbar und kann falls nötig gerne noch weitere Angaben machen.
Viele Grüße