News Supercomputer: KIT nimmt drei Nvidia DGX A100 in Betrieb

nlr

Redakteur
Teammitglied
Dabei seit
Sep. 2005
Beiträge
7.104

janer77

Captain
Dabei seit
Juni 2010
Beiträge
3.476
Wieso nutzen die jetzt ein System mit Rome-CPUs als Grundlage (was ich ja super finde) um u.a. Anwendungen zu optimieren, die später auf einem Xeon-basierten System (was ich unverständlich finde, aber ja auch keinen Einblick in die Entscheidung habe) laufen?
 

Nizakh

Captain
Dabei seit
Juni 2010
Beiträge
4.092
@janer77 Ganz einfach: Der DGX A100 Server ist ein Fertiges System von nvidia, welcher mit Rome ausgerüstet ist. Für dieses Szenario, man schaue sich auch die internen und externen Bandbreiten an, wird PCIe 4.0 benötigt. Dies steht erst bei der nächsten Xeon SP Generation (voraussichtlich Q4 2020) bereit. In diesen Servern werden die nvidia´s den Bärenanteil der Rechenleistung ausmachen, dass heißt es wird auf die nvidia GPUs optimiert. Ob Xeon oder Epyc dürfte da nicht so wichtig sein. Wichtig ist aber: Jetzt mit den Software Optimierungen zu beginnen und das wird natürlich nur mit Testhardware möglich sein.
 

nlr

Redakteur
Ersteller dieses Themas
Teammitglied
Dabei seit
Sep. 2005
Beiträge
7.104

ZuseZ3

Lt. Commander
Dabei seit
Jan. 2014
Beiträge
1.247
Muss ich doch glatt mal nachschauen, ob mein ehemaliger Mittarbeiteraccount mir Zugang zum Server ermöglicht. Die sind bestimmt schön .. ähm .. anzuschauen.
Schließe mich der Suche von @john.smiles an.
 

pseudopseudonym

Commander
Dabei seit
Mai 2017
Beiträge
2.950
Ohh, neues Spielzeug aufm Schulhof:D

Dass es Zeit wird, Stuttgart auszustechen, muss ich wohl nicht erwähnen^^
 
Zuletzt bearbeitet:

MarcoMichel

Lt. Junior Grade
Dabei seit
Okt. 2019
Beiträge
500
Wurde ja auch langsam Zeit. Kann wohl kaum sein, dass nur ich den schnellsten Rechner in Deutschland besitze :daumen: :lol:.
 

Shelung

Rear Admiral
Dabei seit
Jan. 2016
Beiträge
5.599

Ned Flanders

Admiral
Dabei seit
Aug. 2004
Beiträge
8.585
Wieso nutzen die jetzt ein System mit Rome-CPUs als Grundlage um u.a. Anwendungen zu optimieren, die später auf einem Xeon-basierten System
Die DGX A100, auch die noch anzuschaffenden, kommen alle mit Epyc. Wie schon angesprochen sind fertige Systeme von Nvidia die eben Epyc verbaut haben (u.a. wegen PCIe4). Die 60.000 Xeons sind ein anderer Rechner, auf dem wohl nicht mit GPUs gerechnet wird sondern dessen CPUs die Hauptrechenlast tragen (ähnlich wie bei Hawk). Wenn das Ding hauptsächlich für ML und KI gebaut wird, und danach klingt es ja, dann haben die Xeons da aktuell noch diverse Vorteile bei den SIMD Extensions, die, je nach Anwendung eine Rolle spielen können oder eben auch nicht.
 

dalaidrama

Lt. Junior Grade
Dabei seit
Aug. 2009
Beiträge
370
Jetzt erobert der "Gold-and-Diamonds Bling-Bling" nach irgendwelchen Billig-Klapphandys mit Putin-Relieff, 23 Zoll-SUV-Felgen und Goldfolie beklebten Escobar-I-Phones schließlich und endlich auch die Serverschränke in Universitäten und Industriehallen und das ganz ohne seinen kleinen Bruder namens RGB? :mussweg:
 

sc0repi0

Lt. Junior Grade
Dabei seit
Mai 2008
Beiträge
365
Uff, am KIT. Hoffentlich hat da niemand aus dem Präsidium die Hand im Spiel, sonst gibts da bald nur noch verbrannte Erde.
 

Doctor Strange

Lt. Commander
Dabei seit
Sep. 2013
Beiträge
1.940

Novasun

Lt. Commander
Dabei seit
Okt. 2011
Beiträge
1.082
@janer77
Weil das gekaufte System von NV nun mal auf Epyc und PCIE 4.0 und dessen Lanes aufbaut.
Bei Intel ist das aktuell noch nicht möglich.
Dieser Satz geht runter wie Öl... 😁
Ergänzung ()

Ich suche einen Fluchtwagenfahrer in Karlsruhe, Bezahlung ist eins der Systeme :)
Du weißt aber schon wie das Enden wird... Wie mit den Bankräubern die Richtung Verfassungsgericht geflohen sind.... (ich nur die waren nicht von hier...)
Niedergestreckt durch MP Feuer.... :utbiorifle::o
Fast egal in welche Richtung du flüchtest... Du kommst irgendwo an starker Polizei Präsenz vorbei...
 
Zuletzt bearbeitet:

SirSilent

Lt. Commander
Dabei seit
Okt. 2007
Beiträge
1.524
Hammer, but can it run Crysis?
 

Age.

Lt. Junior Grade
Dabei seit
Juni 2005
Beiträge
281
Jetzt erobert der "Gold-and-Diamonds Bling-Bling" [...] endlich auch die Serverschränke in Universitäten und Industriehallen [...][.]:mussweg:
Es scheint sich um eine Art Vorbereitungsplattform für das nachfolgende A100 System zu handeln. Gegen 740 A100 sind die drei DGX-A100-Systeme kostentechnisch vermutlich eher ein Tropfen auf dem heißen Stein.
Wenn man dafür dann aber das große System direkt vernünftig nutzen kann, ist dessen Nutzwert von Anfang an wesentlich höher. Das Konzept gefällt mir besser als GPU-Cluster, die lange Zeit ungenutzt herumstehen, weil keine Software darauf angepasst werden konnte.
Außerdem gibt es Anwendungen die einfacher auf ein solches System mit niedrigen Latenzen und hohen Bandbreiten zu optimieren sind als auf ein großes System mit kompliziertem Interconnect. Ist natürlich nur Spekulation, da ich keine Ahnung habe wie die finale Konfiguration aussehen wird.

Am Ende gilt hier sicherlich nicht "The more you buy, the more you save", aber eine offensichtliche Verschwendung von Geldern kann ich hier nicht erkennen. Austauschbare Frontblenden wären auch wieder ein Kostenfaktor. ;)
 

Wattwanderer

Commodore
Dabei seit
Juni 2005
Beiträge
4.946
Ich suche einen Fluchtwagenfahrer in Karlsruhe, Bezahlung ist eins der Systeme :)
Die Polizei braucht nur nach dem Ursprung des Blackouts in der Stadt zu suchen wenn du den das erste einschaltest. :)

Also wozu die Mühe mit dem Fluchtwagen? Schubkarre reicht. Vorzugsweise den der genutzt wurde, um die Goldmünze rauszukarren. :)

Ich kann kaum erwarten, dass wir diese Leistung in einer der zukünftigen Spielekonsole verpackt unter dem TV stellen können.
 
Top