Bericht Nvidia Hopper: So schnell ist die neue Architektur für Supercomputer

Colindo · 3. Mai 2022

Hopper ist Nvidias neue Architektur für Supercomputer-GPUs. Vorgestellt wurde sie mit vielen technischen Details Ende März. Das umfangreiche Whitepaper zu Nvidias Hopper-GPU GH100 lieferte im Nachgang weitere Details zur Architektur und erlaubte einen Vergleich mit AMDs mehr oder weniger direktem Gegenspieler Instinct MI250X.

Zum Bericht: Nvidia Hopper: So schnell ist die neue Architektur für Supercomputer

Jan · 3. Mai 2022

Zwei Daumen hoch für diesen Inhalt @Colindo !

konkretor · 3. Mai 2022

Danke fürs Zusammenfassen des Whitepapers

GT200b · 3. Mai 2022

But will it run Crysis?

Krass wie sehr sich die Transistorendichte der letzten 10 Jahre stetig erhöht hat.

700W TDP, jetzt werden wieder einige rumheulen 😁

flappes · 3. Mai 2022

"~600 mm²" in der Tabelle GPU-Gerüchte RTX 4090 kann also nicht hinkommen, wenn man sich die Zahlen in diesem Artikel anguckt.

Spulface · 3. Mai 2022

Unterstützt werden die Formate H.265, H.264 und VP9, wobei H.265 mit 340 gleichzeitigen Full-HD-Streams am meisten Daten gleichzeitig verarbeiten kann. Für das Training mit Bilddaten beherrscht der Dekoder auch JPEG und dekomprimiert bis zu 6.350 Full-HD-Bilder pro Sekunde.

🤯

Kaum zu glauben, aber sehr faszinierend, was so möglich ist.

SVΞN · 3. Mai 2022

Jan schrieb:
Zwei Daumen hoch für diesen Inhalt @Colindo !

Von mir gibt‘s Daumen Nummer drei und vier. Richtig starke Arbeit @Colindo.

Liebe Grüße Sven

sikarr · 3. Mai 2022

Nvidia nennt den Herstellungsprozess etwas ungewöhnlich „4N“, während bei anderen Strukturgrößen wie 7 nm das „N“, wie von TSMC bekannt, vorangestellt wird.

Four Nvidia, wow

GT200b schrieb:
700W TDP, jetzt werden wieder einige rumheulen 😁

Ja, warum nicht 900W? Wieso darf der Server sparsamer sein. Find ich nicht Ok

Rage · 3. Mai 2022

@Colindo Sollten in der Tabelle zu den Tensorcores die "PS" in FLOPS nicht verschwinden? Du gibst ja pro Einheit pro Takt an, was keinen Bezug auf Zeit nimmt

Rickmer · 3. Mai 2022

flappes schrieb:
"~600 mm²" in der Tabelle GPU-Gerüchte RTX 4090 kann also nicht hinkommen, wenn man sich die Zahlen in diesem Artikel anguckt.

Die RTX 4090 dürfte GH102 sein, hier geht's um GH100

War bei vergangenden Generationen auch nicht anders - der ganz fette Chip schafft es nie in Consumer-Karten.

Jan · 3. Mai 2022

Rickmer schrieb:
Die RTX 4090 dürfte GH102 sein, hier geht's um GH100

AD102. Wie bei Ampere und "Gaming-Ampere" werden sich die HPC- und die Consumer-Architektur wieder unterscheiden. GH100 z.B. hat wie GA100 keine RT-Kerne, GA102 und AD102 werden die aber haben.

CCIBS · 3. Mai 2022

GT200b schrieb:
700W TDP, jetzt werden wieder einige rumheulen 😁

Server GPU sind eher auf Effizienz ausgelegt, als die Gamerkarten.
Weit weniger würden sich über eine hohe TDP bei der High End Gamerkarte beschweren, wenn sie auch die Effizienteste wäre. Ein Grund, weshalb die erste Titan damals auch so gut ankam.

Wattwanderer · 3. Mai 2022

GT200b schrieb:
700W TDP, jetzt werden wieder einige rumheulen 😁

Ja, echt mal. 700 W für Supercomputer ist ja peinlich.

Wie will man 50+ kW in ein 19" 42HE Schrank unterbringen?

Wie viele Schränke soll es denn werden?

Ernsthaft mal. Wie viele passen davon in ein 19" 42HE?

ArilethDeTyr · 3. Mai 2022

Gibt es dafür auch DirectX 12 Treiber, kann man damit seine Games beschleunigen?

Slashchat · 3. Mai 2022

2030 gibts millionen cuda kerne auf einer pcie karte und dazu 100 solarpanels gratis

ArilethDeTyr · 3. Mai 2022

Damit kann ich mir mein Haustier simulieren einschließlich Gefühle wie eingeschnappt und beleidigt.

lol

Ergänzung (3. Mai 2022)

Ein Tamagotchi Beschleuniger.

S.Kara · 3. Mai 2022

Nvidia hält sich dieses Jahr wohl nicht zurück was Hardware angeht.
80 Mrd. Transistoren und 80 GB HBM3 an 3 TB/s sind eine Ansage.

Ein x4 bei der Tensor-Core Leistung ist auch erstaunlich, zumal von pro Core die Rede ist. Davon kommt sicherlich auch etwas beim GA an.

Wattwanderer schrieb:
Ernsthaft mal. Wie viele passen davon in ein 19" 42HE?

8 GPUs bekommt man auf 4HE, weiß nicht ob es da noch etwas spezielleres gibt.
Aber ansonsten 80 GPUs pro Rack.

Colindo · 3. Mai 2022

Rage schrieb:
Sollten in der Tabelle zu den Tensorcores die "PS" in FLOPS nicht verschwinden? Du gibst ja pro Einheit pro Takt an, was keinen Bezug auf Zeit nimmt

Das ist eine interessante Frage. Die erste Aufstellung der Art habe ich bei AMD gesehen, wo "FLOPS/CU/Clock" steht (S.10) https://www.amd.com/system/files/documents/amd-cdna2-white-paper.pdf

Die Sache ist, glaube ich, dass man mit 1 Hz mehr als 1 Operation pro Sekunde bekommt, deswegen bleibt das "FLOPS" bestehen. Du kriegst pro Takt eine bestimmte Rechengeschwindigkeit zur Verfügung gestellt.

Fr34k.2 · 3. Mai 2022

Interessant in der Tat - doch wo ist die Grenze? Einiges der Mehrleistung wird durch hohe TDP erkauft - werden wir in der nächsten Generation TDP >1kW sehen oder wird der nächste Zuwachs kleiner Ausfallen (müssen)?

Und ich kaufe eine a

Anlog fällt die Anzahl der Cuda- und Tensor-Kerne

Onkel Föhn · 3. Mai 2022

Weshalb kaufen die Schürfer nicht solche Rechenknechte und lassen uns die Gamer Karten ?

MfG Föhn.

Bericht Nvidia Hopper: So schnell ist die neue Architektur für Supercomputer

Redakteur

Chefredakteur

Artikeldetektiv

Lt. Junior Grade

flappes

Gast

Lt. Junior Grade

Redakteur a.D.

Admiral

Captain

Silent-Fanatiker Pro

Chefredakteur

Captain

Rear Admiral

Cadet 4th Year

Commodore

Cadet 4th Year

Captain

Redakteur

Lieutenant

Onkel Föhn

Gast

Ähnliche Themen