News Nvidia DGX GH200: 256 Grace Hopper Superchips liefern 1 ExaFLOPS FP8 für KI

Mit der aktuellen AI-Begeisterung fühlt sich das nach genau dem richtigen Zeitpunkt für dieses Produkt an, hatte mich schon gefragt warum der Kurs von Nvidia so eskaliert ist.

[wege]mini schrieb:
Daher rechnet man in KW pro Stunde. Hast du ein 300 Watt System eine halbe Stunde am laufen, kostet das 150 Watt.
Es kostet 150 Wattstunden, und nicht 150 Watt.
 
Watt ist Leistung. Also Arbeit pro Zeit...da sagt man nicht X Watt die Stunde...Man KÖNNTE X Joule pro Stunde sagen..Watt wäre aber einfacher :D


Wattstunden ist dann ja wieder etwas anderes. Das ist eine Energiemenge, also Eigentlich wieder Joule.

Und für die ganz abenteuerlichen wirds dann jetzt einfach Wattstunden die Stunde, dann haben wir wieder Leistung.


BTT
Wie kann man das Gerät hier ggü. der kommenden AMD Karte einordnen?
 
<jhk> schrieb:
und nicht 150 Watt.

Von mir aus.

Da dein Anbieter ja in Watt/h abrechnet, kann man auch dort die Zeit reinrechnen.

Mir ist das aber zu sehr "Edison" und zu wenig "Tesla".

Ob ich jetzt 150 Watt pro Stunde verbraucht habe oder 150 Wattstunden, ist am Ende aber bei der Gesamtrechnung total egal.

Wie ich schon sagte, wir reiten auf Einheiten rum. Traurig, aber wahr.

Und ganz klar, die Abhängigkeit von elektrischem Strom, der von Großkonzernen erzeugt wird, soll in den nächsten Jahren immer mehr zu nehmen. Daher ist es wichtig, dass so wenig wie möglich Menschen wirklich begreifen, was sie machen.

mfg
 
gut aus dem Press-Release übersetzt aber da nichts mit existierender Hardware in Verbindung gebracht wird, weiß ich immernoch nicht wie gut dieser "Superchip" ist.
Und das die 1 Exaflop "nur" in FP8 erreicht werden und dann lächerlicherweise Frontier dagegengestellt wird lass ich mal so stehen ... so schafft sich Nvidia halt seine Realitäten.
 
  • Gefällt mir
Reaktionen: Pumpi
[wege]mini schrieb:
Von mir aus.

Da dein Anbieter ja in Watt/h abrechnet, kann man auch dort die Zeit reinrechnen.

Mir ist das aber zu sehr "Edison" und zu wenig "Tesla".

Ob ich jetzt 150 Watt pro Stunde verbraucht habe oder 150 Wattstunden, ist am Ende aber bei der Gesamtrechnung total egal.

Wie ich schon sagte, wir reiten auf Einheiten rum. Traurig, aber wahr.
Hä? Mit der Argumentation kannst es doch direkt abkürzen und statt Wattstunden Euro verwenden.

Das Einheitenrummreiten würde sich ohne solch kruden Argumentationen schnell erledigen :D
 
  • Gefällt mir
Reaktionen: [wege]mini
Da hier ja in der Regel Laien (ursprünglich stand hier Leihen....scheiß Korrektur) solche Artikel lesen wäre eine Einordnung ganz interessant. Was leistet die Vorgängergeneration im Vergleich und was der Konkurrent mit seiner aktuellen und zukünftigen Generation bzw. werden die Produkte überhaupt in vergleichbaren Umgebungen (Software) eingesetzt?
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Pumpi
Huey schrieb:
Da hier ja in der Regel Leihen solche Artikel lesen wäre eine Einordnung ganz interessant.
Heieiei, was ist denn heute los hier? Habt ihr wegen dem Feiertag heute gestern noch zu lange gezecht?

Der erste kommt mit kW/h und du jetzt mit Leihen :freak:

Es sind kWh und Laien :hammer_alt:


Huey schrieb:
Was leistet die Vorgängergeneration im Vergleich und was der Konkurrent mit seiner aktuellen und zukünftigen Generation bzw. werden die Produkte überhaupt in vergleichbaren Umgebungen (Software) eingesetzt?
Das hier fände ich allerdings tatsächlich auch sinnvoll als Angabe.
 
  • Gefällt mir
Reaktionen: aid0nex, Web-Schecki, Huey und 2 andere
Die Verwendung von FP8 ist anscheinend ja 'old news', hab ich trotzdem bisher nicht auf dem Schirm gehabt. Falls es jemanden interessiert: docs von nvidia und ein paper das sich damit beschäftigt.

Exzerpt vom Fazit des Papers:
We demonstrate that a wide variety of neural network models for image and language tasks can be trained in FP8 to match model accuracy achieved with 16-bit training sessions, using the same model, optimizer, and training hyperparameters.
 
@nlr die 900 GB/s sind die summen Datenrate dass heißt "nur" 450 GB/s pro richtung selbes glid für PCIe. Das InfinyBand sind aber 400 Gbit/s dafür in beide Richtungen gleichzeitig.
 
Hoffentlich ist da unter den zukünftigen Besitzern/Bedienern auch ein experimentierfreudiger Ingenieur, der da ein paar Spiele zum Laufen bringt und mal zeigt was so geht :)
 
ich bin kein Fachmann was KI angeht und wofür dass alles einsetzbar ist. Mich würde mehr interressieren was die Leistung Pro KW/h angeht. Ein Chip muss so sparsam wie möglich endwickelt werden, die suche nach Materialien die bei Raumtemperatur Verlustfrei Strom tranzportieren (Supraleiter) kann wäre warscheinlich ein Nobelpreis wert. Ich habe die Hoffnung das es irgendwann soweit ist. Ernegie ist nun mal Teuer und wenn ich ein Chip in meinem Rechner hätte der Verlustfrei Arbeiten könnte, dass wäre auch den Einsatz von 1000 € Wert wenn ich dadurch 0 Strom Verbrauche.
Ich bin schon etwas älter und ich glaube nicht daran dass ich es noch erleben werde...schade
 
Zimperlich schrieb:
Leistung Pro KW/h
Du trollst doch? Richtig ist FLOP/J oder FLOPS/W oder (die normale Metrik für so etwas) J/OP (dabei ist dann je kleiner desto feiner).

Die Leistung/W wird besser, wenn auch langsamer als die tatsächliche Leistung. Computer können nicht verlustfrei rechnen (Stichwort Entropie), wir sind aber noch weit vom physikalischen Limit entfernt.
 
  • Gefällt mir
Reaktionen: Zimperlich
@:Hancock schau mal und ja ich weiß es ist noch nicht Realisierbar, aber schau mal diesen Artikel den ich gefunden habe. Im Internet dort geht es um Supraleiter bei Raumtemperatur. Ich weiß nur nicht ob ich den Link zeigen darf. deshalb warte ich auf Erlaubnis..
 
@Zimperlich
Das würde dir allerdings auch nur bedingt helfen, da der Leitwert des MOS Kanals selbst endlich ist.
Auch bei den Verbindungsleitern sind eher die Kapazitäten als die Leitwerte das Problem. Transistoren im aus Zustand sind gerade bei Kurzkanaltransistoren auch weit weg vom Isolator (mittlerweile verbrauchen Chips auch deutlich mehr beim nichtstun zwischen den Umladevorgängen als währenddessen)
 
Zimperlich schrieb:
Wenn so ein Artikel in nature erscheint hat das dann schon etwas Gewicht, aber speziell bei dem Physiker (Ranga Dias) muss man wohl etwas aufpassen, siehe hier.

TL;DR:
Dias is also being accused of committing scientific misconduct, including data manipulation and plagiarism.
 
[wege]mini schrieb:
Daher rechnet man in KW pro Stunde. Hast du ein 300 Watt System eine halbe Stunde am laufen, kostet das 150 Watt.
Falsch. Wenn man eine Energiemenge berechnen möchte, rechnet man Leistung x Zeit. Ein 300 W System eine halbe Stunde betreiben kostet also
300 W x 1/2 h = 150 Wh = 0,15 kWh.
Das System zieht ja trotzdem 300 W zu jedem Zeitpunkt.
Leistung (kW) pro Zeiteinheit (h) ist die Änderungsrate der Leistung (kW/h). Das wäre die zweite Ableitung der Energie nach der Zeit und hat für die Betrachtung der Energiemenge keine Relevanz.
Ergänzung ()

[wege]mini schrieb:
Da dein Anbieter ja in Watt/h abrechnet, kann man auch dort die Zeit reinrechnen.
Da würde ich gleich den Anbieter wechseln, wenn der Physik Klasse 7 nicht beherrscht.
 
  • Gefällt mir
Reaktionen: maxrl, Web-Schecki, [wege]mini und 2 andere
Zurück
Oben