Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsNvidia DGX GH200: 256 Grace Hopper Superchips liefern 1 ExaFLOPS FP8 für KI
Mit der aktuellen AI-Begeisterung fühlt sich das nach genau dem richtigen Zeitpunkt für dieses Produkt an, hatte mich schon gefragt warum der Kurs von Nvidia so eskaliert ist.
[wege]mini schrieb:
Daher rechnet man in KW pro Stunde. Hast du ein 300 Watt System eine halbe Stunde am laufen, kostet das 150 Watt.
Da dein Anbieter ja in Watt/h abrechnet, kann man auch dort die Zeit reinrechnen.
Mir ist das aber zu sehr "Edison" und zu wenig "Tesla".
Ob ich jetzt 150 Watt pro Stunde verbraucht habe oder 150 Wattstunden, ist am Ende aber bei der Gesamtrechnung total egal.
Wie ich schon sagte, wir reiten auf Einheiten rum. Traurig, aber wahr.
Und ganz klar, die Abhängigkeit von elektrischem Strom, der von Großkonzernen erzeugt wird, soll in den nächsten Jahren immer mehr zu nehmen. Daher ist es wichtig, dass so wenig wie möglich Menschen wirklich begreifen, was sie machen.
gut aus dem Press-Release übersetzt aber da nichts mit existierender Hardware in Verbindung gebracht wird, weiß ich immernoch nicht wie gut dieser "Superchip" ist.
Und das die 1 Exaflop "nur" in FP8 erreicht werden und dann lächerlicherweise Frontier dagegengestellt wird lass ich mal so stehen ... so schafft sich Nvidia halt seine Realitäten.
Nee, er rechnet in kWh ab. Und das sind Joule (1 kWh = 3600 J).
BTT: Nette Teile von nVidia. Aber immer dise Performanceangaben bei denen geschummelt wird... Ich geb doch keine Flops für Int's an, das wären dann ops oder iops.
Da hier ja in der Regel Laien (ursprünglich stand hier Leihen....scheiß Korrektur) solche Artikel lesen wäre eine Einordnung ganz interessant. Was leistet die Vorgängergeneration im Vergleich und was der Konkurrent mit seiner aktuellen und zukünftigen Generation bzw. werden die Produkte überhaupt in vergleichbaren Umgebungen (Software) eingesetzt?
Heieiei, was ist denn heute los hier? Habt ihr wegen dem Feiertag heute gestern noch zu lange gezecht?
Der erste kommt mit kW/h und du jetzt mit Leihen
Es sind kWh und Laien
Huey schrieb:
Was leistet die Vorgängergeneration im Vergleich und was der Konkurrent mit seiner aktuellen und zukünftigen Generation bzw. werden die Produkte überhaupt in vergleichbaren Umgebungen (Software) eingesetzt?
Die Verwendung von FP8 ist anscheinend ja 'old news', hab ich trotzdem bisher nicht auf dem Schirm gehabt. Falls es jemanden interessiert: docs von nvidia und ein paper das sich damit beschäftigt.
Exzerpt vom Fazit des Papers:
We demonstrate that a wide variety of neural network models for image and language tasks can be trained in FP8 to match model accuracy achieved with 16-bit training sessions, using the same model, optimizer, and training hyperparameters.
@nlr die 900 GB/s sind die summen Datenrate dass heißt "nur" 450 GB/s pro richtung selbes glid für PCIe. Das InfinyBand sind aber 400 Gbit/s dafür in beide Richtungen gleichzeitig.
Hoffentlich ist da unter den zukünftigen Besitzern/Bedienern auch ein experimentierfreudiger Ingenieur, der da ein paar Spiele zum Laufen bringt und mal zeigt was so geht
ich bin kein Fachmann was KI angeht und wofür dass alles einsetzbar ist. Mich würde mehr interressieren was die Leistung Pro KW/h angeht. Ein Chip muss so sparsam wie möglich endwickelt werden, die suche nach Materialien die bei Raumtemperatur Verlustfrei Strom tranzportieren (Supraleiter) kann wäre warscheinlich ein Nobelpreis wert. Ich habe die Hoffnung das es irgendwann soweit ist. Ernegie ist nun mal Teuer und wenn ich ein Chip in meinem Rechner hätte der Verlustfrei Arbeiten könnte, dass wäre auch den Einsatz von 1000 € Wert wenn ich dadurch 0 Strom Verbrauche.
Ich bin schon etwas älter und ich glaube nicht daran dass ich es noch erleben werde...schade
Du trollst doch? Richtig ist FLOP/J oder FLOPS/W oder (die normale Metrik für so etwas) J/OP (dabei ist dann je kleiner desto feiner).
Die Leistung/W wird besser, wenn auch langsamer als die tatsächliche Leistung. Computer können nicht verlustfrei rechnen (Stichwort Entropie), wir sind aber noch weit vom physikalischen Limit entfernt.
@:Hancock schau mal und ja ich weiß es ist noch nicht Realisierbar, aber schau mal diesen Artikel den ich gefunden habe. Im Internet dort geht es um Supraleiter bei Raumtemperatur. Ich weiß nur nicht ob ich den Link zeigen darf. deshalb warte ich auf Erlaubnis..
@Zimperlich
Das würde dir allerdings auch nur bedingt helfen, da der Leitwert des MOS Kanals selbst endlich ist.
Auch bei den Verbindungsleitern sind eher die Kapazitäten als die Leitwerte das Problem. Transistoren im aus Zustand sind gerade bei Kurzkanaltransistoren auch weit weg vom Isolator (mittlerweile verbrauchen Chips auch deutlich mehr beim nichtstun zwischen den Umladevorgängen als währenddessen)
Wenn so ein Artikel in nature erscheint hat das dann schon etwas Gewicht, aber speziell bei dem Physiker (Ranga Dias) muss man wohl etwas aufpassen, siehe hier.
TL;DR:
Dias is also being accused of committing scientific misconduct, including data manipulation and plagiarism.
Falsch. Wenn man eine Energiemenge berechnen möchte, rechnet man Leistung x Zeit. Ein 300 W System eine halbe Stunde betreiben kostet also
300 W x 1/2 h = 150 Wh = 0,15 kWh.
Das System zieht ja trotzdem 300 W zu jedem Zeitpunkt.
Leistung (kW) pro Zeiteinheit (h) ist die Änderungsrate der Leistung (kW/h). Das wäre die zweite Ableitung der Energie nach der Zeit und hat für die Betrachtung der Energiemenge keine Relevanz.
Ergänzung ()
[wege]mini schrieb:
Da dein Anbieter ja in Watt/h abrechnet, kann man auch dort die Zeit reinrechnen.