News Next-Gen-AI-Hardware: Nvidia Vera Rubin und das nächste NVL72-Rack sind fertig

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
19.629
  • Gefällt mir
Reaktionen: the_IT_Guy, BrollyLSSJ, PietVanOwl und 2 andere
Endlich mal mehr AI im Jahre 2026 !
China wird gleich mal die ersten 500.000 Einschübe wegkaufen - und Nvidia macht jedes Quartal doppelt soviel Gewinn wie im Vorgängerquartal. Wird doch mal Zeit noch ein paar Aktien zu kaufen.
 
  • Gefällt mir
Reaktionen: latexdoll, Rockstar85, El_Tequilla und eine weitere Person
Hat Nvidia also auch gemerkt, dass die Zählunga als NVL144 eher peinlich als positiv war....
 
  • Gefällt mir
Reaktionen: the_IT_Guy
Die Entwicklung ist beeindruckend Blackwell wirkt angesichts der Folien schon wieder veraltet, vor allem wenn man die Kosten pro Token betrachtet. Es erinnert ein wenig an die GPUs der frühen 2000er.

PC-Gaming muss sich heute mit den Resten begnügen und ist zudem kaum noch bezahlbar. Damals habe ich den Preis einer 5950 Ultra von Winfast vor meinen Eltern verheimlicht, immerhin stolze 400 Euro im Fachhandel (Comtech) hab ich bezahlt, die ich mir als Schüler nebenbei verdienen konnte. Heute hingegen können sich junge Leute keine 3000–5000 Euro für ein High-End-Modell zusammensparen.
 
  • Gefällt mir
Reaktionen: slow_snail, latexdoll, 3faltigkeit und 6 andere
Dessi schrieb:
Endlich mal mehr AI im Jahre 2026 !
Es sind tatsächlich unglaubliche Neuigkeiten für 2026.

Blackwell erscheint gerade halbwegs kostengünstig in Form von RTX 6000 Pro mit 96GB für SMEs in ausreichender Verfügbarkeit, womit man 100b+ Modelle in INT4/FP4 sauber laufen lassen kann - das war vorher nicht möglich. Damit wird AI kostengünstig und intern realisierbar.

Jetzt bereits 26'H2 nachzulegen mit der fünffachen Performance bei 4bit inferencing ist Wahnsinn - sofern das tatsächlich auch so "auf der Straße ankommt".

AI Chatbots & vielerlei andere Anwendungen sieht man nur aus einem einzigen Grund nicht überall: die größeren Modelle und insbesondere Reasoning ist pro Token zu langsam und zu teuer. Mit diesen Verbesserungen rückt das aber sowohl Cloud- als auch OnPremise-basiert in greifbare Nähe für SMEs. Und für Big Enterprise sowieso - da ist es der letzte Dominostein in Performance und Preis, um es wirklich überall einzusetzen.
 
  • Gefällt mir
Reaktionen: Dark_Soul und 9t3ndo
ascer schrieb:
Es sind tatsächlich unglaubliche Neuigkeiten für 2026.
Nur ist das halt überhaupt keine Neuigkeit, das erzählt Nvidia schon seit einem Jahr über Rubin.
ascer schrieb:
Blackwell erscheint gerade halbwegs kostengünstig in Form von RTX 6000 Pro mit 96GB für SMEs in ausreichender Verfügbarkeit
Hat halt wenig mit den Rackscale-Lösungen zu tun und taugt hier nicht so richtig als Vergleich.
ascer schrieb:
Jetzt bereits 26'H2 nachzulegen mit der fünffachen Performance bei 4bit inferencing ist Wahnsinn
Fünffach gegenüber Blackwell GB200 (50PFlops zu 10 PFlops), aber schon Blackwell Ultra GB300 ist schneller (15 PFlops). GB200 ist übrigens ein Chip von Mitte 2024, H2 2026 ist also gut zwei Jahre später und nicht besonders schnell (auch nicht langsam), der Vergleich mit der Veröffentlichung der RTX 6000 Pro ist einfach auch hier der falsche.
ascer schrieb:
AI Chatbots & vielerlei andere Anwendungen sieht man nur aus einem einzigen Grund nicht überall: die größeren Modelle und insbesondere Reasoning ist pro Token zu langsam und zu teuer.
Es liegt nicht nur am Preis. Man muss auch einen sinnvollen Einsatzzweck definieren und das drumherum konstruieren, bevor sowas Sinn macht. Und wie der Preis sich wirklich entwickelt, ist sowieso noch eine ganz andere Frage, wenn man auf die Speicherpreise schaut.
 
Jeder Server ärgert die Umwelt immens, schafft Jobs ab, nimmt anderen Produkten die Ressorucen weg und verteuert diese, wozu eigentlich??? Für künstliche Intelligenzen, die sich selbst einen Faschisten nennen, Kinderpornobilder erzeugen und lauter Fake-Nachrichten verbreiten und Falschaussagen treffen, illegal rechtlich geschützes Material und persönliche Daten anderer für sich verwerten und es auch sonst überhaupt nicht so genau nehmen?
Am Ende wollen sich die Großkonzerne nur an uns bereichern und uns in deren Abhängigkeit bringen, wenn sich Systeme etabliiert haben, wie so ein Microsoftsystem, dann kommt man als Verweigerer nicht mehr weit.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: 3faltigkeit
ElectricStream schrieb:
Heute hingegen können sich junge Leute keine 3000–5000 Euro für ein High-End-Modell zusammensparen.
Brauchen sie ja nicht, eine 5060ti ist mehr als ein guter Einstieg und bietet viel mehr an Features und relativer Leistung als damals
 
ElectricStream schrieb:
Die Entwicklung ist beeindruckend Blackwell wirkt angesichts der Folien schon wieder veraltet, vor allem wenn man die Kosten pro Token betrachtet. Es erinnert ein wenig an die GPUs der frühen 2000er.

PC-Gaming muss sich heute mit den Resten begnügen und ist zudem kaum noch bezahlbar. Damals habe ich den Preis einer 5950 Ultra von Winfast vor meinen Eltern verheimlicht, immerhin stolze 400 Euro im Fachhandel (Comtech) hab ich bezahlt, die ich mir als Schüler nebenbei verdienen konnte. Heute hingegen können sich junge Leute keine 3000–5000 Euro für ein High-End-Modell zusammensparen.
Die Leadtek Winfast 5950 Ultra hatte ich auch, in der 10 Klasse zusammen gespart. Sehr schöne Karte, auch heute noch. Im Nachhinein wäre für das Geld eine 9800 Pro oder 9800XT aber die bessere Wahl gewesen :/ Das war mir spätestens mit Far Cry klar...

Die Neue Technik wandert heutzutage direkt ins Rechenzentrum, sie bleibt bei den Konzernen. Einzelne Menschen können sich das finanziell zu Hause nicht mehr selbst hin stellen (GPU & Speicherpreise). Für die gibt es dann Abos zum Melken und Kontrollieren was, wie & wann gespielt wird. Technischer Fortschritt ist eben nicht mehr für alle. Aber das ist ja auch Unterhaltung, wir sollen ja schließlich gefälligst mehr arbeiten :-D
So genug Kapitalismuskritik für heute...
 
Zuletzt bearbeitet:
Zurück
Oben