News Neue MLC-Inference-Benchmarks: Nvidia GB300 vaporisiert Rekorde, AMDs MI355X debütiert

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
19.419
  • Gefällt mir
Reaktionen: cosmo45, konkretor, aid0nex und 6 andere
Liefert der Benchmark die Mögleichkeit, die verschiedenen Produkte in einer Tabelle oder einer Grafik aufzubereiten?
Ich tu mir gerade schwer, die News zu verstehen außer, dass die neue Generation schneller ist und Intel auch dabei ist.
 
  • Gefällt mir
Reaktionen: flo.murr, Moerf, sebastian_uniq und 18 andere
Es ist schon krass, wie schnell diese Teile sind, sich entwickeln und wieviel Geld momentan damit verdient wird. Das ist alles abartig...
 
  • Gefällt mir
Reaktionen: flo.murr, Spawn182, bad_sign und 2 andere
Bedenkt man, an wievielen Fronten AMD mittlerweile "kämpft", ist es schon erstaunlich, dass solch ein vergleichsweise kleines Unternehmen doch recht gut mit der Konkurrenz mithält. Ok, bei den AI Beschleunigern mag NVidia (noch) deutlich vorn liegen, aber mit der Zeit wird AMD auch da aufholen.
Man stelle sich vor, AMD wäre nicht da. Der Endkunde wäre so übel dran...
 
  • Gefällt mir
Reaktionen: flo.murr, zhompster, sebastian_uniq und 8 andere
Das soll laut Intels Pressemeldung dazu führen, dass im Bereich Performance pro Dollar gegenüber der RTX Pro 6000 oder L40S ein viel besseres Gesamtpaket verkauft wird.

Das Beispiel in eben jener Pressemitteilung ist aber mehr als lächerlich:
In Llama 8B, Intel Arc Pro B60 performance per dollar advantages of up to 1.25x and up to 4x compared to NVIDIA RTX Pro 6000 and L40S respectively.

Nur als Referenz: Ein LLama 8B-Q8 generiert selbst mit meinem 5800X und DDR4 RAM ~5Token/s, und passt mit Q6 und drunter auf jede 8GB GPU, sprich da braucht es keine RTX Pro 6000, sondern eine RTX 2060.
 
  • Gefällt mir
Reaktionen: zhompster, Fighter1993, Unnu und eine weitere Person
ich finds mittlerweile auch total krass wie billig man rechenpower mieten kann, als runpod beispielhaft.

nvidia h200, 141 gb vram, 276 gb ram, 24 vcpus für 3,59 die stunde. ich mein hallo?

das wenn einer vor 10 jahren behauptet hätte... :evillol:
 
Ja, und? Was kaufe ich denn jetzt? Jetzt noch einen normalen Desktop-PC zu kaufen, ist doch eine Sackgasse.

Wann kommen denn endlich nutzbare Neuerungen in den Selbstbau-PC-Markt?

Sowohl Grafikkarte mit viel zu wenig Speicher, Mainboards mit zuwenig Steckplätzen oder CPU ohne NPU muss man sich ja nicht mehr antun. Wenn man's ernst meint, ist man aber mit AMD Threadripper usw. schnell in der Region eines neuwetigen Elektroautos.

Irgendwie scheint es mir gerade nicht voranzugehen.
 
  • Gefällt mir
Reaktionen: fab.erg
Neodar schrieb:
Bedenkt man, an wievielen Fronten AMD mittlerweile "kämpft", ist es schon erstaunlich, dass solch ein vergleichsweise kleines Unternehmen doch recht gut mit der Konkurrenz mithält. Ok, bei den AI Beschleunigern mag NVidia (noch) deutlich vorn liegen, aber mit der Zeit wird AMD auch da aufholen.
Man stelle sich vor, AMD wäre nicht da. Der Endkunde wäre so übel dran...
Naja, AMD hat eine Marktkapitalisierung von ca. 250 Milliarden und ist 3x so viel wert wie Intel. Klar, gegen Nvidia immer noch ein Zwerg, aber gegen die ist jeder ein Zwerg. Und mit 250 Milliarden sind sie eines der wertvollsten Unternehmen im SP500. Von einem kleinem Unternehmen würde ich daher nicht mehr sprechen, das ist lange vorbei.
 
Neodar schrieb:
Man stelle sich vor, AMD wäre nicht da. Der Endkunde wäre so übel dran...
Das kannst über jede Firma sagen, vor allem Aktienkonzerne. Siehe wie AMD die CPU Preise von TR/Epyc angehoben hat. Auch AMD ist kein gemeinnütziger Verein wie das manche hier immer darstellen...
Ergänzung ()

Spock37 schrieb:
Ja, und? Was kaufe ich denn jetzt? Jetzt noch einen normalen Desktop-PC zu kaufen, ist doch eine Sackgasse.

Wann kommen denn endlich nutzbare Neuerungen in den Selbstbau-PC-Markt?

Sowohl Grafikkarte mit viel zu wenig Speicher, Mainboards mit zuwenig Steckplätzen oder CPU ohne NPU muss man sich ja nicht mehr antun. Wenn man's ernst meint, ist man aber mit AMD Threadripper usw. schnell in der Region eines neuwetigen Elektroautos.

Irgendwie scheint es mir gerade nicht voranzugehen.
Naja bekommen tust du alles wenn du zahlst ; )

Für "Geringverdiener" ist halt bei 16Kernen bzw 24Kernen (Intel) Schluss. Grafikkarte mit 32GB bei 2k, brauchst du mehr Speicher? RTX 6000 Pro 96GB steht bereit. :D
 
@Volker
Entweder ich bin im Falschen Benchmark oder ich finde hier keine MI355X
1757492164456.png


https://mlcommons.org/benchmarks/inference-datacenter/

Und ich muss sagen, ich fände es auch ganz cool, wenn es mal einen Artikel gäbe, bei dem die Verschiedenen Modelle mitsamt ergebnissen als Tabelle gezeigt wird - einfach dass es ein wenig übersichtlicher ist bei einem sehr komplexen aber interessanten Benchmark
 
  • Gefällt mir
Reaktionen: Moerf
Bright0001 schrieb:
Das Beispiel in eben jener Pressemitteilung ist aber mehr als lächerlich:

Nur als Referenz: Ein LLama 8B-Q8 generiert selbst mit meinem 5800X und DDR4 RAM ~5Token/s, und passt mit Q6 und drunter auf jede 8GB GPU, sprich da braucht es keine RTX Pro 6000, sondern eine RTX 2060.
Ja und? Bei 5 Token/Sek, was willst du damit machen? Ist so, als würde ich sage, ich kann Windows auch auf nem Intel Atom laufen lassen. Ja, geht. Will ich aber nicht.
Genau so bei den 8GB. Klar bekommst du ein kleines Modell da rein; bei noch kleinerem Kontextfenster. Mach das mal bitte mit 32k Kontext oder mehr.

Glashaus und so....
 
beckenrandschwi schrieb:
wieviel Geld momentan damit verdient wird
das hängst doch sehr stark von der anwendung ab. die gängigen massenanwendungen sind jedenfall maximal unprofitabel.

für nvidia aber egal denn sie verkaufen nur die schaufeln. Niemand findet gold aber jeder braucht schaufeln ;)
 
Bunhy schrieb:
Naja, AMD hat eine Marktkapitalisierung von ca. 250 Milliarden und ist 3x so viel wert wie Intel. Klar, gegen Nvidia immer noch ein Zwerg, aber gegen die ist jeder ein Zwerg. Und mit 250 Milliarden sind sie eines der wertvollsten Unternehmen im SP500. Von einem kleinem Unternehmen würde ich daher nicht mehr sprechen, das ist lange vorbei.

Marktkapitalisierung ist eine sehr schlechte Kennzahl für die Größe eines Unternehmens. Viel interessanter ist sowas wie der Umsatz, je nach Branche auch Anzahl der Mitarbeiter oder der Absatz vom Kernprodukte
 
  • Gefällt mir
Reaktionen: Bright0001
Azdak schrieb:
Ja und? Bei 5 Token/Sek, was willst du damit machen?
Per Faustformel sind 100 Token ungefähr 75 Wörter, heißt die 5 Token/s bzw. 300 Token/min. sind 225 Wörter pro Minute, was fast genau die durchschnittliche Lesegeschwindigkeit von Menschen trifft.

5 Token/s sind absolut alltagstauglich.

Azdak schrieb:
Ist so, als würde ich sage, ich kann Windows auch auf nem Intel Atom laufen lassen. Ja, geht. Will ich aber nicht.
Eher ist es so, als würde man sagen "die 5090 kostet nur halb so viel wie die 4090 pro Frame in 3D Mark 06" - cool, aber irgendwie nur von bescheidener Aussagekraft.

Azdak schrieb:
Genau so bei den 8GB. Klar bekommst du ein kleines Modell da rein; bei noch kleinerem Kontextfenster. Mach das mal bitte mit 32k Kontext oder mehr.
Von mir aus, wenn dir da der VRAM für den Kontext zu klein wird, dann wirds Zeit für ne RTX Pro 6000 - oder halt für ne 5060 Ti mit 16GB. :lol:

Azdak schrieb:
Glashaus und so....
Mutiger Einwurf, während du mit Steinen nach den Details in meinem Beitrag wirfst, anstatt die eigentliche Aussage zu verstehen. :P

Vielleicht als Auto-Metapher, was Intel da in dem Pressebericht verlauten lässt: "Der neue Intel-Kastenwagen ist beim Transport von 8 Fahrrädern 4x spritsparsamer, als der 40-Tonner der Konkurrenz."
Wie gesagt, cool und so, aber ein brauchbaren Vergleich stellt das meiner Ansicht nach nicht dar.

Sani- schrieb:
Marktkapitalisierung ist eine sehr schlechte Kennzahl für die Größe eines Unternehmens.
Vor allem, weil der Kurswert nicht den Wert heute, sondern eher die Erwartung an morgen widerspiegelt. :schluck:
 
Bright0001 schrieb:
5 Token/s sind absolut alltagstauglich.
Naja mit Reasoning und je nachdem wie viel Token man dafür opfert kann das schon arg langsam werden. Dazu dann noch die Kontextlänge.

Wenns so einfach wäre würde sich jeder gleich einen Billig 9950x mit 256gb ram hinstellen und gut ist
 
@TheInvisible Nicht falsch verstehen, ich mach hier keine Werbung für CPU-Inferenz, sondern wollte nur ein möglichst deutliches Beispiel geben, warum ich deren Vergleich für Gülle halte. :D
 
TheInvisible schrieb:
Das kannst über jede Firma sagen, vor allem Aktienkonzerne. Siehe wie AMD die CPU Preise von TR/Epyc angehoben hat. Auch AMD ist kein gemeinnütziger Verein wie das manche hier immer darstellen...
Ergänzung ()


Naja bekommen tust du alles wenn du zahlst ; )

Für "Geringverdiener" ist halt bei 16Kernen bzw 24Kernen (Intel) Schluss. Grafikkarte mit 32GB bei 2k, brauchst du mehr Speicher? RTX 6000 Pro 96GB steht bereit. :D
Genau das meine ich ja: Zwischen den aktuellen, technisch veralteten Desktop-CPU und der von Dir genannten Kategorie ist nichts dazwischen.

Und im Notebook gibt es zwar NPU mit 50 TOPS, aber keine (preiswerten) mind. 128 GB Ram. Und Strix Halo im Desktop ist auch nicht flotter als ein 8700G, nur halt dreimal so effizient, kostet aber 3000 € und der Ram ist nicht erweiterbar.

Ich habe den Eindruck, die Industrie weiß gerade nicht, wo sie hinwill.
 
@Bright0001, ich nehme deine Kritik an, insofern ich mir mehr Mühe hätte geben sollen bei meinem Post. Er ist missverständlich und in der Form nicht angemessen gewesen. Entschuldige dies bitte!

In meinem Post habe ich mich auf einen expliziten Teil von dir bezogen, in dem du die Meldung von Intel als "lächerlich" bezeichnest, um dann zu suggerieren, dass Inferenz auf der CPU auch mit 5Token/Sek und eine kleine Karte mit 8GB VRAM absolut ausreichend sein.
Diesen Standpunkt verteidigst du später auch noch. Es gibt natürlich Workloads, wo das völlig ausreichend und angemessen ist. Aber es gibt halt auch andere Workloads!
Ein Beispiel von mir, ebenfalls privat (wo auch weder eine RTX 9000 Pro, noch L40 sinnvoll sind): Ich habe mit Gemma 3 4B für alle meine Bilder, das sind etwas über 20k, eine textliche Beschreibung erstellen lassen, um darauf denn semantische Suchen und Gruppierungen vornehmen zu können. Diese Erstellung der Beschreibung hat rund 3 Tage gedauert und ich war mit deutlich über 100 Token/Sek unterwegs. Die Beschreibungen erstellt man einmal, aber auch dafür sind 3 Tage Dauerlast auf dem PC eine Geduldsprobe.

Es gibt verschiedene Workloads und das sollte man zumindest respektieren, selbst dann, wenn man sie persönlich nicht für sinnvoll oder notwendig hält. Pressemitteilungen als lächerlich oder Gülle zu bezeichnen lässt dies nicht erkennen und ist in der Form aus meiner Sicht auch nicht angemessen.
Insofern bleibe ich bei meiner Aussage, du sitzt im Glashaus und schmeißt mit Steinen.
 
Spock37 schrieb:
Genau das meine ich ja: Zwischen den aktuellen, technisch veralteten Desktop-CPU und der von Dir genannten Kategorie ist nichts dazwischen.

Und im Notebook gibt es zwar NPU mit 50 TOPS, aber keine (preiswerten) mind. 128 GB Ram. Und Strix Halo im Desktop ist auch nicht flotter als ein 8700G, nur halt dreimal so effizient, kostet aber 3000 € und der Ram ist nicht erweiterbar.

Ich habe den Eindruck, die Industrie weiß gerade nicht, wo sie hinwill.
Ja hast schon recht, hätte auch gerne wieder so ein "HEDT light" wie früher mit Intel x99 & Co.

Da bekam man schon mit ein wenig Aufpreis mehr Cores, Quad Channel & mehr PCIe Lanes. Der Sprung heute von Mainstream auf HEDT ist echt heftig preismäßig
 
Azdak schrieb:
Es gibt verschiedene Workloads und das sollte man zumindest respektieren, selbst dann, wenn man sie persönlich nicht für sinnvoll oder notwendig hält.
Moment, das war gar nicht das Ziel; Ob und wie man LLama 8B verwendet hab ich nämlich gar nicht bewertet, sondern nur gemeint, dass LLama 8B schlicht nicht fordernd genug ist, um für solche Vergleiche benutzt zu werden.

Azdak schrieb:
Pressemitteilungen als lächerlich oder Gülle zu bezeichnen lässt dies nicht erkennen und ist in der Form aus meiner Sicht auch nicht angemessen.
Obs nun Gülle oder typisches Marketinggewäsch ist, ist mir einerlei. Tatsache bleibt, dass man für 8B Anwendungsfälle nicht auf die Pro 6000 schaut, sondern auf eine beliebige Consumer-GPU mit genügend VRAM. Da den Preisvergleich zwischen der eigenen 24GB-Variante und der (teuersten) Maximal-Ausbaustufe der Konkurrenz zu ziehen, die 96GB hat, ist und bleibt für mich lächerlich.

Warum man nicht den naheliegendsten Vergleich zur 4090 oder 5090 gezogen hat, liegt auf der Hand: Weil der Vorteil dann schlicht nicht mehr existiert. Und die 5090 ist mit ihren 32GB tatsächlich (hiernach) ausreichend, um LLama-8B-Q8 mit dem maximalen 128k Kontext voll im VRAM laufen zu lassen.

Azdak schrieb:
Insofern bleibe ich bei meiner Aussage, du sitzt im Glashaus und schmeißt mit Steinen.
Soll mir recht sein, bin ich doch Transparent in meiner Haltung und Argumentation. :P
 
Zuletzt bearbeitet:
Zurück
Oben