News Forschung mit KI: DOE will neue US-Supercomputer mit AMD MI355X und MI430X

@Skysnake wieso soll ich solche unsinnigen fragen beantworten. bin in der autoindustrie und hab mit öffentlichen ausschreibungen nichts zu tun. aber mir ist schon klar, dass bei den preisen da nur AMD möglich ist, weil der batzen an softwareprogrammierung erst später kommt. du hast anscheinend auch noch nie von comfiui gehört.
 
empower schrieb:
@Skysnake wieso soll ich solche unsinnigen fragen beantworten. bin in der autoindustrie und hab mit öffentlichen ausschreibungen nichts zu tun. aber mir ist schon klar, dass bei den preisen da nur AMD möglich ist
Oh, die Autoindustrie hat jetzt wieder Geld wie Heu?
 
empower schrieb:
@Skysnake wieso soll ich solche unsinnigen fragen beantworten
Weil du sehr absolute Behauptungen ohne konkrete Belege aufstellst. Da ist es interessant zu wissen, inwiefern die auf eigenen Erfahrungen beruhen.
empower schrieb:
hab mit öffentlichen ausschreibungen nichts zu tun. aber mir ist schon klar, dass bei den preisen da nur AMD möglich ist
Wenn du das denkst, hast du verpasst, dass auch AMD die Preise kräftig angezogen hat. Ist nicht so, als ob die ihre GPUs verramschen würden.
empower schrieb:
weil der batzen an softwareprogrammierung erst später kommt.
Das ist halt nicht der Grund, warum AMD genommen wird. Man glaubt es kaum, aber Leute die solche Ausschreibungen machen sind nicht völlig blöd und können den "Konfigurationsaufwand" berücksichtigen. Trotzdem entscheiden sich viele für AMD, gerade wenn auch klassisches HPC gemacht wird statt nur AI.
empower schrieb:
du hast anscheinend auch noch nie von comfiui gehört.
Das ComfyUI, das bei mir zuhause auf dem AMD-only PC läuft? Sehe da das Problem nicht.
 
stefan92x schrieb:
aber Leute die solche Ausschreibungen machen sind nicht völlig blöd und können den "Konfigurationsaufwand" berücksichtigen.
achso, deswegen haben die öffentlichen auch so einen guten ruf was auschreibungen und geldverbrauch angeht ;)

stefan92x schrieb:
Das ComfyUI, das bei mir zuhause auf dem AMD-only PC läuft? Sehe da das Problem nicht.
wo ist das argument? ich kanns auch auf meinem amd laptop laufen lassen.
 
empower schrieb:
@Skysnake wieso soll ich solche unsinnigen fragen beantworten. bin in der autoindustrie und hab mit öffentlichen ausschreibungen nichts zu tun. aber mir ist schon klar, dass bei den preisen da nur AMD möglich ist, weil der batzen an softwareprogrammierung erst später kommt. du hast anscheinend auch noch nie von comfiui gehört.
Ok fassen wit also zusammen. Du hast keinerlei Ahnung, meinst aber genau zu wissen wie der Hase läuft. Respekt.

Und das du die Fragen als unsinnig bezeichnest sagt alles.

Ich kann dir aber mal so viel sagen als jemand der Ausschreibungen für solche Systeme auf Seite des öffentlichen Dienstes und der Industrie sowohl auf Anbieter als auch Kundenseite im zweistelligen Millionenbereich umgesetzt hat sagen das du undifferenzierten Quark redest.

Jetzt verstanden?

Und nein es ist nicht schlimm keine echten Erfahrungen zu haben aber dann sollte man aich mal zuhören.
 
  • Gefällt mir
Reaktionen: stefan92x
das sind die schönsten diskussionen. keine argumente haben und dann mit erfahrung usw. kommen. das ist typisch, wenn man was sagt, was den fanboys nicht gefällt.
 
empower schrieb:
achso, deswegen haben die öffentlichen auch so einen guten ruf was auschreibungen und geldverbrauch angeht ;)
Als jemand, der beruflich sowohl die öffentliche Hand als auch die Autoindustrie kennt, kann ich dir guten Gewissens sagen: es gibt deutsche Behörden, deren IT wesentlich besser und kosteneffizienter arbeitet und einkauft als gewisse große Autokonzerne. Gibt auf beiden Seiten auch die anderen, das will ich nicht leugnen.
empower schrieb:
wo ist das argument? ich kanns auch auf meinem amd laptop laufen lassen.
Du hast es angesprochen und ich frage mich wieso? Was ist denn Argument, denn ich erkenne keins?
 
DU willst nur nicht die Argumente hören!

Ich habe dir gesagg das wir ein POC mit AMD gemacht haben, kurz etwas Hilfe bei der ersten Umsetzung hatten um die Systeme in die bestehende Platform und Softwarestacks zu integrieren und es dann im wesentlichen lief. Sprich die Entwickler haben die Systeme benutzt und waren zufrieden. Sprich am Ende konnte man für dir größere Beschaffung sowohl AMD als auch nVidia anbieten.

Das ist nicht ganz erste Hand weil ich es nicht selbst umgesetzt habe aber Kollegen im gleichen Team. Sprich näher dran sein kannst du nicht wenn du es nicht selbst machst.

Und deinen Kommentar bezüglich Ausschreibungen im öffentlichen Bereich kannst du dir im HPC Bereich abschminken. Ein Großteil der Ausschreibungen von dort sind um längen kompetenter als die aus der Industrie...

Und was so manchet Anbieter an Bullshit verzapft will ich jetzt lieber erst gar nicht austreten. Das ist immer wieder nur noch peinlich....
 
empower schrieb:
Sie treffen zumindest manchmal sinnvolle Entscheidungen
Nobody gets fired for buying IBM?
Skysnake schrieb:
Und was so manchet Anbieter an Bullshit verzapft will ich jetzt lieber erst gar nicht austreten. Das ist immer wieder nur noch peinlich....
Insbesondere die sogenannten Marktführer.
 
@empower Du weißt, dass die Spitze der TOP500 bereits mit AMD läuft? Platz 1 wird übrigens vom DOE betrieben.
In der Liste findest du auch diverse kleinere AMD-Cluster vom DOE. Ein allzu großes Softwareproblem haben die nicht mehr.

Dass bei AMD so viel Open Source ist, dürfte einer der Gründe sein. Ein Problem an NVIDIAs Ansatz ist, dass NVIDIA Probleme in Cuda oder Treibern fixen muss. Bei AMD kann man das auf mal selbst machen und die Manpower hat das DOE.

Der APU-Ansatz von AMD bringt auch noch einige Vorteile. Hat schon Gründe, dass NVIDIA da zusammen mit ARM nachziehen will.
 
pseudopseudonym schrieb:
Dass bei AMD so viel Open Source ist, dürfte einer der Gründe sein. Ein Problem an NVIDIAs Ansatz ist, dass NVIDIA Probleme in Cuda oder Treibern fixen muss.
da bist du komplett falsch leider, genau das gegenteil ist der fall. als ob CUDA schlecht wäre, weil tausende bezahlte entwickler daran tagtäglich arbeiten :evillol:
 
@empower Cuda ist gut, keine Frage. Aber bei dem Scale, mit dem am DOE gearbeitet wird, hat alles irgendwann mal Bugs. Bei NVIDIA musst du dann warten, bis die das gefixt haben. Ggf mit vielen Runden Logs hin- und herschicken, die dann bei DOE-Clustern auch noch bereinigt werden müssen (und theoretisch muss jedes Log, das nach außen geht, genehmigt werden).
 
pseudopseudonym schrieb:
@empower Cuda ist gut, keine Frage. Aber bei dem Scale, mit dem am DOE gearbeitet wird, hat alles irgendwann mal Bugs. Bei NVIDIA musst du dann warten, bis die das gefixt haben. Ggf mit vielen Runden Logs hin- und herschicken, die dann bei DOE-Clustern auch noch bereinigt werden müssen (und theoretisch muss jedes Log, das nach außen geht, genehmigt werden).
hier ist ein bisschen material von den experten https://newsletter.semianalysis.com...-who-wins-performance-cost-per-million-tokens

Screenshot 2025-10-29 at 10-32-42 AMD vs NVIDIA Inference Benchmark Who Wins - Performance &am...png


von mir aus kann AMD so weiter machen, ich kauf mir nur CPUs von AMD :evillol:

Ergänzung ()

pseudopseudonym schrieb:
@empower Du weißt, dass die Spitze der TOP500 bereits mit AMD läuft? Platz 1 wird übrigens vom DOE betrieben.
wie ein amerikanisches auto die meisten PS und den meisten spritverbrauch. wirtschaftlich ist die 500 green liste https://top500.org/lists/green500/2025/06/
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Kazuja
empower schrieb:
Software und Hardware hat Bugs, das ist ja mal was ganz neues:
Further tests would have been interesting. I wanted to test CPU to GPU bandwidth using the GPU’s copy engine. DMA engines can queue up memory accesses independently of CPU (or GPU) cores, and are generally more latency tolerant. Nemes does have a test that uses vkCmdCopyBuffer to test exactly that. Unfortunately, that test hung and never completed.
Checking dmesg showed the kernel complaining about PCIe errors and graphics exceptions. I tried looking up some of those messages in Linux source code, but couldn’t find anything. They probably come from a closed source Nvidia kernel module. Overall, I had a frustrating experience exercising NVLink C2C.
https://chipsandcheese.com/p/grace-hopper-nvidias-halfway-apu
 
empower schrieb:
hier ist ein bisschen material von den experten https://newsletter.semianalysis.com...-who-wins-performance-cost-per-million-tokens

Anhang anzeigen 1670525

von mir aus kann AMD so weiter machen, ich kauf mir nur CPUs von AMD
DA dreht es sich rein um Interference. AI ist aber mehr als nur Interference.

This dashboard will cover multiple major inference stacks including VLLM, SGLang TensorRT LLM, and future Dynamo integrations.
Keinen der Stacks kenne ich bzw war im PoC. Damit kann ich dazu nichts sagen. Auch nicht dazu wir aussagekräftig das überhaupt ist.

Aber da kommen wir wieder zu dmd Punkt das du dir Einzelfälle raussuchst und dann verallgemeinerst.

Ich würde mich hüten zu sagen das AMD immer und überall besser ist und sei es nur bei Perf/$. Aber es gibt quch Situationen in denen nVidia deutlich schlechter ist. Dir Mi300A rocken in manchen Feldern auch einfach alles weg. Muss man auch mal so akzeptieren. PrePrint paper hierzu kann ich nicht bereitstellen.

empower schrieb:
wie ein amerikanisches auto die meisten PS und den meisten spritverbrauch. wirtschaftlich ist die 500 green liste https://top500.org/lists/green500/2025/06/
LOL. GREEN500 und wirtschaftlich. Ähm ja ne ist klar. Deswegen werden die Systeme ja auch im Nprmalbetrieb so betrieben. Oh no wait. Werden Sie nicht 🙄

Die Green 500 ist ein Gradmesser dafür was überhaupt möglich ist. Man sollte das aber immer mit eoner gehörigen Prise Salz betrachten. Wobei man sagen muss mit dem Rework vor ein paar Jahren ist es schpn massiv besser geworden. Mit etwas Aufwand kannst du aber trotzdem noch immer massiv was rausholen.
 
Zurück
Oben