News Sapphire × Ryzen AI Max+ 395: Zusammenschaltbare Mini-PCs mit Strix Halo für riesige LLMs

Volker · 11. März 2026

Zur #ew26 zeigt Sapphire seine Strix-Halo-Lösungen, die beliebig* koppelbar sind. Das ganze zielt auf zusammengeschaltete Nvidia DGX Spark, die für noch größere Projekte geeignet sind. Bisher ist AMD diesen Weg nicht offiziell gegangen.

Zur News: Sapphire × Ryzen AI Max+ 395: Zusammenschaltbare Mini-PCs mit Strix Halo für riesige LLMs

Ozmog · 11. März 2026

Frage mich, wie das mit Daisy Chain funktionieren soll, müssen die Geräte sich dann ja die Bandbreite irgendwo teilen. Je nachdem wie viele man da verbinden will, wird das ja zunehmend problematischer.
Das per Ethernet? Selbst wenn zwei Lan-Anschlüsse verbaut werden, dann können auch nur der erste und der letzte mit dem Netzwerk verbunden werden. Für die da zwischen heißt es dann wieder Bandbreite teilen. Klingt für mich jedenfalls nicht so sonderlich sinnig. Bei Zwei ist es ja kein Problem bei drei mag es noch relativ gut funktionieren aber je mehr es werden...

the_IT_Guy · 11. März 2026

Da hätte Marketing und Ingenieure aber mal besser zusammenarbeiten müssen.
Ein langweiliger USB oder LAN-Anschluss, das gab es schonmal cooler 😉

Trotzdem interessante Idee und sicher auch so bis ~5 Geräten praktikabel umsetzbar mit 2x10Gbit-LAN. Danach kauft die Zielgruppe eh Systeme in Richtung Server.

anexX · 11. März 2026

Wie siehts denn da mit Latenzen aus wenn die zusammengeschaltet arbeiten ?

eastcoast_pete · 11. März 2026

Haben die Sapphire Strix Halos denn Thunderbolt 5 oder (und ?*) die Möglichkeit, über eine M2 Schnittstelle einen OcuLink Adapter anzuschließen? Mit entweder TB5 oder OcuLink käme man schon etwas näher an den schnellen Verbund ran, den man für KI schon gerne hätte.
* Wenn beides möglich ist, könnte man damit dann zumindest theoretisch auch 3 oder mehr von den schnellen Kisten zusammen schalten.

Gargamehl · 11. März 2026

@Redaktion - Inwiefern ist die Anzahl USB-C Anschlüsse ein Problem? Genau dafür gibt es doch schon immer USB-C Hubs?
Ohne näherer Erläuterung wirkt die Aussage damit sehr "fraglich".

tomgit · 11. März 2026

Gargamehl schrieb:
Genau dafür gibt es doch schon immer USB-C Hubs?
Ohne näherer Erläuterung wirkt die Aussage damit sehr "fraglich".

...weil das kein Daisy Chaining ist?

Die Frage ist eher, warum man keine Standardlösungen dafür einsetzt, etwa über (Q)SFP NICs, wie es Nvidia mit dem Spark auch macht.

Yakomo · 11. März 2026

Wohin führt das * , welche jeweils nach beliebig (beliebig*) steht? Ich checks nicht ganz.

Edit: ah, jetzt ist ein drittes * da und damit ist dann auch alles klar.

steirerblut · 11. März 2026

Das Problem dürften wohl die Kommunikationskosten über Netzwerk und USB im Vergleich zur geringeren Bandbreite sein. Ähnliches wurde ja auch schon mit Mac Studios und Exo, also bereits optimierten Protokollen, versucht, ging aber selbst mit weniger Overhead und TB5 Bandbreite mit massiven Performance Tradeoff einher. Beim DGX Spark funktionierts ja auch nur weil der komplette Layer (Hardware, Netzwerk, Software..) auf einheitlichen daten zentrischen Nvdia Stack zusammen arbeiten; Nvlink / Infiniband / GPU Direct Memory usw.

Rickmer · 11. März 2026

Wenn die besseres Netzwerk einbauen wollen für die Verbindung - werden die dann mit dem DGX Spark und dessen 100 Gbit gleich ziehen?

SaschaHa · 11. März 2026

Also wenn ich bedenke, dass die Rechenleistung meiner 4070 Ti bei Stable Diffusion-Modellen um etwa das 10 bis 15-fache abnimmt, wenn der VRAM mal voll ist und dann über PCIe 4.0 x16 auf den RAM zugegriffen werden muss, würden mich die technischen Details interessieren, wie man diesen Bandbreitenverlust bei der Kommunikation zwischen mehreren PCs kompensieren will. Das Einsatzgebiet dürfte sehr eingeschränkt sein oder einfach darauf abzielen, dass beide PCs getrennte Aufgaben übernehmen und diese dann irgendwie zusammenführen. Vermutlich mehr Marketing als realer Nutzen, aber lassen wir uns überraschen. Bin auf unabhängige Tests gespannt.

ChrFr · 11. März 2026

Was juckt mich der ganze A.I. Krempel, aber Sapphire Mini-PC mit Strix Halo = lecker😊.
Bin gespannt was Sapphire im Mini-PC Bereich und an der Mainboard Front noch so bringt die nächsten Monate.

Weyoun · 11. März 2026

Damit nicht sinnlos Rechenleistung des Clients verschwendet wird, benötigt man eigentlich mindestens Thunderbolt 5 mit mit 80 GBit/s synchron oder 120 / 40 GBit/s asynchron (bei Master -Slave muss nicht zwingend in beide Richtungen die selbe Geschwindigkeit vorherrschen). Oder aber schnelles LAN mit mehr als 100 GBit/s (sogenanntes "Terabit-Ethernet" => Glasfaser).

stefan92x · 11. März 2026

SaschaHa schrieb:
Also wenn ich bedenke, dass die Rechenleistung meiner 4070 Ti bei Stable Diffusion-Modellen um etwa das 10 bis 15-fache abnimmt, wenn der VRAM mal voll ist und dann über PCIe 4.0 x16 auf den RAM zugegriffen werden muss, würden mich die technischen Details interessieren, wie man diesen Bandbreitenverlust bei der Kommunikation zwischen mehreren PCs kompensieren will

In deinem Beispiel passt das Modell nicht in den VRAM, sondern muss ständig nachgeladen werden. Bei der Verbindung mehrerer GPUs (was das hier ja effektiv ist), wird das Modell aufgeteilt, so dass jede GPU einen Teil des Modells enthält (typischerweise sind das ja mehrere "Layer", das kann man gut aufteilen). Durchgereicht werden dann nur die Token, dafür reicht weniger Bandbreite als wenn man ständig Modellparameter nachladen müsste.

fox40phil · 11. März 2026

Hm noch ein wenig mehr Arbeit und sie hätten eine realistische Demo auf die Beine stellen können?!
Wirkt sehr schnell zusammengeschustert 🫣.
Genau mit solchen Technologien, wie hier schon mehrfach angesprochen wäre erst komplett sinnig.

stefan92x · 11. März 2026

@fox40phil vor allem, weil es auf diesem Niveau nicht wie etwas neues aussieht, sondern wie etwas was Leute schon längst machen mit Strix Halo: https://www.jeffgeerling.com/blog/2025/i-clustered-four-framework-mainboards-test-huge-llms/

ETI1120 · 11. März 2026

In Bezug auf AI fallen AMD bei Strix Halo zwei Entscheidungen immer wieder auf die Füße

RDNA 3.5 anstatt RDNA 4
nur 16 PCIe Lanes

fox40phil · 11. März 2026

stefan92x schrieb:
@fox40phil vor allem, weil es auf diesem Niveau nicht wie etwas neues aussieht, sondern wie etwas was Leute schon längst machen mit Strix Halo: https://www.jeffgeerling.com/blog/2025/i-clustered-four-framework-mainboards-test-huge-llms/

Und dann so was:

First of all, AMD's support for their AI stuff is... okay. But not great. And that means I spent more time in my testing debugging ROCm driver and library issues than actually testing.

Das ist doch wirklich (!) ein Trauerspiel!

Chaosbreed · 11. März 2026

Fehlt es nicht an Bandbreite? Das läuft doch dann alles super langsam...
Da bräuchte es doch eher eine Glasfaserverbindung?

ETI1120 · 11. März 2026

fox40phil schrieb:
Das ist doch wirklich (!) ein Trauerspiel!

Wie alt ist das Video?

Donato Capitella hat einige Videos auf YouTube zu Strix Halo
https://www.youtube.com/playlist?list=PLNg09XqZv0dFzHP1LxYb7tIsK_Pk94mK_

News Sapphire × Ryzen AI Max+ 395: Zusammenschaltbare Mini-PCs mit Strix Halo für riesige LLMs

Ost 1

Rear Admiral Pro

Lieutenant Pro

Rear Admiral

Commander

Cadet 4th Year

Rear Admiral

Commander

Lt. Commander Pro

Silent-Fanatiker Pro

Rear Admiral

Lt. Commander

Fleet Admiral Pro

Rear Admiral

Vice Admiral

Rear Admiral

Commodore

Vice Admiral

Lieutenant

Commodore

Ähnliche Themen

Passend zum Thema