News Intel Diamond Rapids: Die 8-Kanal-RAM-Lösung ist tot, 16 RAM-Channel sind gesetzt

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
19.629
  • Gefällt mir
Reaktionen: flo.murr, aid0nex, herrStreusalz und 4 andere
Problem bei 12 oder 16 Kanalspeicher ist halt einfach der RAM bedarf. Klar ist es möglich hier weniger zu verbauen und dann nur 8 oder 6 Kanäle zu nutzen. Dies geht definitiv mit weniger Bandbreite einher. Je nach Anwendung kann dies weh tun bei der Performance. Oder dem Budget da alle RAM Bänke bestückt werden müssen.

Beide Hersteller bieten Informationen an, wie so eine Konfiguration aussehen kann.

https://www.intel.com/content/www/u.../000055509/server-products/server-boards.html
https://docs.amd.com/v/u/en-US/amd-epyc-9004-ug-memory-population-recommendations

Das Intel die Plattform stutzt ist doch auch ok, es ist ja jetzt schon sehr unübersichtlich.
 
  • Gefällt mir
Reaktionen: flo.murr, aid0nex, nyster und 4 andere
Dann gibt es in Zukunft Mainstream mit 2 channeln und Xeon mit 16.

Intel wird sich dabei schon was gedacht haben. Aber es ist schon etwas traurig dass es keine Mittelklasse mit 3-6/8 channeln mehr gibt.:heul:
 
  • Gefällt mir
Reaktionen: nyster und ruthi91
Leider ist scheinbar alles mit mehr als 2 Speicherkanälen zu teuer für den mainstream geworden. Quad Channel würde auch so manches Bandbreitenproblem bei iGPUs lösen.
 
  • Gefällt mir
Reaktionen: herrStreusalz
Wie viele PCB-Layer so ein Mainboard mit 16 Speicherkanälen wohl braucht um Signalintegrität zu gewährleisten?...
 
  • Gefällt mir
Reaktionen: iron_monkey, aid0nex, Skysnake und 4 andere
Mal eine andere Frage:
Wie sagt ihr "Xeon" eigentlich?
KSeon, EKSeon, EKSion, KSIeon? IKSion? CROSSeon? oder nochwas schrägeres, das mir nicht einfällt? :D
 
So wie Xenon, nur ohne mittleres N

Anmerkung dazu als Nachtrag: Itanium (Titan), Xeon (Xenon). Die Elementnamen wären nicht markenrechtlich schützbar gewesen.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Bigfoot29, E2K3, nyster und 3 andere
Flutefox schrieb:
Leider ist scheinbar alles mit mehr als 2 Speicherkanälen zu teuer für den mainstream geworden. Quad Channel würde auch so manches Bandbreitenproblem bei iGPUs lösen.
Mit Speziallösungen etwa wie bei Apple wären Bandbreitenprobleme eine Sorge von gestern, ja. Das ist halt nicht Mainstream tauglich leider.
Mal schauen was AMD und da hinzaubert in Zukunft...
 
@BAR86 Das ist keine Speziallösung, es ist halt einfach nur nichts modulares.
 
  • Gefällt mir
Reaktionen: Bigfoot29, phanter und konkretor
Volker schrieb:
nutzen sogar den geringeren RAM-Bedarf als Unterscheidungsmerkmal zu AMD, wenn kein maximaler Ausbau bei den Kernen nötig ist

Wo soll da ein geringerer RAM-Bedarf herkommen? Es ist dieselbe Architektur, da braucht dieselbe Software naturgemaess genauso viel RAM.
Ergänzung ()

konkretor schrieb:
Problem bei 12 oder 16 Kanalspeicher ist halt einfach der RAM bedarf. Klar ist es möglich hier weniger zu verbauen und dann nur 8 oder 6 Kanäle zu nutzen. Dies geht definitiv mit weniger Bandbreite einher. Je nach Anwendung kann dies weh tun bei der Performance. Oder dem Budget da alle RAM Bänke bestückt werden müssen.

Wenn die Anwendung mit 8 Kanaelen zuwenig Performance bietet, waere man mit der 8-Kanal-Variante ohnehin nicht gluecklich geworden.

Umgekehrt, wenn die Anwendung nicht mehr Bandbreite oder mehr Speicher braucht, als mit 2, 4, 8, etc. (vielleicht auch dazwischen) DIMMs erreichbar sind, braucht man auch nicht mehr hineinstecken. Und Anandtech hat einmal einen 8-Kanal-Threadripper mit 2 DDR4-DIMMs getestet (und teilweise auch mit 8 WIMRE), und die 2 DIMMs haben die Performance erstaunlich wenig eingeschraenkt.

Klar, wenn man bandbreitenhungrige Anwendungen hat, dann wird man soviele Kanaele bestuecken wie moeglich (und muss auch dafuer zahlen), aber viele Anwendungen sind bei der Bandbreite zum RAM recht genuegsam.

Dass Intel bei den Platformen reduziert, wenn sich ihre Xeons schlecht verkaufen, ist wohl auch auf Gegendruck der Board-Hersteller zurueckzufuehren. Wer entwickelt und fertigt schon die doppelte Anzahl von Modellen, wenn von jedem relativ geringe Stueckzahlen hergestellt werden. Wenn man die Entwicklungskosten dann auf das einzelne Board umlegt, wird dann vielleicht das 8-Kanal-Board teurer als ein 16-Kanal-Board bei einer gemeinsamen Linie.

Bei AMD geht der Zug ja auch in die Richtung. Im Prinzip der gleiche Sockel fuer EPYC, Threadripper Pro und Threadripper, da kann man dann viel von der Entwicklung gemeinsam machen und wiederverwenden, und die kleineren Boards sind dann eigentlich nur abgespeckte Varianten des grossen.

Und klar, die 16-Kern, 24-Kern, und kuenftig noch mehr Kern-Desktop/Small-Server-CPUs fressen den grossen Plattformen den Teil des Geschaefts weg, der nur mehr Kerne braucht und nicht mehr RAM-Kaenaele, mehr RAM, oder mehr PCIe-Lanes, und damit haben die grossen Plattformen weniger Stueckzahlen, ueber die sie die Entwicklung amortisieren koenne. Das Resultat steht im Artikel.
 
Zuletzt bearbeitet:
Flutefox schrieb:
Leider ist scheinbar alles mit mehr als 2 Speicherkanälen zu teuer für den mainstream geworden. Quad Channel würde auch so manches Bandbreitenproblem bei iGPUs lösen.
Ja schade, S1366, 2011, 2066 und AMD TR hatte ja nie eine onboardgrafik, sonst hätte man mal testen können. Ich denke die Notebookhersteller oder Gaming Handhelds umgehen das mit CU, CAMM und LPX und dann gibts 10000Mhz DDR5 und dann reicht das schon... hoffentlich :)
 
  • Gefällt mir
Reaktionen: herrStreusalz und Flutefox
Flutefox schrieb:
Quad Channel würde auch so manches Bandbreitenproblem bei iGPUs lösen.
-> Strix Halo ist Quad Channel, also 256 Bit

Bei Apple ist das ja auch so, jede nächstgrößere CPU verdoppelt auch die Größe des Speichercontroller:
  • Mx ist 128 Bit angebunden (äquivalent zu 2-channel)
  • Mx Pro ist 256 Bit (4-channel)
  • Mx Max ist 512 Bit (8-channel)
  • Mx Ultra ist 1024 Bit (also effektiv 16-channel)

Das ist Teil des Grund, wie Apple so beeindruckende Ergebnisse abliefern kann: die großen CPUs bekommen auch genügend Speicherbandbreite.
 
  • Gefällt mir
Reaktionen: iron_monkey, nyster und herrStreusalz
@mae

Das Problem ist die Latenz. Aktuell bei Xeon 6 besteht die "dicke" variante aus 3 XCC tiles mit 4x Speicherinterface und die "kleine" Variante aus 2 XCC tiles mit 4x Speicherinterface. (Oder sogar aus nur einem MCC oder LCC tile mit 8x Speicherinterface)

Daten vom "eignenen" memory controller zu holen kostet 132ns
Daten vom "nächsten" memory controller zu holen kostet 157ns
Daten vom "übernächsten" memory controller zu holen kostet 182ns

In der kleinen variante gibt es kein "übernächstes Tile".
Das heißt bis 88 Kerne hast du 157ns max auf LGA 4710
und darüber has du 182ns max auf LGA 7529

Müssten jetzt die kleinen Prozessoren LGA 7529 kompatibel sein müssten sie auf 3 teil-deaktivierte chipplets setzen da sie sonst nicht genug Kanäle hätten und hätten somit die selbe Latenzpenalty die damit einhergeht.

Auf AMD Seite gibt es ähnliche Probleme. Die super breiten Speicherinterfaces sind nicht gratis.
 
  • Gefällt mir
Reaktionen: iron_monkey, Skysnake und nyster
phanter schrieb:
Intel wird sich dabei schon was gedacht haben.
Es ist halt letztlich Zeit, Dual-Socket-Server als Konzept zu begraben. Mit 8 Channel passt es, mit 12 Channel brauchte es sehr obskure Layouts, wenn man Vollbestückung will, mit 16 Channeln kann man es endgültig vergessen.

Aber andererseits sind 16 Channel eben schlicht das doppelte von 8...

In der aktuellen Generation bedeutet 1P vs 2P eben 12Ch vs 16Ch, da gibt es dann Argumente für 2P-Systeme. Bei Diamond Rapids hätte man 16Ch vs 16Ch gestellt, da gibt es endgültig keinen Vorteil mehr für 2P-Konfigurationen.

Schade ist es halt nur für diejenigen, die 1P mit der kleinen Plattform haben wollen, die haben nur Nachteile durch diese Entscheidung. Aber wie groß ist dieser Markt noch in Zukunft?
 
Rickmer schrieb:
Das ist Teil des Grund, wie Apple so beeindruckende Ergebnisse abliefern kann: die großen CPUs bekommen auch genügend Speicherbandbreite.
Hier würde ich aber die Frage stellen, ob die CPUs diese Bandbreite überhaupt anfordern - da reden wir schon über sehr spezifische Workloads, die vermutlich eher selten sind (zumindest für die Apple Plattform).
 
16 Speicherkanäle sind schon fett! Der Anpressdruck auf den Sockel muss da auch erst einmal zustandekommen/ ausgehalten werden bei fast 10.000 Kontakten!
 
  • Gefällt mir
Reaktionen: medsommer und Skysnake
y33H@ schrieb:
Hier würde ich aber die Frage stellen, ob die CPUs diese Bandbreite überhaupt anfordern
Ja und nein. Die M-Chips sind ja komplette SoCs, die auch die GPU beinhalten. Die braucht die Bandbreite auch, dir CPU eher weniger.
 
y33H@ schrieb:
da reden wir schon über sehr spezifische Workloads, die vermutlich eher selten sind (zumindest für die Apple Plattform).
Für lokale AI Spielereien sind die größeren Mac Chips relativ bliebt... im Vergleich zu einer NVIDIA RTX PRO 6000 ist ein Mac mit M3 Ultra beinahe günstig...
 
  • Gefällt mir
Reaktionen: herrStreusalz und konkretor
Zurück
Oben