Notiz Intel Xeon mit E-Cores: Clearwater Forest setzt auf neue Darkmont-Kerne

BAR86 · 24. Januar 2024

fdsonne schrieb:
Mit AMDs C-Cores kann man das weniger vergleichen, denn dort ist eher die Frage, warum AMD bei den großen Many Core Epycs überhaupt vollwertige Kerne verbaut. Abseits dem max. Boost im niedrigen Lastbereich takten die Teile eh im Schnitt nicht höher als das, was sie den C-Cores zugestehen.

das hab ich mich auch schon gefragt: wenn die C-Cores bei AMD nur bis ca 3.5 Ghz Takten, kann man ja 64 (und mehr) Kerner ausschließlich mit C-Kernen machen

fdsonne · 24. Januar 2024

@BAR86
Ein (technischer) Grund wird wohl das Thema mit dem 3D-VCache sein. Denn es fehlen die Kontaktpunkte um diesen da drauf zu packen bei den C-Core Modellen. Was natürlich auch Fläche spart.
Sprich sie müssten "eh" eine Version mit den P-Cores bringen, wenn sie das optional mit viel Cache im Portfolio halten wollen. Also so oder so wäre es zweigleisig. Ob sie da wirklich was gespart hätten, kann man dann sicher streiten.
Warum sie sich aber für diese und nicht für die andere Methode entschieden haben, kann man nur spekulieren. Theoretisch tut es keine Not bei den regulären Modellen.

stefan92x · 24. Januar 2024

BAR86 schrieb:
das hab ich mich auch schon gefragt: wenn die C-Cores bei AMD nur bis ca 3.5 Ghz Takten, kann man ja 64 (und mehr) Kerner ausschließlich mit C-Kernen machen

Im Server taktet AMD Zen 4c mit maximal 3,1 GHz, sowohl Bergamo als auch Siena. Diese beiden Serien sind ja letztlich auch genau das: Server-CPUs, die ausschließlich aus C-Cores bestehen. Genau dafür wurden die ja überhaupt entwickelt.

Alle normalen Genoa-Modelle überbieten deren maximalen Takt aber als All-Core-Takt und einige sogar als Grundtakt. Also gibt es auch für diese schon mehr Performance pro Thread, in dem man die größeren Chiplets nutzt. Richtig deutlich wird dieser Unterschied natürlich bei den 9004F (mit Boosts und teilweise sogar Grundtakt > 4 GHz) und den 9004X (die konstruktionsbedingt den großen brauchen).

@fdsonne zusätzlich zu dieser Taktfrage kommt sicher auch noch die Verfügbarkeit als Grund in Frage. Zen 4 war einfach deutlich früher fertig als Zen 4c. In dem Sinne wird es interessant, wie sich das bei Zen 5 entwickeln wird - falls da Zen 5c schneller oder sogar nahezu gleichzeitig folgen sollte, wäre es ja durchaus denkbar, dass AMD einen größeren Teil der Modellpalette damit gestaltet als mit Zen 5.

CyrionX · 24. Januar 2024

@Volker

In diesem Jahr debütiert die erste reine E-Kern-Xeon-CPU Intel Sierra Forest,

Sierra Forest wird im Jahr 2024 die erste Generation der neue E-Core-Xeons, die leistungsfähigeren P-Core-Xeons Sapphire Rapids (Test) und Emerald Rapids ergänzen.

=>Sierra forest wird sierra forest (also sich selbst) und zwei weitere Xeons ergänzen?
Entweder ist SF die erste oder die zweite Generation, aber doch nicht beide?
Ich zweifle hier wirklich an meinem Leseverständnis.

CDLABSRadonP... · 24. Januar 2024

fdsonne schrieb:
Ich wage zu bezweifeln dass ein sagen wir 128C/128T E-Core Prozessor im gleichen Node produziert und im gleichen Powerbudget plaziert langsamer sein soll wie ein 64C/128T P-Core Prozessor (ala 8592+ oder 8593Q - beide um die 2GHz Baseclock und 350-385W Powerbudget).

Und da bin ich mir ziemlich sicher, dass ersterer meistens langsamer sein wird. Die Frage lautet mMn bloß: So viel langsamer, dass dieser Effekt...

fdsonne schrieb:
Allerdings wird der P-Core Prozessor schlicht mehr Fläche benötigen.

...wieder neutralisiert wird oder nicht? Das entscheidet über die praktische Sinnhaftigkeit.

PS828 · 25. Januar 2024

Philste schrieb:
Welche wären das? Die AP Version kommt ja doch

Die Version jetzt hat ja 144 Kerne bzw 200+ später dann. Das ist noch übrig. Es gab wohl aber auch ein 4 tile system mit einer ~380 Kern und einer 500+ Kern Konfiguration welche eine Generation weiter kommen sollte. Würde wohl aber wieder in der Entwicklungsphase aufgrund intels Problemen nicht weiter verfolgt.

Ich versuch später mal noch die slides zu finden wo Intel das noch angekündigt hatte. Kam leider dann nicht mehr dazu

fdsonne · 25. Januar 2024

CDLABSRadonP... schrieb:
Und da bin ich mir ziemlich sicher, dass ersterer meistens langsamer sein wird. Die Frage lautet mMn bloß: So viel langsamer, dass dieser Effekt...

... und das ist so weil?

Das ist im Grunde simple Mathematik.
Angenommen, wenn der P-Core IPC Faktor 2 zum E-Core kann, dann kompensiert die doppelte Anzahl von Cores bei gleichem Takt und Powerbudget diese Mehrleistung 1:1. Nur ist der IPC Vorteil nicht bei Faktor 2, sondern eher bei 30, 40, lass es 50% sein. Je nach Anwendungsszenario ist auch SMT kein Thema, weil es eh ausgeschaltet wird. Und die Realität ist, dass es 4x so viele E-Cores pro P-Core sind, die man auf der gleichen Fläche verbaut.
Das KANN also nicht langsamer sein. Das einzige wo das der Falls ein wird, ist bei Workloads, die maßgeblich von der pro Thread Performance abhängen. Wo man dann CPUs kleiner baut (also von der Breite) und dafür mehr Takt auf die P-Cores drauf schubst, damit man neben dem IPC Vorteil auch den Takt Vorteil mitnimmt. Das geht stark zulasten der Effizienz.

Btw. kannst du sowas auch selbst einfach nachmessen. Es gibt ja lange schon (12th Gen.) CPUs mit P oder E-Cores am Markt. Oder du schaust in die diversen Reviews dazu (u.A. auch bei CB).

CDLABSRadonP... schrieb:
...wieder neutralisiert wird oder nicht? Das entscheidet über die praktische Sinnhaftigkeit.

Nein, die praktische Sinnhaftigkeit entscheidet rein der Endkunde. Nämlich indem der solches Zeug kauft (bei AMD wie bei Intel) oder halt eben nicht.
Wenn es stimmt, dass diese Modelle Wunsch des Marktes waren, dann ist die Sinnhaftigkeit natürlich auch gegeben.

Rückblickend ist so ein Teil auch nur logisch der nächste Schritt, weil immer mehr P-Cores immer mehr im Powerbudget zu drosseln, einfach sinnbefreit Siliziumfläche verschwendet. Das zahlt am Ende der Hersteller und nicht der Endkunde. Denn der rechnet nach Leistung in seinem Workload und nicht was den Hersteller die Leistung in der Produktion kostet.

stefan92x schrieb:
@fdsonne zusätzlich zu dieser Taktfrage kommt sicher auch noch die Verfügbarkeit als Grund in Frage. Zen 4 war einfach deutlich früher fertig als Zen 4c. In dem Sinne wird es interessant, wie sich das bei Zen 5 entwickeln wird - falls da Zen 5c schneller oder sogar nahezu gleichzeitig folgen sollte, wäre es ja durchaus denkbar, dass AMD einen größeren Teil der Modellpalette damit gestaltet als mit Zen 5.

Aber die Frage ist eher, hat es länger gedauert, weil es nicht schneller ging oder weil es nicht notwendig war es früher zu bringen?
Man darf dabei nicht vergessen, diese Many Core CPUs haben einen relativ begrenzten Markt. Das ist HPC Geschäft. Das findet sich nicht im Brot und Butter Server, der bei jeder x-beliebigen Firma im Keller steht.

stefan92x schrieb:
Alle normalen Genoa-Modelle überbieten deren maximalen Takt aber als All-Core-Takt und einige sogar als Grundtakt. Also gibt es auch für diese schon mehr Performance pro Thread, in dem man die größeren Chiplets nutzt. Richtig deutlich wird dieser Unterschied natürlich bei den 9004F (mit Boosts und teilweise sogar Grundtakt > 4 GHz) und den 9004X (die konstruktionsbedingt den großen brauchen).

Das ist aber so nicht vergleichbar. Das größte "F" Modell hat wenn ich das gerade richtig sehe, 48C. Das ist doch kein Vergleich gegen einen 96C Vollausbau oder 128C "C-Core" Vollausbau. Der Grundtakt der 64C und größer Modelle liegt im zweifel bei eben jenen 3,1GHz oder drunter. Bei den 96C sogar ne niedrige 2 Komma GHz. Und im ungünstigsten Fall erreicht so ein Teil auch nur diese Taktraten, +- ein bisschen.

Man würde auch aus anderen Gründen nicht auf die Idee kommen, den Takt bei nem C-Core Modell ausreizen zu wollen -> weil die C-Core CCDs ja mit 16C pro CCD und 8x CCDs auch anders an den IO Die angebunden sind, ergibt das bspw. Bandbreitenseitig ganz andere Rahmenbedingungen. Klar kannst du jetzt den 16C CCD auf sagen wir 6C runter reduzieren und hättest 6x8=48C - nur warum? Es gibt keine kleineren CCDs als diese. Spart man hingegen bei der CCD Anzahl, 4x12C bspw. hätte es wieder Einschränkungen in der verfügbaren Bandbreite zwischen Core und IO Die (Memory).

Für diese Art von kleinen Modellen muss AMD also eh den Aufbau der klassischen non C Core Kernen nutzen. Und selbst da ist das noch Nachteilbehaftet. Den Taktvorteil nimmt man dann natürlich gern mit.
Bei den großen hingegen ergibt das aus der Perspektive der Flächenutzung aber durchaus Sinn. 64C auf 8x8C oder 4x16C wären beim 280W Modell sicher nicht schlechter ggü. dem 9534

Bei Intel hingegen muss man zumindest abseits der Many Core Modelle schauen. Weil die Leistungsdifferenz größer pro Thread ist wie bei AMD.

stefan92x · 25. Januar 2024

fdsonne schrieb:
Für diese Art von kleinen Modellen muss AMD also eh den Aufbau der klassischen non C Core Kernen nutzen.

Tun sie aber ja nicht. Die 8004 gehen von 8 bis 64 Kerne und nutzen 4x Zen 4c CCD. Und takten durch die Bank niedriger als die 9004 mit identischer Kernzahl und höherer TDP. Als konkretes Beispiel:

MODELL

ANZAHL DER CPU-KERNE

ANZAHL DER THREADS

MAX. BOOST-TAKTUNG

BOOST-GESCHWINDIGKEIT ALLER KERNE

GRUNDTAKTUNG

L3-CACHE

STANDARD-TDP

AMD EPYC™ 8324P

32

64

Bis zu 3,0 GHz

3,0 GHz

2,65 GHz

128 MB

180 W

AMD EPYC™ 9334

32

64

Bis zu 3,9 GHz

3,85 GHz

2,7 GHz

128 MB

210 W

Generell zieht sich das von ganz unten bis ganz oben durch das Portfolio, alles was auf Zen 4 basiert taktet höher (und hat höhere TDP pro Kern) als alles vergleichbare auf Zen 4c-Basis.

fdsonne · 25. Januar 2024

stefan92x schrieb:
Generell zieht sich das von ganz unten bis ganz oben durch das Portfolio, alles was auf Zen 4 basiert taktet höher (und hat höhere TDP pro Kern) als alles vergleichbare auf Zen 4c-Basis.

Verstehe den Einwand gerade nicht?
Es ging doch um die Thematik, dass bei engem Powerbudget es zumindest auf den ersten Blick keinen Sinn ergibt immer die großen Kerne zu verbauen, eben weil man die stark drosselt - das ist ja auch das Thema hier mit dem E-Core only Xeon.

Wenn du übertrieben, unbegrenzt Energie rein kloppen kannst, dann kannst du logisch auch die P-Cores ausfahren und deren Mehrleistung mitnehmen (zulasten der Effizienz)
Nur ist das nicht die Regel. Die Modelle am Markt zeigen, dass bei begrenztem Powerbudget einfach der P-Core ab einer bestimmten Drosslung keinen Mehrwert bietet (rein auf die Performance bezogen). Denn der Takt muss fallen und das soweit, dass er je nach größe des Modelles nichtmal mehr die ~3GHz der C-Cores erreicht. Das gilt für AMD in kleinerem Maße und für Intel in größeren Maße. Letzteres weil ihr E-Core einfach nicht nur bisschen taktgedeckelt und geschrumpft ist, sondern viel kleiner und entsprechend langsamer, dafür aber 4x so viele.

stefan92x schrieb:
Tun sie aber ja nicht. Die 8004 gehen von 8 bis 64 Kerne und nutzen 4x Zen 4c CCD. Und takten durch die Bank niedriger als die 9004 mit identischer Kernzahl und höherer TDP.

Was sollen jetzt aber die 8000er Modelle argumentativ bekräftigen?
Das ist doch bewusst eine abgespeckte Version? Argumentativ ergibt das doch keinen Sinn damit jetzt irgendwas aussagen zu wollen.

64C 8534P bei 200W macht 2,3GHz Base Block - das 280W! 9000er Modell macht 2,45GHz. Das sind 5% Differenz bei 40% mehr Leistungsaufnahme. Technisch könnten sie das auch als 9000er Modell mit hohen 2 Komma GHz oder 3 Komma GHz bringen bei entsprechend hohem Powerbudget. Aber das gibt der kleine Sockel nicht her, der bei 225W begrenzt ist.

Nur was ich nicht verstehe, was möchtest du mir damit jetzt sagen? Ein kleines Modell, was mehr Power pro Core hat, weil es weniger Cores hat, wird logisch davon profitieren, wenn man die großen P-Cores nimmt. Ist bei Intel und AMD exakt die selbe Nummer... Aber das war doch nie in Frage gestellt?

stefan92x · 25. Januar 2024

fdsonne schrieb:
Es ging doch um die Thematik, dass bei engem Powerbudget es zumindest auf den ersten Blick keinen Sinn ergibt immer die großen Kerne zu verbauen, eben weil man die stark drosselt - das ist ja auch das Thema hier mit dem E-Core only Xeon.

Mein Punkt war, dass die Zen 4-CPUs allesamt in einem Bereich getaktet sind, der den mit Zen 4c möglichen Bereich übersteigt. Und das es daher sinnvoll ist, dass diese Modelle mit Zen 4 statt Zen 4c realisiert wurden (bzw zusätzlich, je nachdem wie man es betrachten will).

fdsonne schrieb:
Was sollen jetzt aber die 8000er Modelle argumentativ bekräftigen?

Du meintest AMD könnte keine kleinen Modelle mit Zen 4c Chiplets bauen. Die 8004er sind aber genau das.

MalWiederIch · 26. Januar 2024

dcz01 schrieb:
Uff, also sorry, aber im Serverbereich halte ich nichts von E-Cores...
Wird immer trauriger Intel echt

Kannst du das auch sinnvoll begründen oder ist das nur wieder Bashing auf Pubertäts-Niveau?
Gerade hier machen die E-Cores Sinn …

Ergänzung (26. Januar 2024)

stefan92x schrieb:
Du hast recht, für HPC/Supercomputing taugen diese CPUs nichts.

Wie kommt er allein darauf, dass die Nische der sinnvolle Einsatzzweck einer solchen CPU sei?
Da muss man schon nicht ganz beim Thema sein …

stefan92x schrieb:
VM-Hosting ist aber genau die Art parallelisierbarer Anwendung, für die solche Chips ideal sind. Da haben ja auch die diversen ARM-Chips ihren Einsatzbereich und ebenso AMD Bergamo. Das gerne genutzte Marketing-Buzzword für diese Art CPUs heißt dementsprechend ja auch "Cloud-native"

Ein entsprechend deutlich größerer Markt.

eastcoast_pete · 28. Januar 2024

Weiß man denn schon, was die "Darkmont" Kerne denn so viel anders und besser können als die derzeitigen E-Kerne von Intel? Ich finde es irgendwie komisch, daß verschiedene Quellen (CB ist hier eher zurückhaltend!) die Nachricht, daß die nächste E-Kern Xeons "Darkmont" Kerne haben werden, als große Nachricht behandeln. Solange nicht klar ist, was diese E-Kerne können sollen, zB ob und wie sich die Mikroarchitektur gegenüber Gracemont ändert, ob neue Instruktionen dazukommen und welche usw, heißt das erst mal gar nichts. Klar, der Fertigungsknoten wird anders sein (EUV), aber das alleine wär eher enttäuschend.
Ähnliches gilt IMHO für Nachrichten über zB Zen 5; wenn da nicht wenigstens einige Fakten dabei sind, was die Zen 5 Kerne anders, besser oder zusätzlich zu Zen 4 können, ist es ja zunächst einmal einfach ein Name mit einer größeren Nummer.

Ergänzung (28. Januar 2024)

BAR86 schrieb:
das hab ich mich auch schon gefragt: wenn die C-Cores bei AMD nur bis ca 3.5 Ghz Takten, kann man ja 64 (und mehr) Kerner ausschließlich mit C-Kernen machen

Gibt's schon, zumindest angekündigt: Siena. Von AMD v.a. für TelCo Einsatz gedacht. Würde mich aber sehr wundern, wenn AMD nicht noch größere Many Core Zen4c (oder dann Zen5c) CPUs bringt, wenn Intel mit ihren Sierra Forests gute Resonanz findet.
Es gibt eben Anwendungen (inklusive in der Cloud), wo man Kunden oder Aufgaben ihren eigenen, privaten Kern zuweisen können will oder muss, und absolute Compute Leistung pro Kern nur "gut genug" sein muss. Der Unterschied zwischen AMDs (Zen 4c mit HT) und Intels Ansatz (viele Kerne ohne HT) besteht auch darin, daß sich eine Anwendung/Aufgabe in Zen4c theoretisch einen Kern mit einer anderen teilen muß oder kann, während das bei Sierra Forest von vornherein gar nicht geht (da kein HT). Man wird sehen, wie sich das auswirkt. Intel wird da uU auch auf mögliche Sicherheitsprobleme hinweisen, die HT ausnutzen. Allerdings müssen sie da sehr vorsichtig sein, da sie ja auch Xeons mit großen Kernen (und HT) verkaufen wollen.

stefan92x · 28. Januar 2024

eastcoast_pete schrieb:
Gibt's schon, zumindest angekündigt: Siena. Von AMD v.a. für TelCo Einsatz gedacht. Würde mich aber sehr wundern, wenn AMD nicht noch größere Many Core Zen4c (oder dann Zen5c) CPUs bringt, wenn Intel mit ihren Sierra Forests gute Resonanz findet.

Du scheinst Bergamo verpasst zu haben? AMDs Lösung mit 128 Zen 4c Cores. Sierra Forest ist hier der Nachzügler, nicht AMD. Siena ist ja nur der hinterhergeschobene "halbe Bergamo"

mkl1 · 29. Januar 2024

eastcoast_pete schrieb:
Weiß man denn schon, was die "Darkmont" Kerne denn so viel anders und besser können als die derzeitigen E-Kerne von Intel? Ich finde es irgendwie komisch, daß verschiedene Quellen (CB ist hier eher zurückhaltend!) die Nachricht, daß die nächste E-Kern Xeons "Darkmont" Kerne haben werden, als große Nachricht behandeln. Solange nicht klar ist, was diese E-Kerne können sollen, zB ob und wie sich die Mikroarchitektur gegenüber Gracemont ändert, ob neue Instruktionen dazukommen und welche usw, heißt das erst mal gar nichts. Klar, der Fertigungsknoten wird anders sein (EUV), aber das alleine wär eher enttäuschend.

Also erstmal kommt Skymont, den darf man nicht überspringen. Es gibt keine Details, Intel hat nur von significant IPC improvements bezüglich Lunar Lake gesprochen, der mit Skymont kommt. Aus der Gerüchteküche gibt es ein wenig mehr. Es deutet sich ein großer Sprung bei Skymont an, einige sprechen von einer Golden Cove IPC und einem 3x3 decoder Cluster. Das wäre ein deutlicher Sprung in die Breite, Gracemont hat einen 2x3 cluster. Siehe: https://www.computerbase.de/forum/t...gibt-raetsel-auf.2163508/page-3#post-28767591

Darkmont könnte mehr ein refresh zu Skymont sein, also wenig Änderungen. Weil nur 1 Jahr dazwischen liegt. Das ist aber reine Spekulation.

3faltigkeit · 30. Januar 2024

Der Intel Xeon CCR Edition

Suche

Notiz Intel Xeon mit E-Cores: Clearwater Forest setzt auf neue Darkmont-Kerne

BAR86

Commodore

fdsonne

Lt. Commander

stefan92x

Rear Admiral

CyrionX

Captain

CDLABSRadonP...

Admiral

PS828

Der Flieseninspektor Pro

fdsonne

Lt. Commander

stefan92x

Rear Admiral

fdsonne

Lt. Commander

stefan92x

Rear Admiral

MalWiederIch

Commander

eastcoast_pete

Commander

stefan92x

Rear Admiral

mkl1

Lt. Commander

3faltigkeit

Lieutenant

Ähnliche Themen

Passend zum Thema

SPEC CPU 2026 Moderner CPU-Benchmark bleibt der Kommandozeile treu

50 Prozent mehr Speicher Ryzen AI Max+ Pro 495 mit Radeon 8065S nutzt 192 GByte RAM

AMD Ryzen 9 Pro 9965X3D Der erste „Pro“ mit gestapeltem L3-Cache im Benchmark