News Intel Granite Rapids-SP: 80-Kern-Samples mit 336 MB L3 im A2-Stepping gesichtet

stefan92x schrieb:
80 Cores, 320 Threads? Das dürfte wohl ein Auslesefehler sein, denn vierfach-MT wäre doch sehr überraschend? Wie zuverlässig ist dann wohl der Rest dieses Screenshots? :freak:
Du hast den Rest gesehen? Nicht? Dann beantwortet das doch wohl deine Frage.
600 MHz... aber immerhin listet er die Caches 160 bzw. 2x auf, d.h. es ist von 160 Kernen und 320 Threads auszugehen.
Ergänzung ()

qiller schrieb:
Und Ratio von nur 77? Bei 80 Kernen mit HT? Also mein Ryzen 7 3700X kommt ja schon auf 527/5500 ST/MT CPUZ Werte und ner Ratio von 10.5.
Grundsätzlich skaliert es sich schlechter, je mehr Kerne ins Spiel kommen. Es ist also nicht inherent auffällig/falsch.
 
  • Gefällt mir
Reaktionen: MalWiederIch
Nagilum99 schrieb:
Du hast den Rest gesehen? Nicht? Dann beantwortet das doch wohl deine Frage.
Du hast die folgende Diskussion zwischen mir und Volker gesehen? Wir haben doch schon schön auf den Punkt spekuliert, wie dieser Chip zu deuten sein könnte ;)
 
xeonking schrieb:
Lohnen sich diese Xeon überhaupt noch, gibt es noch einen Bereich wo die gegen die AMD CPUs was ausrichten können? Aber generell ist der Wechsel auf andere CPUs im Server Segment leider sehr träge. Das sehe ich selbst bei uns, egal wie viele neuen esx dazu kommen, leider immer nur die Xeon Systeme.

gruß
Ja gibt es noch immer. Die Bereiche werden aber immer kleiner. Wenn sich Intel aber streckt, machen Sie einfach sehr attraktive Preise.

stefan92x schrieb:
Die Aufteilung auf diesem Chip bleibt aber dann trotzdem bemerkenswert. Offenbar 3 Chiplets mit Cores, aber keine durch 3 teilbare Anzahl aktiver Cores. Da niemand asymmetrisches Verhalten mag, weil das schlecht vorhersagbar ist, spricht das für einen sehr guten Interconnect zwischen den Chiplets, so dass es quasi egal ist, auf welchem Chiplet wie viele aktive Cores sitzen. Der L3 mit 336 MB bleibt aber trotzdem etwas merkwürdig
Du hast schon gesehen das es CPUs mit 2 und 3 CPU Chiplets gibt?
Donnidonis schrieb:
Wir hatten zum Beispiel massiv Probleme mit PCIe bei unseren Testservern, die wir mit AMD bestellt haben. Da mussten erst ein paar Fixes kommen, bis unsere Karten rund liefen.
Das ist aber eher ein Board Problem und gibt es auch mit Intel.
qiller schrieb:
Naja, also die Benchmarkwerte können eigt. nicht stimmen. Sone geringe ST-Leistung? Und Ratio von nur 77? Bei 80 Kernen mit HT? Also mein Ryzen 7 3700X kommt ja schon auf 527/5500 ST/MT CPUZ Werte und ner Ratio von 10.5. Oder der CPUZ-Bench skaliert einfach bad, i.d.k.
Das ist bei Intel jetzt nicht ungewöhnlich. Die CPUs von denen sind massivst Power limited. Daher skaliert es nicht 1:1 mit den Kernen.
 
Skysnake schrieb:
Das ist aber eher ein Board Problem und gibt es auch mit Intel.
Das mag natürlich sein, trat halt nur bei den AMD Servern auf (vom gleichen Hersteller wie die Intel Server). Jetzt wo alle Probleme behoben sind geht es ja auch, waren aber 2 Monate herumprobieren weil niemand wusste, was genau das Problem ist. Da fiel die Bestellung weiterer Intel Server halt leicht. Aber sind halt persönliche Erfahrungen, kann jemand anders genau andersherum erfahren.
 
Mit welchem Device gab es denn Probleme und wie haben sich diese genau geäußert?
 
Skysnake schrieb:
Du hast schon gesehen das es CPUs mit 2 und 3 CPU Chiplets gibt?
Ja. Ich fasse gerne nochmal zusammen, was mein Problem mit den gegebenen Angaben war:
4 MB Cache pro Kern -> 336 MB entspricht 88 Kernen
120 Kerne soll das Spitzenmodell auf 3 Chiplets haben -> 40 Kerne pro Chiplet -> es müssen 3 Chiplets sein
80 aktive Kerne und der Cache von 88 Kernen auf 3 Chiplets verteilt aktiviert hat bei mir ein völliges WTF hinterlassen.

Wenn man aber spekuliert, dass 44 statt 40 Kerne (und Cache) pro Chiplet physisch vorhanden sind, aber maximal 40 aus Yield-Gründen aktiv sind, kriegt man plötzlich ein stimmiges Bild eines Samples mit 2 Chiplets, voll aktiviertem Cache und eben besagten 40 aktiven Kernen pro Chiplet
 
Es sind Gerüchte. Genieße die Zahlen also mit einer gehörigen Prise Salz.

Der wichtige Punkt ist, daß es ein Design mit 2 und 3 CPU Tiles wohl geben wird. Ob jetzt die 2 oder 3 Tile Variante 80 cores haben wird, wird sich zeigen.
 
Skysnake schrieb:
Mit welchem Device gab es denn Probleme und wie haben sich diese genau geäußert?
Hat sich um eine FPGA Karte gehandelt. Fehler waren vielfältig:
  • Downgrade von PCIe 4.0 auf PCIe 3.0
  • Nur x8 statt x16 Verbindung
  • Manchmal gar nicht erkannt
  • Selten mal Übertragungsfehler

Mittlerweile geht es, war aber ein Kampf.
 
Das sind aber ganz normale Probleme die es seit PCIe 4.0 gibt. Ca alle 300 Maschinen hast du solche Probleme einmal im Jahr.

Ich betreue größere Systeme und da ist das absolut Standard das zu testen und Karten/Riser/CPU neu stecken zu lassen bzw Karten/Riser/MB/CPU auch zu tauschen wenn der reseed nicht hilft.

Ich lasse daher auch Devices lieber nur mit 4.0 laufen falls sie aus 5.0 keinen Vorteil ziehen. Macht einfach weniger Ärger.

BTW. Das downgrade kommt teils auch erst unter Last. Also dauerhaft monitoren. Z.b. über lspci ;)
 
Kann ja sein. Bei unserer Serverlandschaft (>1000 Server) ist es halt ausschließlich bei den AMD Servern aufgetreten. Die Intel Maschinen laufen seit Jahren ohne Probleme, ohne nur einen Fehler in der Richtung. Die AMD haben bei uns einfach massiven Mehraufwand bedeutet. Da ist es verständlich, wenn das nicht jeder möchte. Aber gibt sicher auch Leute, wo es andersrum ist. In meiner Branche habe ich allerdings öfter gehört, dass die AMDs Probleme machen, manche haben sie wieder rausgeschmissen.

Aber zum Glück kann ja jeder kaufen, was er möchte.
 
Also bei aktuellen Intels sehe ich da keinen Unterschied mehr wie gesagt und das jetzt auf so ca 7.000 Server betrachtet.

Aber klar, wenn der Hersteller den Riser verbockt hat man halt Probleme .
 
Skysnake schrieb:
Aber klar, wenn der Hersteller den Riser verbockt hat man halt Probleme .
Es waren NICHT die Riser, ich sagte doch, es lag an der Firmware. Mit den neusten Servern haben wir auch keine Probleme mehr jetzt. Trotzdem ist das Vertrauen etwas dahin, die Mehrarbeit war beachtlich und ist sie noch immer, weil die Server eben jetzt genauer beobachtet werden. Die Schuld für die Probleme die wir hatten lag einfach bei AMD, die haben sie letztlich ja auch beseitigt. Ohne neue Riser.

Aber ich habe dazu nun genug gesagt, jeder macht halt andere Erfahrungen.
 
  • Gefällt mir
Reaktionen: MalWiederIch
Hmm... deckt sich tatsächlich nicht mit meiner Erfahrung mit ca 4.5k AMD EPYC Systemen über alle Generationen mit teils early shipment.

Muss dann schon ein recht spezifisches Problem gewesen sein. Wobei FPGAs jetzt schon zickiger sind als andere Hardware meiner Erfahrung nach.
 
Geister-CPU? Hier geht es um nichts exotisches, sondern den nächsten Mainstream-Xeon. Der wird, wenn er denn soweit ist, haufenweise Endkunden erreichen
 
  • Gefällt mir
Reaktionen: MalWiederIch
Zurück
Oben