Weitere Details zum Zehn-Kern-Prozessor von Intel

Volker Rißka
28 Kommentare

Nachdem die Preisliste von Intel bereits gestern alle Modelle des „Westmere-EX“-Prozessors mit bis zu zehn Kernen verraten hatte, hat der Chipgigant am heutigen Tage offiziell den Startschuss für die neue Speerspitze der Server-Prozessoren gegeben.

Beim Aufbau des Prozessors geht Intel den seit dem letzten Jahr eingeschlagenen Weg. Wie bei den „Nehalem-EX“ werden auch beim „Westmere-EX“ und zukünftigen „Poulson“ die eigentlichen zehn Prozessorkerne außen angesiedelt, während der gemeinsam genutzte und bis zu 30 MByte große L3-Cache im Inneren des Dies liegt. An der Ober- und Unterseite sind die vier QPI-Links bzw. zwei skalierbare Speicherverbindungen (SMI) untergebracht, die weiteren Steuerungseinheiten für den Cache, die eigentlichen beiden Speichercontroller und weitere Elemente liegen im Inneren des Zehn-Kern-Prozessors, wobei sie die unteren vier Kerne von den oberen sechs trennen.

Die-Shot des Westmere-EX
Die-Shot des Westmere-EX

Insgesamt 2,6 Milliarden Transistoren fasst der voll ausgebaute „Westmere-EX“ und belegt dabei eine Fläche von 513 mm². Zum Vergleich: „Poulson“ bringt es bei gleicher Fertigungsweise mit zwei Kernen weniger aber dafür viel größerem Cache und insgesamt 3,1 Milliarden Transistoren auf 544 mm², der Vorgänger „Nehalem-EX“ brachte es mit der alten 45-nm-Fertigung bei acht Kernen, 24 MByte L3-Cache und 2,3 Milliarden Transistoren noch auf riesige 684 mm². Basis für den „Westmere-EX“ ist der gleiche Sockel LGA 1567, den bereits die „Nehalem-EX“ nutzen. Alte Systeme können also aufgerüstet und weiterhin genutzt werden.

Intern greift Intel wie bei den aktuellen „Sandy Bridge“ auf eine bi-direktionale Ring-basierte Kommunikation zurück. Der Cache ist dabei wie auch bei den „Sandy Bridge“ in sogenannte Slices aufgeteilt, ohne dabei jedoch getrennt zu sein. Zwei „Cache Agent Hubs“ kümmern sich um die je fünf dieser Slices auf ihrer Seite, kommunizieren über einen internen Router aber auch direkt miteinander.

Interne Komponenten
Interne Komponenten

Gegenüber dem Vorgänger hat Intel an vielen Punkten Optimierungen vorgenommen. Die wichtigsten umfassen dabei den Energiebedarf der CPUs. Die maximale TDP verbleibt bei 130 Watt, jedoch wurde an den Stromsparfunktionen massiv gefeilt. So können alle Kerne in den Schlafzustand versetzt werden, aber auch die Steuereinheiten für den Speicher, den L3-Cache und der L3-Cache selbst natürlich auch schlafen gelegt werden. Zusammen mit der Unterstützung für Low-Power-DDR3-SDRAM soll die gesamte Plattform an Effizienz deutlich zulegen.

Stromsparfeatures
Stromsparfeatures

Bei den zusätzlichen Features hat sich im Vergleich zum Vorgänger weniger getan – kein Wunder, brachte der es auch vor einem Jahr auch auf mehr als 20 neue RAS-Features (Reliability, Availability, Serviceability). Mit von der Partie ist aber jetzt die Unterstützung für die „Advanced Encryption Standard-New Instructions“ (AES-NI) und die „Trusted Execution Technology“ (TXT), gleichzeitig wurde die Fehlererkennung bei den Speichermodulen verbessert. Eben bei den Speichermodulen hat sich auch etwas getan: Fortan werden offiziell 32-GByte-Riegel unterstützt, pro 4-Sockel-System werden stattliche 2 TByte unterstützt. Die Speicherbandbreite eines Prozessors liegt bei 102 GByte/s.

Intel AES-NI
Intel AES-NI
Intel TXT
Intel TXT
Enhanced DRAM Device Data Correction (DDDC)
Enhanced DRAM Device Data Correction (DDDC)
Fine Grained (Partial) Memory Mirroring
Fine Grained (Partial) Memory Mirroring

Insgesamt bringt Intel 18 Modelle auf Basis des „Westmere-EX“ für Preise zwischen 774 und 4.616 US-Dollar an den Start, die sich jedoch in unzähligen Punkten unterscheiden können und deshalb auch die Serien Xeon E7-8800, E7-4800 und E7-2800 bilden. Die grundsätzliche Unterscheidung der Xeons ist die, dass sich die CPUs der kleineren Serien nur für skalierbare 4- respektive 2-Sockel-Konfigurationen eignen, während die Modelle der Flaggschiff-Serie für skalierbare 8-Sockel-Systeme gedacht sind. Die detaillierte Unterscheidung fängt bei der Anzahl der Kerne an, geht über das Vorhandensein von Hyper-Threading weiter, setzt sich bei der Größe des L3-Caches fort und endet schließlich beim Turbo-Modus, der mit ganz unterschiedlichen Schritten agieren kann oder auch mal komplett fehlt. Neben dem Turbo-Modus, der nach Advanced- und Standard-Modellen ausgelegt ist, ist letztlich auch noch der QPI-Takt und daran gekoppelt das Speicherinterface eine weitere Variable.

Aufstellung der Modelle
Aufstellung der Modelle
Aufstellung der Modelle
Aufstellung der Modelle
Spezifikationen der einzelnen Modelle
Spezifikationen der einzelnen Modelle

Ein weiteres Merkmal der neuen Prozessoren ist erneut die Skalierbarkeit auf bis zu 256 Prozessoren. Dabei greift man immer wieder auf das gleiche Mittel zurück und kann ein System um zwei weitere Sockel beziehungsweise Prozessoren erweitern, die mit zwei QPI-Verbindungen in ein bestehendes System eingeführt werden. In der maximalen Ausbaustufe von 256 Prozessoren stehen am Ende in einer Bestückung mit den Zehn-Kern-Prozessoren 2.560 reale Kerne und satte 5.120 Threads zur Verfügung.

8-Sockel-Systeme
8-Sockel-Systeme
8-Sockel-Systeme diverser Hersteller
8-Sockel-Systeme diverser Hersteller
Systeme mit 256 Prozessoren
Systeme mit 256 Prozessoren
Rekorde von Westmere-EX
Rekorde von Westmere-EX

Mit all den Features und der gesteigerten Performance nagt das High-End-Server-Segment weitere Marktanteile von der Itanium-Plattform ab. Intel unterscheidet beide Elemente zwar noch, doch die Definition der „Mission Critical“-Plattformen, die bisher eher für die Itanium-Plattform galt, tritt heute bei „Westmere-EX“ mehrfach in Erscheinung. Die Itanium-Sparte wird damit wohl mehr und mehr ins Abseits gedrängt – Oracle hatte dies bereits erkannt und den Ausstieg aus dem Support für diese Serie bekannt gegeben.

Westmere-EX-Wafer
Westmere-EX-Wafer
Nvidia GTC 2024 (18.–21. März 2024): ComputerBase ist vor Ort!