Intel Xeon E5-2600 v3 : 18-Kern-CPU mit 5,69 Mrd. Transistoren auf 662 mm²

, 101 Kommentare
Intel Xeon E5-2600 v3: 18-Kern-CPU mit 5,69 Mrd. Transistoren auf 662 mm²

Am Vortag des IDF 2014 lässt Intel den Vorhang für die große Neuerung des Jahres 2014 im Server-Segment fallen. Mit den „Haswell-EP“ werden fortan bis zu 18 Kerne und 36 Threads geboten, hinzu kommt DDR4-Unterstützung in allen Bereichen. Dafür hat der CPU-Hersteller beim Layout wieder in die Trickkiste gegriffen.

Prozessor-Dies können nicht unendlich groß werden. Eine ungeschriebene Regel sagt bei Mainstream-Modellen, dass alles über 20 mm Seitenlänge unwirtschaftlich ist – zu fehleranfällig und damit schlecht für die Ausbeute. Bei High-End-Modellen und Preisen jenseits von 4.000 US-Dollar wird diese Regel etwas großzügiger ausgelegt, doch viel weiter geht es auch dort nicht, bis auf 30 mm Kantenlänge will es ein Fertiger nicht treiben. Deshalb muss das Design stetig optimiert werden, am Ende kommen deshalb in der letzten Zeit zunehmend mehr und mehr annähernd quadratische Chips heraus – wie die Desktop-Variante „Haswell-E“ mit 20,2 × 17,6 mm². Denn mit jeweils 25 mm Seitenlänge lässt sich bereits ein Die mit 625 mm² Fläche entwickeln, ohne die Fertigungsgrenzen zu sprengen. Doch Theorie und Praxis gehen nicht immer Hand in Hand.

Vor einem Monat lud Intel nach Hillsboro, Oregon, und zeigte an zwei Tagen, was in den letzten Jahren entwickelt wurde und jetzt als „Grantley“-Plattform mit dem Herzstück der „Haswell-EP“-CPUs marktreif ist. In diese Trickkiste musste der Hersteller nach dem bereits außergewöhnlichen Design bei „Ivy Bridge-EP“ in einer 4+4+4- bzw. „Ivy Bridge-EX“ mit 5+5+5-Kern-Anordnung noch einmal greifen. Heraus kommt bei der Zielvorgabe von 18 Kernen eine nochmalige Überraschung: Der neue Die bietet 4+4+4+6 Kerne auf einem Träger. Die Besonderheit sind die sechs Kerne am Rand des Dies: „Der Platz war einfach da“, hieß es salopp dazu von Intel. Der Blick auf den gesamten Die sowie das Blockschaltbild unterstützt dies. Während Speichercontroller, die QPI-Links und der gesamte Uncore-Bereich wie üblich ihren Platz am Rand in Anspruch nehmen, ist bei dem großen Die alles schon woanders untergekommen, sodass dort Platz für sechs Kerne inklusive jeweils 2,5 MByte L3-Cache ist.

Wafer mit Intels 18-Kern-Prozessor „Haswell-EP“
Wafer mit Intels 18-Kern-Prozessor „Haswell-EP“

Intern waren dafür erneute Umbauten nötig. Beim Blick auf das Diagramm zeigen sich dabei einige Parallelen zu dem, was AMD bei den größten ihrer Server-CPUs, zuletzt mit „Abu Dhabi“ alias Opteron 6300 Ende 2012, gemacht hat. Dort packte der Hersteller zwei Dies auf ein Multi-Chip-Modul (MCM) und lässt diese per HyperTransport-Link miteinander kommunizieren. Bei Intel wird der Die zwar ein nativer, sieht der Aufbau dem von AMD ähnlich, verhält sich zudem auch teilweise so: Denn die CPU-Kerne inklusive L3-Cache-Slices und Speichercontroller bleiben „auf ihrer Seite“ in ihrem Cluster, wenn nur wenig Last anliegt und vermeiden den Umweg auf die andere Seite. Auch sieht ein Prozessorkern erst einmal nur die Hälfte des insgesamt im Prozessor zur Verfügung stehenden L3-Caches, eben jener, der in seinem Cluster verfügbar ist. Werden mehr Ressourcen benötigt, geht es über die Verbindungsstücke in den anderen Cluster.

„Ivy Bridge-EP“ und „Haswell-EP“ im Vergleich
„Ivy Bridge-EP“ und „Haswell-EP“ im Vergleich

Diese „Buffer Switches“ genannten Verbindungen können mit maximal 32 Aktionen gleichzeitig umgehen. Laut Intel werden diese jedoch nie vollständig gebraucht, da die Befehle immer möglichst direkt an den nächsten vorbeikommenden Ring abgegeben werden. Von dem Ringbus, der seit der „Sandy Bridge“-Generation im Einsatz ist, gibt es pro Seite zwei Stück, die entgegengesetzt arbeiten – einer rechts- und einer linksherum. Der als nächstes verfügbare nimmt die Daten auf und verteilt sie an Cache, Kerne & Co..

Doch nicht alle neuen Server-Prozessoren werden auf dem einzigen, mittlerweile trotz 22-nm-Fertigung riesigen Die basieren. Wie in der Vergangenheit ebenfalls üblich legt Intel wieder insgesamt drei Dies auf. Die Topmodelle werden als HCC (High Core Count) klassifiziert, darunter gibt es MCC (Medium Core Count) und LCC, was in dem Fall nicht für das geläufige Low Cost Carrier sondern Low Core Count steht. Im Vergleich zur Vorgängerserie sieht das wie folgt aus:

Modellserie Kerne Die-Fläche Transistoren
Ivy Bridge-E/EN/EP/EX 4 – 6 256,5 mm² 1,86 Mrd.
Ivy Bridge-EN/EP/EX 8 – 10 341 mm² 2,89 Mrd.
Ivy Bridge-EP/EX 10 – 12 541 mm² 4,31 Mrd.
Haswell-E/EN/EP 4 – 8 354 mm² 2,60 Mrd.
Haswell-EN/EP 10 – 12 492 mm² 3,84 Mrd.
Haswell-EP 14 – 18 662 mm² 5,69 Mrd.
LCC-Die für 4 bis 8 Kerne
LCC-Die für 4 bis 8 Kerne
MCC-Die für 10 bis 12 Kerne
MCC-Die für 10 bis 12 Kerne
HCC-Die für 14 bis 18 Kerne
HCC-Die für 14 bis 18 Kerne

Mit 662 mm² gehört der Die der maximalen Ausbaustufe der „Haswell-EP“ zu den größten in Intels Portfolio. In jüngerer Vergangenheit lagen da nur der „Nehalem-EX“ mit 684 mm² als einer der Vorgänger sowie der „Tukwila“ mit gar 700 mm² Die-Fläche drüber. Anhand des 12-Kern-Dies zeigt sich bei „Haswell-EP“ gegenüber dem Vorgänger, dass sich trotz gleicher 22-nm-Fertigung etwas getan hat: Eine knappe halbe Milliarde Transistoren wurden eingespart, der Die konnte fast 50 mm² schrumpfen.

Die bis zu 50 Prozent mehr Kerne, die ihrerseits noch eine mehr als zehn Prozent gesteigerte IPC gegenüber der Vorgängerarchitektur bieten, der größere Cache und die höhere Bandbreite dank DDR4-2133 haben bereits vor dem Start für 27 neue Rekorde gesorgt, darunter auch im Effizienz-Bereich. Dafür sorgen unter anderem bis zu 19 unterschiedliche Spannungsbereiche in der CPU (pro CPU-Kern jeweils eine + Uncore-Bereich), die gleichen C-States wie bei den Desktop-„Haswell“ und ein nochmals angepasster Turbo-Modus, der mehr auf Effizienz getrimmt wurde. Neue Server-SSDs und 40-Gigabit-Ethernet über NVMe runden das Paket ab.

Intels 18-Kern-Prozessor „Haswell-EP“ im Dual-Sockel-System
Intels 18-Kern-Prozessor „Haswell-EP“ im Dual-Sockel-System
Cinebench R15 mit 72 Threads
Cinebench R15 mit 72 Threads
27 Weltrekorde zum Start
27 Weltrekorde zum Start

Um die CPUs herum wurde in erster Linie das Speicherinterface angepasst. Neu ist auch dort die Unterstützung für DDR4-Speicher mit maximal 2.133 MHz bei der Bestückung von einem DIMM pro Channel am Quad-Channel-Speicherinterface. Die Unterstützung sinkt wie üblich bei Mainboards mit vielen RAM-Slots, für zwei DIMMs pro Channel (DPC) ist noch DDR4-1866 möglich, bei drei geht lediglich noch DDR4-1600, was jedoch immer noch ein großer Sprung gegenüber dem Vorgänger ist, der in dieser Konstellation nur noch DDR3-1066 unterstützte. Die Abwärtskompatibilität der „Grantley“-Plattform reicht bis DDR4-1333. Insgesamt unterstützt die Plattform bis zu 24 DIMM-Slots für ein Zwei-Sockel-System.

DDR4-Speichertakt je nach DIMM pro Channel
DDR4-Speichertakt je nach DIMM pro Channel

Am QPI-Interface als Kommunikationsschnittstelle der Prozessoren untereinander in Zwei-Sockel-Systemen hat Intel nicht viel gemacht. Nach wie vor ist QPI 1.1 am Werk, allerdings im Höchstfall jetzt mit bis zu 9,6 GT/s statt 8,0 GT/s. Auch hier gibt es aber Varianten hinab bis zu 6,4 GT/s, einem bereits seit Jahren bekannten Wert.

Neben dem „Wellsburg“-Chipsatz, der als C610 firmiert und quasi identisch zum X99-Chipsatz aus dem Desktop ist, wird Intel die neue Xeon-Serie auch für Kommunikationsdienste optimieren und dafür eine separate Chipsatzserie anbieten. Die Communications Chipset 8920 und 8955 sind speziell auf Ver- und Entschlüsselung optimiert – alternativ kann dies aber auch über eine PCI-Express-Lösung erfolgen, mit dem Intel QuickAssist Server Adapter. Neun Xeon sind bisher speziell für die Kommunikationssparte geeignet, was sich in einer sieben Jahre anhaltenden Verfügbarkeit und zehn Jahren Garantie widerspiegelt.

Intel Xeon E5-2600 v3 als Kommunikationsplattform

Zu den 23 Modellen der Serie Xeon E5-2600 v3 zum Start kommen noch fünf für Storage- und Kommunikationssysteme bestimmte Versionen sowie mindestens fünf Varianten Xeon E5-1600 v3 für Ein-Sockel-Systeme, zusätzlich auch noch Spezialmodelle für bestimmte Anwendungsszenarien, die ebenfalls nochmals bis zu 20 Modelle ausmachen. Die Preise gehen dabei wie immer weit auseinander und erstrecken sich von 213 bis 4.115 US-Dollar. Das Spektrum bei den Xeon E5-2600 v3 erstreckt sich von Modellen mit lediglich sechs Kernen und sechs Threads bis hinauf zu 18 Kernen mit 36 Threads und deckt TDPs von 55 bis 160 Watt ab. Bei den Xeon E5-1600 v3 gibt es vier bis acht Kerne in unterschiedlichsten Varianten, zu den Xeon E5-2400 v3, die ebenfalls noch zum Kreis der Neuvorstellungen erwähnt wurden, gab Intel noch keine Details preis – dies werden in einigen Wochen folgen. In den kommenden Monaten erwartet Intel hunderte Systeme von allen namhaften Herstellern, die auf die neue Plattform setzen.

Intel Xeon E5-2600 v3 „Haswell-EP“
Modell Kerne /
Threads
Takt /
max. Turbo
L3-Cache QPI TDP Preis
E5-2699 v3 18 / 36 2,3 GHz / 3,6 GHz 45 MB 9,6 GT/s 145 W $4.115
E5-2698 v3 16 / 32 2,3 GHz / 3,6 GHz 40 MB 9,6 GT/s 135 W $3.226
E5-2697 v3 14 / 28 2,6 GHz / 3,6 GHz 35 MB 9,6 GT/s 145 W $2.702
E5-2695 v3 14 / 28 2,3 GHz / 3,3 GHz 35 MB 9,6 GT/s 120 W $2.424
E5-2690 v3 12 / 24 2,6 GHz / 3,5 GHz 30 MB 9,6 GT/s 135 W $2.090
E5-2687W v3 10 / 20 3,1 GHz / 3,5 GHz 25 MB 9,6 GT/s 160 W $2.141
E5-2685 v3 12 / 12 2,6 GHz / 3,3 GHz 30 MB 9,6 GT/s 120 W $2.090
E5-2683 v3 14 / 28 2,0 GHz / 3,0 GHz 35 MB 9,6 GT/s 120 W $2.090
E5-2680 v3 12 / 24 2,5 GHz / 3,3 GHz 30 MB 9,6 GT/s 120 W $1.745
E5-2670 v3 12 / 24 2,3 GHz / 3,1 GHz 30 MB 9,6 GT/s 120 W $1.589
E5-2667 v3 8 / 16 3,2 GHz / 3,6 GHz 20 MB 9,6 GT/s 135 W $2.057
E5-2660 v3 10 / 20 2,6 GHz / 3,3 GHz 25 MB 9,6 GT/s 105 W $1.445
E5-2650 v3 10 / 20 2,3 GHz / 3,0 GHz 25 MB 9,6 GT/s 105 W $1.166
E5-2650L v3 12 / 24 1,8 GHz / 2,5 GHz 30 MB 9,6 GT/s 65 W $1.329
E5-2643 v3 6 / 12 3,4 GHz / 3,7 GHz 20 MB 9,6 GT/s 135 W $1.552
E5-2640 v3 8 / 16 2,6 GHz / 3,4 GHz 20 MB 8,0 GT/s 90 W $939
E5-2637 v3 4 / 8 3,5 GHz / 3,7 GHz 15 MB 9,6 GT/s 135 W $996
E5-2630 v3 8 / 16 2,4 GHz / 3,2 GHz 20 MB 8,0 GT/s 85 W $667
E5-2630L v3 8 / 16 1,8 GHz / 2,9 GHz 20 MB 8,0 GT/s 55 W $612
E5-2623 v3 4 / 8 3,0 GHz / 3,5 GHz 10 MB 8,0 GT/s 105 W $444
E5-2620 v3 6 / 12 2,4 GHz / 3,2 GHz 15 MB 8,0 GT/s 85 W $412
E5-2609 v3 6 / 6 1,9 GHz / – 15 MB 6,4 GT/s 85 W $306
E5-2603 v3 6 / 6 1,6 GHz / – 15 MB 6,4 GT/s 85 W $213
Intel Xeon E5-2600 v3 „Haswell-EP“ für „Storage and Communications“
Modell Kerne /
Threads
Takt /
max. Turbo
L3-Cache QPI TDP Preis
E5-2658 v3 12 / 24 2,2 GHz / 2,9 GHz 30 MB 9,6 GT/s 105 W $1.832
E5-2648L v3 12 / 24 1,8 GHz / 2,5 GHz 30 MB 9,6 GT/s 75 W $1.544
E5-2628L v3 10 / 20 2,0 GHz / 2,5 GHz 25 MB 8,0 GT/s 75 W $1.364
E5-2618L v3 8 / 16 2,3 GHz / 3,4 GHz 20 MB 8,0 GT/s 75 W $779
E5-2608L v3 6 / 12 2,0 GHz / – 15 MB 6,4 GT/s 52 W k. A.
Intel Xeon E5-1600 v3 „Haswell-EP“ für 1-Sockel-Systeme
Modell Kerne /
Threads
Takt /
max. Turbo
L3-Cache TDP Preis
E5-1680 v3 8 / 16 3,2 GHz / 3,8 GHz 20 MB 140 W $1.723
E5-1660 v3 8 / 16 3,0 GHz / 3,5 GHz 20 MB 140 W $1.080
E5-1650 v3 6 / 12 3,5 GHz / 3,8 GHz 15 MB 140 W $583
E5-1630 v3 4 / 8 3,7 GHz / 3,8 GHz 10 MB 140 W $372
E5-1620 v3 4 / 8 3,5 GHz / 3,6 GHz 10 MB 140 W $294
Intels 18-Kern-Prozessor „Haswell-EP“