Ein Jahr nach der offiziellen Einführung der Prozessoren basierend auf Intels Penryn-Generation wartet Ende dieses Jahres bereits die nächste Generation und setzt in dem Intel „Tick-Tock-Modell“ das nächste Tock. In der Relation spricht Intel bei Nehalem über einen Prozessor, der im Prinzip in den Ausführungseinheiten auf dem aktuellen „Penryn“-Design basiert, jedoch neben zahlreichen Verbesserungen in der Architektur selbst auch eine gesteigerte Performance-per-Watt-Leistung gegenüber den Penryn-Prozessoren bietet. In Zahlen ausgedrückt bedeutet dies eine Leistungssteigung von 10-25 Prozent bei Single-Thread-Anwendungen und zwischen 20 und 100 Prozent bei Multi-Thread-Applikationen. Zudem soll die Leistung bei gleichem Energieverbrauch gegenüber dem Penryn um bis zu 30 Prozent gesteigert worden sein.
Das Intel Tick-Tock-Modell.
Während Penryn nur eine Weiterentwicklung der Core Mikroarchitektur
(Merom) darstellt, handelt es sich bei Nehalem (Gelb) um eine
neue Mikroarchitektur mit drastischen Verbesserungen.
Eine weitere „Besonderheit“ bei Nehalem ist die Turbo-Mode Funktion, die dem Prozessor erlaubt, die Taktfrequenz bei Nichtbelastung eines oder mehrerer Kerne in drei Stufen nach oben zu schrauben, ohne die Thermal Design Power der gesamten CPU zu überschreiten. Wenn beispielsweise zwei Kerne nichts zu tun haben, dürfen die anderen beiden auf einer höheren Frequenz laufen, um auch in Anwendungen, die keine vier Kerne optimal ausnutzen können, einen entsprechenden Leistungsvorteil zu generieren. Neu sind auch insgesamt sieben zusätzliche Befehle, die unter den Streaming SIMD Extensions (SSE) 4.2 ihren Platz finden.
Derzeit sind für den Desktop-Bereich drei und für das Mobile-Segment zwei verschiedene Varianten auf Basis von Nehalem geplant. Dies umfasst im Desktop-Bereich zum einen die High-End-Prozessoren mit dem Codenamen „Bloomfield“, das obere Performance-Segment (Codename: „Lynnfield“) und einen auf den Codenamen „Havendale“ getauften Mid-Range-Prozessor. Im mobilen Bereich stellen „Clarksfield“ und „Auburndale“ das jeweilige Pendant zu „Lynnfield“ und „Havendale“ dar.
| Funktion | Beckton | Gainestown | Bloomfield | Lynnfield | Havendale | Clarksfield | Auburndale |
| CPU-Kerne | 8 | 4 | 4 | 4 | 2 | 4 | 2 |
| Threads | 16 | 8 | 8 | max. 8 | 4 | max. 8 | 4 |
| Multi-CPU | Ja / 8 CPU | Ja / 2 CPU | Nein | Nein | Nein | Nein | Nein |
| Shared-Cache | L2 = NA L3 = 24 MB | 8 MB | 8 MB | 8 MB | 4 MB | 8 MB | 4 MB |
| Speicher-Kanäle | 4x FB-DIMM2 | 3 x RDDR3 | 3 x DDR3 | 2 x DDR3 | 2 x DDR3 | 2 x DDR3 | 2 x DDR3 |
| Integrierte Grafik | Nein | Nein | Nein | Nein | Ja | Nein | Ja |
| PCI Express 2.0 | NA | 2x PCIe x16 / 4x PCIe x8 + 1x PCIe x4 über Tylersburg | 2x PCIe x16 / 4x PCIe x8 + 1x PCIe x4 über Tylersburg | 1x PCIe x16 / 2x PCIe x8 | 1x PCIe x16 | 1x PCIe x16 / 2x PCIe x8 | 1x PCIe x16 |
| QuickPath | Ja / 4 Links | Ja / 2 Links | Ja / 1 Link | Nein | Nein | Nein | Ja (nur MCP) |
| TDP | 130/105/90 Watt | 130/80/60 Watt | 130 Watt | 95 Watt | 75 Watt | 35/45 Watt | 45/55 Watt |
| Sockel | LGA-1567 | LGA-1366 | LGA-1366 | LGA-1160 | LGA-1160 | mPGA-989 | mPGA-989 |
| Launch | H2 2009 | Q4 2008 | Q4 2008 | Q1 2009 | Q2 2009 | H1 2009 | H1 2009 |
| Plattform | Boxboro + ICH10 | Tylersburg + ICH9 | Tylersburg-DT + ICH10 | Ibexpeak | Ibexpeak | Ibexpeak-m | Ibexpeak-m |
Bei den Servern gibt es zwei verschiedene Varianten. „Gainestown“ deckt den Bereich für Server mit zwei Prozessor-Sockeln ab, während Beckton in der Liga der großen Multi-Prozessor-Server mit bis zu acht Prozessoren in einem Verbund spielt. Bislang konnten die Xeon-MP-Prozessoren lediglich in einem Verbund von maximal vier CPUs zusammenarbeiten. Dank der QuickPath Interconnects konnte Intel auch hier die Zahl an maximalen Prozessoren verdoppeln, so dass Systeme mit wahnwitzigen 64 Prozessorkernen möglich sind. Eine Zahl, die so manches Unternehmen im Mittelstand in ihrem kompletten Rechenzentrum besitzt.
Bloomfield
Hinter „Bloomfield“ versteckt sich auf der Kings-Creek-Plattform das Flaggschiff der neuen Flotte. Zu den Key-Features gehören das native Quad-Core-Design, 8 MB shared Level-2-Cache, ein Triple-Channel DDR3-1600 Controller [1] mit einer theoretischen Maximalbandbreite von ca. 38,4 GB/s sowie Simultaneous Multi-Threading (SMT), womit insgesamt acht Threads gleichzeitig parallel bearbeitet werden können. Als Sockel kommt der neue Sockel LGA-1366 zum Einsatz. Die Thermal Design Power liegt wie bei der aktuellen High-End-Generation bei 130 Watt. Für die nötige Konnektivität nach Außen sorgt der Desktop-Ableger (DT) des eigentlich für Dual-Prozessor-Server entwickelten „Tylersburg“ Chipsatzes, der über ein QuickPath-Interface mit dem Prozessor verbunden wird. Damit verabschiedet man sich von dem alten Frontside-Bus-Konstrukt und setzt wie AMD auf ein serielles Punkt-zu-Punkt Interface für die Verbindung zwischen Prozessor und Chipsatz. „Bloomfield“ soll wie schon beim „Yorkfield“ der erste seiner Klasse werden und als Erster der drei im vierten Quartal dieses Jahres erscheinen.
Lynnfield
„Lynnfield“ stellt das mittlere Glied der Kette dar und verfügt über ähnliche Eigenschaften wie das Topmodell, besitzt mit dem Sockel LGA-1160 jedoch schon einen gravierenden Unterschied. Wie bei Bloomfield stehen vier Rechenkerne mit bis zu acht Threads und 8 MB Shared-Cache für die Verarbeitung zur Verfügung. Statt drei DDR3-Kanälen stehen dem „Lynnfield“-Prozessor nur zwei zur Verfügung. Die Thermal Design Power ist mit 95 Watt deutlich geringer beziffert, weshalb davon auszugehen ist, dass Intel auch bei der Taktfrequenz entsprechend niedriger agiert, da allein durch den wegfallenden Kanal bei der Speicheranbindung kaum eine so große Differenz gegenüber „Bloomfield“ zu erklären ist. Neben dem integrierten Speichercontroller ist zudem ein PCI-Express-2.0-Controller mit 16 Lanes mit an Bord, welche auch als 2x8 Aufteilung konfiguriert werden können. Als Chipsatz kommt ein neuer Chip unter dem Namen Ibexpeak zum Einsatz, welcher von dem bisherigen Intel-Design North- und Southbridge abweicht. Doch dazu später mehr.
Havendale
„Havendale“ stellt den vorerst kleinsten Ableger der Serie dar. Statt vier kommen hier nur noch zwei Rechenkerne mit jeweils zwei Threads zum Einsatz und auch der Cache ist mit vier Megabyte nur halb so groß. Die Speicheranbindung erfolgt wie bei „Lynnfield“ über einen integrierten Dual-Channel DDR3-Controller (IMC) und unterstützt maximal vier DIMMs. Anders als Lynnfield und Bloomfield wird Havendale jedoch als Multi-Chip-Prozessor ausgeführt, da sich neben dem integrierten Speichercontroller auch eine integrierte Grafikeinheit (ähnlich AMDs Fusion [2]) und ein PCI Express 2.0 Interface wiederfinden. Während der Prozessor für sich arbeitet, wurden Speichercontroller, GPU und PCI-Express-Controller kurzerhand auf ein eigenes Silizium verfrachtet. Die Verbindung der beiden Chips erfolgt über Intels QuickPath-Interconnect. Die Gründe dafür sind höchstwahrscheinlich in der einfacheren Fertigung der einzelnen Chips zu finden, um letzten Endes eine höhere Yield-Rate zu erzielen und somit auch den Ausschuss an defekten Chips zu minimieren.
Neben acht so genannten Fixed-Function-Units verfügt die integrierte Grafikeinheit zudem über zwölf programmierbare Ausführungseinheiten. Der ebenfalls integrierte PCI-Express-Controller bietet zudem die Möglichkeit eine Grafikkarte mehr oder weniger direkt an die CPU anzubinden. Trotz der zusätzlichen integrierten Grafik liegt die Thermal Design Power mit 75 Watt aufgrund der halbierten Kern-Anzahl nochmal deutlich unter den Quad-Cores, beträgt jedoch 10 Watt mehr gegenüber den heutigen Conroe/Wolfdale-Prozessoren, die jedoch weder über eine integrierte GPU, noch über einen integrierten Speicher- oder PCI-Express-Controller verfügen. Als Chipsatz kommt wie beim Lynnfield der Ibexpeak zur Geltung.
Gainestown (Nehalem-EP)
Als Nachfolger von „Clovertown“ und „Harpertown“ zielt der Xeon DP „Gainestown“ in den Markt der gehobenen Mittelklasse-Server mit maximal zwei Prozessoren pro System. Sein Funktionsumfang deckt sich mit dem des Desktop-Ablegers Bloomfield, verfügt jedoch für die direkte Verbindung zur zweiten CPU über einen zusätzlichen QuickPath-Interconnect und kann statt unbuffered DDR3-DIMMs nur registered DDR3-800/1066/1333 Module mit Fehlerkorrektur zur Verbesserung der Stabilität und Ausfallsicherheit ansprechen. Pro Speicher-Kanal können maximal zwei DIMMs eingesetzt werden, was bei einer Bestückung mit 4-GB-Riegeln einen Ausbau mit immerhin 48 Gigabyte ermöglicht.
Insgesamt gibt es mit 130, 80 und 60 Watt drei verschiedene „Thermal Design Power“-Klassen, wobei sich letztere wohl nur auf die Low-Voltage-Varianten beziehen dürfte. Bislang besitzen die Low-Voltage Quad-Core Xeon Prozessoren eine TDP von lediglich 50 Watt. Beim Gainestown musste Intel jedoch dem integrierten Speicher-Controller und den Erweiterungen in der Architektur Tribut zollen, weshalb die Gainestown-LV mit 60 Watt etwas mehr Leistungsaufnahme besitzen, die an anderer Stelle im Chipsatz jedoch wieder eingespart werden kann.
Als Plattform kommt eine Kombination aus der Northbridge „Tylersburg-24 oder -36D“ in Verbindung mit einer ICH9-Southbridge zum Einsatz. An dieser Stelle kommt somit ein Teil aus dem Desktop-Segment zum Einsatz, da die ICH9 auch zusammen mit der Bearlake-Chipsatz-Familie (P35, G35, X38 etc.) arbeitet. Dank der QuickPath-Technologie sind mit den „Tylersburg“-Chipsätzen und dem Gainestown-Prozessor verschiedene Kombinationen möglich. Als mögliche Kombinationen kommen unter anderem ein Zusammenspiel aus 2x Gainestown + 2x Tylersburg, 2x Gainestown + 1x Tylersburg oder sogar 1x Gainestown + 2x Tylersburg in Frage. Somit können Systeme mit bis zu 72 PCI-Express-Lanes aufgebaut werden, die wahlweise für Co-Prozessoren, Grafikkarten oder RAID-/LAN/InfiniBand- oder andere Controller genutzt werden können.
Beckton (Nehalem-EX)
Da Beckton Systeme mit mehr als vier Prozessoren unterstützt, besitzt er mit „Tigerton“ bzw. „Dunnington“ zwar direkte Vorgänger, liegt dank seiner gewaltigen Leistungsdaten jedoch noch ein ganzes Stückchen höher. Neben der maximalen Ausstattung mit bis zu acht Prozessoren wirken auch die bis zu 24 Megabyte Last-Level-Shared-Cache für einen x86-Prozessor geradezu gigantisch, besaßen die Computer vor etwas mehr als 10 Jahren diese Größe doch meistens noch als kompletten Hauptspeicher. Nicht zuletzt diese Massen an Cache und die acht Prozessorkerne treiben die Transistorzahl in Richtung zwei Milliarden.
Auf einem Beckton-Prozessor befinden sich neben vier Speicherkanälen für Fully-Buffered-DIMMs, die über einen Zusatz-Chip unter dem Codenamen „Millbrook“ an normalen DDR3-RAM angebunden werden, auch vier QuickPath-Interconnects, die zum einen für die Verbindung der CPUs untereinander zum anderen an den Chipsatz dienen. Als Nachfolger des aktuellen Clarksboro-Chipsatzes kommt bei Beckton ein Chipsatz unter dem Namen „Boxboro“ gepaart mit der ICH10-Southbridge zum Zuge. Boxboro stellt in erster Linie bis zu 36 PCI-Express-Lanes bereit. Ähnlich wie bei Gainestown und Tylersburg sind auch bei Beckton und Boxboro verschiedene Kombinationen möglich.
Im Mobile-Bereich nehmen die beiden Abkömmlinge „Clarksfield“ (Quad-Core) und „Auburndale“ (Dual-Core) das Zepter in die Hand. Aufgrund der neuen Features kommt mit Sockel 989 auch bei den Notebooks ein komplett neuer Steckplatz zum Einsatz, welcher gegenüber dem Vorgänger (Sockel 479) mehr als doppelt so viele Pins besitzt. Gegenüber den Desktop-Modellen liegt die Thermal Design Power mit 35/45 Watt für „Auburndale“ und 45/55 Watt für „Clarksfield“ jedoch deutlich niedriger. Auf den ersten Blick erscheinen die Werte im Vergleich zur aktuellen Generation (25/35 Watt) relativ hoch. Man darf jedoch nicht vergessen, dass auch bei den Mobile-Versionen der Speicher-Controller, PCI-Express (Clarksfield, Auburndale) bzw. zusätzlich die Grafikeinheit (Auburndale) in die CPU gewandert ist und somit die Last vom Chipsatz genommen wird. Als Chipsatz dient mit Ibexpeak-m eine etwas abgespeckte Version im Vergleich zum Desktop-Ableger, da 14 USB- oder sechs Serial-ATA Ports für Notebooks überdimensioniert wären. Start-Termin für die Mobile-Ableger zusammen mit dem Ibexpeak-m ist das erste Halbjahr 2009.
Unter dem Codenamen „Ibexpeak“ operiert Intel an einem Plattform Controller Hub der nächsten Generation, der die jahrelange Trennung in North- (MCH/IOH) und Southbridge (ICH) beendet und sämtliche Controller-Funktionen auf einem Chip zusammenbringt. Dazu gehören neben PCI (4 Master), PCI Express (8 Lanes), Serial-ATA (6 Ports), Audio, Gigabit Ethernet MAC und USB (14 Ports) auch grundlegende Ein- und Ausgabefunktionen sowie der SM-Bus, LPC und nicht zuletzt die Ansteuerung von Bildausgabe-Geräten über VGA oder HDMI/Display-Port.
Des Weiteren unterstützt Ibexpeak die Virtualisierung von Ein-/Ausgabe-Funktionen (VT-d) und besitzt ein integriertes TP-Modul (Trusted Plattform). Ebenfalls mit an Bord ist ein NAND-Flash-Controller, welcher die direkte Anbindung von NAND-Flashspeichern [3] erlaubt, die z.B. für Windows Vistas ReadyBoost-Funktionen genutzt werden können. Statt über zusätzliche Steckkarten sieht das Referenz-Design der Mainboards sogar eine Fläche für NAND-Speicherchips vor. Das Referenz-Design gibt zudem Aufschluss über die notwendige Spannungsversorgung. Wie heutzutage üblich erfolgt jene über einen 24-poligen Haupt-ATX-Anschluss mit einem zusätzlichen 4-poligen 12 Volt Stecker (P4-Stecker) für die direkte Versorgung der CPU.
Betrachtet man die Änderung insgesamt, kann der Sprung zwischen der aktuellen „Penryn“-Generation zu „Nehalem“ durchaus als einer der größten im Prozessor- und Plattform-Segment von Intel seit dem Pentium Pro oder dem Wechsel von Pentium 3 zu Pentium 4 gesehen werden. Zwar entspricht Nehalem in der internen Struktur nach wie vor einem normalen x86-Prozessor, jedoch trennt man sich nach langer Zeit von einigen Dingen, an denen man in den letzten Jahren festgehalten hat. Und dies, obwohl die Konkurrenz in Form von AMD bereits 2003 mit der Einführung des K8 insbesondere im Bereich der Speicheranbindung und Anbindung des Chipsatzes neue Wege gegangen ist und Intel so manche Kopfschmerzen bereitet haben dürfte. Gerade in Hinblick auf das Rambus-Desaster fiel der Schritt zu einem integrierten Speicher-Controller und die damit verbundene Fixierung auf einen Speicher-Standard sicherlich nicht leicht. Auch der Frontside-Bus stellte nicht zuletzt aus Lizenzgründen, die ohne Frage auch eine zusätzliche Einnahme-Quelle bedeuten, eine zusätzliche (finanzielle) Sicherheit im Chipsatz-Segment im Vergleich zur Konkurrenz dar.
Mit Nehalem verlagert Intel den Schwerpunkt klar in Richtung CPU und mindert die Bedeutung des Chipsatzes, indem man für die Performance essentiell wichtige Komponenten direkt in die CPU oder auf das Package integriert, um somit langsame Zugriffszeiten zu vermeiden. Dies hat nicht zuletzt bei speicherintensiven Anwendungen in jüngster Vergangenheit oft zu Engpässen geführt. Mit Simultaneous Multi-Threading (vormals Hyper-Threading) setzt man zudem auf einen aus Pentium 4/D Zeiten bekannten Weggefährten, welcher schon damals für eine teils deutlich bessere Auslastung der Ausführungseinheiten und damit erhöhte Leistung gesorgt hat. Während über die Architektur schon einiges bekannt ist, kann über die verfügbaren Taktraten bislang noch wild spekuliert werden. Vielerorts werden jene für die Top-Modelle mit bis zu 4,0 GHz postuliert, die angesichts der durchaus ansprechenden Ergebnisse von Intels High-k 45 nm-Prozess in nicht all zu weiter Ferne zu sein scheinen. Ebenso unklar sind bislang die endgültige Produkt-Bezeichnung sowie die zu erwartenden Preise. Es ist jedoch nur eine Frage der Zeit, bis diese Informationen ebenfalls veröffentlicht werden.