Intel Nehalem: Performance durchgesickert

Thomas Hübner
76 Kommentare

Das war ganz sicher nicht gewollt: Im Rahmen einer Präsentation haben Sun und Intel erste Performance-Daten über Nehalem-EP bekannt gegeben, die beeindrucken. Nehalem-EP steht dabei für „Efficient Performance“ und ist die neue Bezeichnung der 2-Wege-Xeon-Plattform, die früher den Zusatz „DP“ (für Dual Prozessor) hatte.

Der echte Codename des Nehalem-EP ist „Gainestown“, wie unser Überblick über die Nehalem-Prozessorarchitektur zeigt. Die folgenden Benchmarks basieren auf 2-Sockel-Systemkonfigurationen. Folgende Systeme werden miteinander verglichen:

  • Intel Xeon 5160, 3,0 GHz, Dual-Core (Woodcrest)
  • Intel Xeon 5365, 3,0 GHz, Quad-Core (Clovertown)
  • Intel Xeon X5482, 3,2 GHz, Quad-Core (Harpertown)
  • Intel Xeon ?, ?, Quad-Core (Gainestown)
  • AMD Opteron 2220, 2,8 GHz, Dual-Core (Santa Rosa)
  • AMD Opteron 2222, 3,0 GHz, Dual-Core (Santa Rosa)
  • AMD Opteron 23xx, 2,3 GHz, Quad-Core (Barcelona)
  • AMD Opteron 2???, 2,8 GHz, Quad-Core (Shanghai)

In Sachen Benchmarks macht Sun keine halben Sachen. So sind nicht nur Performance-Daten von Nehalem ausgeplaudert worden – auch über AMDs nächsten Quad-Core-Prozessor, dem in 45 nm gefertigtem Shanghai, hat man etwas zu erzählen. Dieser soll allem Anschein nach noch in diesem Jahr mit einem Prozessortakt von 2,8 GHz erscheinen. Über den Takt des Ende 2008 erscheinenden Nehalem EP macht Sun keine Angaben.

Nehalem Performance
Nehalem Performance

Als Benchmarks kommt die industrieweit anerkannte Suite rund um SPEC CPU 2006 zum Einsatz. Wie man bereits an den Graphen unschwer erkennen kann, scheinen der in den Prozessor integrierte Triple-Channel-Speichercontroller, das QuickPath-Prozessorinterface (QPI), das zurückgekehrte HyperThreading und die Architekturverbesserungen wahre Wunder bewirkt zu haben. So hat sich die Integer-Leistung im Vergleich zu Woodcrest um den Faktor 2,8 gesteigert. Beim eher speicherlimitierten Test mit Gleitkomma-Daten (Floating Point) fällt die Leistungssteigerung mit Faktor 3,8 sogar noch stärker aus – selbst im Vergleich zum Xeon 5482 ist der im Vergleich genutzte Nehalem doppelt so schnell. In der Vergangenheit hatte AMD mit seinem Opteron in diesem Bereich immer die Nase vorn.

Auch AMD hat an der Mikroarchitektur seiner Chips gearbeitet: Die Leistungssteigerung von Shanghai gegenüber Barcelona fällt stärker aus, als durch die Taktsteigerung zu erwarten wäre. In der Grafik von Sun taktet Shanghai ca. 22 Prozent schneller als sein Vorgänger. Die Leistungssteigerungen liegen bei 33 (Integer) bis 60 Prozent (Floating Point) – nicht schlecht, aber für Nehalem offenbar nicht genug. (Bei den Werten von Barcelona ist nicht klar, ob diese mit oder ohne TLB-Patch ermittelt wurden.)

Nutzt man die relativen Werte aus dem Diagramm und setzt diese ins richtige Verhältnis zu den auf Spec.org veröffentlichten Performance-Zahlen für 2-Wege-Systeme mit Xeon 5160, 5365, X5482 sowie Opteron 2220 und 2222, ergeben sich die folgenden geschätzten Absolutwerte, für die es natürlich keine Gewähr gibt:

CPUfp_rate_base2006
    • 2x Intel Gainestown, ??? GHz, 8 Kerne (16 Threads)
      163,0
    • 2x AMD Shanghai, 2,8 GHz, 8 Kerne
      121,0
    • 2x Intel Xeon X5482, 3,2 GHz, 8 Kerne
      80,0
    • 2x AMD Barcelona, 2,3 GHz, 8 Kerne
      77,0
    • 2x Intel Xeon X5365, 3,0 GHz, 8 Kerne
      62,0
    • 2x AMD Opteron 2222, 3,0 GHz, 4 Kerne
      51,0
    • 2x AMD Opteron 2220, 2,8 GHz, 4 Kerne
      50,0
    • 2x Intel Xeon E5160, 3,0 GHz, 4 Kerne
      45,1
Einheit: Punkte
CPUint_rate_base2006
    • 2x Intel Gainestown, ??? GHz, 8 Kerne (16 Threads)
      176,0
    • 2x AMD Shanghai, 2,8 GHz, 8 Kerne
      123,0
    • 2x Intel Xeon X5482, 3,2 GHz, 8 Kerne
      122,0
    • 2x Intel Xeon X5365, 3,0 GHz, 8 Kerne
      99,0
    • 2x AMD Barcelona, 2,3 GHz, 8 Kerne
      91,0
    • 2x Intel Xeon E5160, 3,0 GHz, 4 Kerne
      60,8
    • 2x AMD Opteron 2222, 3,0 GHz, 4 Kerne
      53,0
    • 2x AMD Opteron 2220, 2,8 GHz, 4 Kerne
      51,0
Einheit: Punkte