NEC SX-9 – Angriff auf die Top 500?

Thomas Hübner
38 Kommentare

Abseits der Mainstream-Prozessoren von Intel oder AMD, die um einen Platz im heimischen PC kämpfen, gibt es einen stetig steigenden Bedarf an Rechenkapazitäten von Supercomputern, der nicht selten von komplett anderen Prozessorarchitekturen abgedeckt wird. NEC greift mit seinem neuen Vektorprozessor SX-9 nun nach der Krone.

Die Liste der 500 weltweit schnellsten Supercomputer wird aktuell vom IBM BlueGene/L angeführt. Dieses System basiert auf insgesamt 131.072 Prozessoren vom Typ IBM PowerPC 404. Diese erreichen eine Gesamtrechenleistung von 280 Teraflops – 280 Billionen Gleitkomma Rechenoperationen doppelter Genauigkeit (64 Bit) pro Sekunde. Das theoretische Performance-Maximum liegt laut IBM bei 367 Teraflops.

Das derzeit schnellste System aus Deutschland steht im Leibniz Rechenzentrum in Garching bei München. Es belegt mit 9.728 Intel-Itanium-Prozessoren bei einer Performance von 56,5 Teraflops Platz 10 der Liste. Zum Vergleich: Ein 3 GHz schneller Intel Core 2 Extreme QX6850 (Kentsfield, Quad-Core) erreicht eine theoretische Leistung von 48 Gigaflops (Double Precision, Add und Mul).

NECs neuester Sprössling ist der Ur-Ur-Enkel des im legendären Earth Simulator eingesetzten Vektorprozessors SX-6. Dieser Supercomputer ging 2002 in Japan ans Netz und war in der damaligen Top-500-Liste fünf mal schneller als der Zweitplatzierte und bot eine höhere Rechenleistung als die Plätze 3 bis 12 zusammen. Seine 35,8 Teraflops (40,9 TFLOPS Peak) hat er mit nur 5.120 Prozessoren erreicht.

Der von NEC neu vorgestellte Vektorprozessor SX-9 könnte diese Leistungswerte wohl mit weniger als 400 Chips erzielen. Insgesamt ist der SX-9 für Systeme mit bis zu 8.192 Prozessoren und einer Gesamtleistung von 839 Teraflops ausgelegt – doppelt so schnell wie das aktuell schnellste System der Top 500 oder die kombinierte Leistung von Platz 3 bis 14. Das erinnert an die Zeiten des Earth Simulators, der von Juni 2002 bis Juni 2004 die Liste anführte.

NEC SX-9 und SX-8R im Vergleich
NEC SX-9 und SX-8R im Vergleich

Der SX-9 wird in 65 nm gefertigt und weist einen Stromverbrauch auf, der 50 Prozent unter dem des Vorgängers liegt. Er taktet mit 3,2 GHz und kann im Vergleich zum SX-8R auf jeweils zwei unabhängige Additions- und Multiplikationseinheiten zurückgreifen, die acht 64-Bit-Rechenoperationen (512 Bit) pro Takt durchführen können. Der SX-9 verfügt über ein 256 GB/s schnelles Speicherinterface und bietet damit ein Byte/Flop-Verhältnis von über 2. Damit kommen pro Takt genügend Informationen in die CPU (im Gegensatz zu einem QX6850, bei dem das Verhältnis mit 0,2 nicht so rosig ist).

NEC SX9 Single Node
NEC SX9 Single Node

NECs neuer Prozessor wird pro Knoten angeboten (siehe Bild). Jeder Knoten besteht aus insgesamt 16 Prozessoren mit einer Top-Leistung von 1,6 Teraflops, einer Speicherbandbreite von 4 TB/s, einem maximalen Speicherausbau von 1 Terabyte und einem Flächenbedarf von 2 m² (Vorgänger 8 m²). Im Maximum können 512 Knoten mit einer Geschwindigkeit von 2 x 128 GB/s pro Node miteinander verbunden werden. Der Mietpreis pro Knoten beginnt bei 20.000 Euro pro Monat. Über eine Laufzeit von drei Jahren kostet ein minimal konfiguriertes System etwa 700.000 Euro.

Der Hersteller erwartet die ersten Installationen ab Sommer 2008 fertig zu stellen. Zu den ersten Kunden in Europa, die SX-9-Systeme geordert haben, zählen der Deutsche Wetterdienst und sein französisches Pendant Météo France. Weitere Eckdaten zum SX-9 sind bei NEC zu finden. Einen Überblick über die SX-Familie gibt die folgende Tabelle in Anlehnung an „Computer Architecture – A Quantitative Approach, Hennessy, Patterson“.

Modell
(Jahr)
Takt
(MHz)
Vector
Registers
Elemente
pro
Register
(64-Bit)
Vektor-
einheiten
Vektoreinheiten
(Detail)
Lanes Peak-
Leistung
(GFLOPS)
NEC SX-2 (1985) 167 8 + 32 256 4 FP multiply/divide, FP add,
integer add/ logical, shift
4 1,3
NEC SX-5 (1998) 312 8 + 64 512 4 FP or integer
add/shift, multiply,
divide, logical
16 10,0
NEC SX-6 (2001) 500 8 + 64 256 4 FP or integer
add/shift, multiply,
divide, logical
8 8,0
NEC SX-8 (2004) 2000 8 + 64 256 4 FP or integer
add/shift, multiply,
divide, logical
4 16,0
NEC SX-8R (2006) 2200 8 + 64 256 4 FP or integer
add/shift, add/divide/sqrt,
multiply, multiply/logical
4 35,2
NEC SX-9 (2007) 3200 8 + 64 256 6 FP or integer
2x add/shift, 2x multiply,
divide/sqrt, logical
8 102,4

Bis 2011 plant Japan in Zusammenarbeit mit Fujitsu, Hitachi und NEC ein 10-Petaflop-System (10.000 Teraflop) auf die Beine zu stellen. Die USA planen für den selben Zeitraum Blue Waters, ein Peta-Scale-Supercomputer, der von IBM aufgebaut werden soll.

NEC SX9  Multi-Knoten-System
NEC SX9 Multi-Knoten-System