Folien präzisieren Konzept hinter Intels „Knights Landing“

Michael Günsch
19 Kommentare

Im Rahmen der SC13 kamen weitere Informationen zur neuen Xeon-Phi-Generation von Intel ans Licht. Neue Folien zeigen das Konzept hinter „Knights Landing“ (KNL) nun im Detail und bestätigen die bisher inoffiziell gehandelten Spezifikationen der erstmals auch als eigenständige CPUs erscheinenden HPC-Beschleuniger.

Bis zu 72 Kerne soll „Knights Landing“ bieten, wobei die von den aktuellen „Bay Trail“-Prozessoren bekannte „Silvermont“-Architektur als Basis dient. Pro Kern können dank Hyper-Threading vier Threads bearbeitet werden. Jedem Kern stehen zwei 512-Bit-Vektoreinheiten (VPUs) zur Seite, die den AVX-512-Befehlssatz unterstützen. Die mit „Haswell“ eingeführten TSX werden laut den von VR-Zone veröffentlichten Informationen hingegen nicht unterstützt. Für die externe Kommunikation stehen 36 PCI-Express-Lanes der Generation 3.0 zur Verfügung. Mit einer angepeilten TDP von 200 Watt soll sich KNL auch dank der 14-nm-Fertigung sparsamer als die Vorgänger erweisen.

Knights Landing: Prozessor-Architektur
Knights Landing: Prozessor-Architektur (Bild: vr-zone.com)

Bei der Speicheranbindung geht Intel einen völlig neuen Weg: Während der Vorgänger („Knights Corner“) mit bis zu 16 Gigabyte GDDR5-Speicher auf der PCIe-Steckkarte daherkommt, der über ein 512 Bit breites Speicherinterface angebunden ist und eine Speicherbandbreite von maximal 352 GByte/s bietet, verzichtet Intel künftig gänzlich auf den vornehmlich für Grafikkarten entwickelten Speichertyp. Stattdessen werden auf dem CPU-Package, direkt neben dem KNL-Die, acht bis 16 Gigabyte MCDRAM verbaut, der eine dauerhafte Bandbreite von 500 GByte/s und darüber hinaus geringere Latenzen als herkömmlicher Grafikspeicher ermöglichen soll. Darüber hinaus können über den integrierten Sechs-Kanal-Speichercontroller bis zu 384 Gigabyte DDR4-2400-RAM pro CPU-Sockel angebunden werden. Der maximale Speicherausbau bleibt aber offenbar der KNL-Variante als eigenständiger Host-Prozessor vorbehalten, in der Ausführung als Co-Prozessor auf einer PCI-Express-Erweiterungskarte sollen laut VR-Zone lediglich zwei der sechs DDR4-Kanäle aktiv sein, wodurch maximal 64 Gigabyte RAM möglich wären, was gegenüber den maximal 16 Gigabyte (GDDR5) des Vorgängers, dennoch eine deutliche Verbesserung darstellt.

Knights Landing: On-Package-Speicher
Knights Landing: On-Package-Speicher (Bild: vr-zone.com)

Der auch als On-Package-Speicher bezeichnete MCDRAM soll sich zudem je nach Präferenz der Software-Entwickler unterschiedlich nutzen lassen, um die bestmögliche Leistung für die jeweilige Anwendung zu ermöglichen. So gibt es ein „Cache-Modell“ bei welchem der MCDRAM als „L3“-Cache, also als Zwischenspeicher zwischen CPU und externem DDR4-RAM betrachtet und von der Hardware automatisch verwaltet wird. Das „Flat-Modell“ lässt hingegen eine manuelle, anwendungsgesteuerte Verwaltung des On-Package- und des externen RAM zu. Beide Vorgehensweisen vereint wiederum das „Hybrid-Modell“, bei welchem der MCDRAM in Segmente unterteilt wird. So könnten beispielsweise lediglich 4 Gigabyte als virtueller L3-Cache dienen, während der Rest als Teil des Arbeitsspeichers betrachtet wird.

Die bereits im Raum stehenden groben Angaben zur Rechenleistung von „Knights Landing“ werden erneut aufgegriffen: Bei doppelt-genauen (DP = Double Precision) Gleitkommaberechnungen (FLOPS) soll KNL mindestens 3 Teraflops erzielen; bei einfacher Genauigkeit (SP = Single Precision) seien 6 Teraflops möglich. Die Leistung von „Knights Corner“ würde damit mehr als verdoppelt, bringt es das aktuelle Flaggschiff Xeon Phi 7100 doch auf maximal 1,2 (DP) beziehungsweise 2,4 (SP) TFLOPS. Auf einer Folie ist sogar von mehr als verdreifachten FLOPS die Rede (siehe unten). Auch AMDs Dual-GPU-Karte FirePro S10000 oder Nvidias Tesla K40 mit „Kepler“ im Maximalausbau liegen bei doppelter Genauigkeit mit 1,48 und 1,43 TFLOPS weit dahinter. Lediglich der SP-Wert von 5,91 TFLOPS bei AMDs HPC-Flaggschiff könnte somit annähernd mithalten, doch im produktiven Einsatz in Hochleistungsrechnern spielt die doppelte Genauigkeit oft eine größere Rolle.

Knights Landing als nächster Schritt zum Exascale-Computing
Knights Landing als nächster Schritt zum Exascale-Computing (Bild: vr-zone.com)
Knights Landing mit integriertem Fabric
Knights Landing mit integriertem Fabric (Bild: vr-zone.com)

„Knights Landing“ wird voraussichtlich Mitte 2015 als „Standalone CPU“ auf den Markt kommen. Ein Quartal später soll zudem eine weitere Variante auf dessen Basis folgen. KNL-F nennt sich diese, ein „KNL-Prozessor mit integriertem Fabric“. Auf dem Package befinden sich zwei Host-Fabric-Interface-Ports („Storm Lake“). Als PCI-Express-Karte soll KNL wiederum erst Ende 2015 erscheinen, soweit die Informationen von VR-Zone.