Intel Polaris: 80 Kerne, 1 Teraflop bei 62 Watt

Frank Hüber
91 Kommentare

Intels Forschungsabteilung hat mit dem Ziel die Rechenleistung eines Supercomputers auf einen Chip zu packen einen Prozessor mit insgesamt 80 Rechenkernen mit dem Codenamen Polaris entwickelt. Er erreicht eine Rechenleistung von einer Billion Fließkommaoperationen pro Sekunde (Teraflops).

Der 100 Mio. Transistoren starke und 275mm² große Chip verbraucht mit 62 Watt weniger Energie als die meisten heute erhältlichen Prozessoren für Desktop PCs. Bei 3,16 GHz und 0,95 Volt erreicht er so eine Leistung von 1,01 Teraflops. Bei 5,7 GHz erzielt Intel eine Leistung von 1,81 Teraflops, wobei allerdings auch die Leistungsaufnahme auf 265 Watt (bei 1,35 Volt) steigt. Dieser neue Chip ist das Ergebnis der Forschungen im Bereich des Tera-Scale-Computing, die bereits im Rahmen des Intel Developer Forum Fall 2006 – zusammen mit dem 80-Kern-Prototypen – demonstriert wurden. Die technischen Einzelheiten des Chips wird Intel diese Woche auf der Integrated Solid State Circuits Conference (ISSCC) in San Francisco vorstellen.

Der neu entwickelte Chip ist für reine Gleitkommaoperationen entworfen worden und zunächst ein reines Forschungsprojekt, das Intel in dieser Form nicht auf den Markt bringen wird. Die Entwicklungsarbeiten im Teraflops-Bereich spielen jedoch eine wichtige Rolle bei der Erforschung neuer Funktionen von Prozessoren und Rechenkernen. So geben sie beispielsweise Aufschluss darüber, welche Verbindungen von Chip zu Chip und von den Chips zum Computer für einen optimalen Datentransport notwendig sind. Auch die Software für Teraflops-Chips muss vollkommen neu entworfen werden, um die Leistung der zahlreichen Rechenkerne optimal auszunutzen. Das vorgestellte Teraflops-Projekt gab insbesondere Einblicke in neue Silizium-Technologien, Chip-Interconnects mit hoher Bandbreite sowie das Energiemanagement.

Um bei hoher Leistung niedrigen Stromverbrauch zu realisieren verfügt der Chip über ein Design aus einer Vielzahl einzelner, 3 mm² großer Einheiten („Tiles“) die als 8x10-Matrix angeordnet sind. Die kleineren Cores werden hierbei als Tiles auf dem Chip repliziert – das vereinfacht es, einen Prozessor mit vielen Rechenkernen zu entwerfen. Der Teraflops-Chip verfügt über eine vermaschte Architektur, die ein Netzwerk auf dem Chip bildet. Diese Architektur ermöglicht zwischen den Cores eine Kommunikation mit Terabit-Geschwindigkeit. Darüber hinaus wurden auch Methoden erforscht, die Cores voneinander unabhängig ein- und auszuschalten. Dadurch werden nur die Kerne benutzt, die tatsächlich zur Erledigung einer bestimmten Aufgabe gebraucht werden.

Intel Teraflops Research Chip - Router-System
Intel Teraflops Research Chip - Router-System

Die weiteren Tera-Scale Forschungen werden sich auf dreidimensional auf den Chip gepackte Speicherbausteine konzentrieren, die als Möglichkeit gesehen wird, den Prozessor in ausreichender Geschwindigkeit mit Daten zu versorgen. Außerdem sollen künftige Prototypen über Rechenkerne verfügen, die auf der Intel-Architektur basieren. Damit werden sie dann vielseitiger einsetzbar sein. Das Intel Tera-Scale Computing Research Program betreibt derzeit mehr als 100 Forschungsprojekte, die neue Erkenntnisse zu Architektur-, Software- und Designfragen liefern sollen.

Teraflops-Rechenleistung wurde zum ersten Mal 1996 erreicht. Der ASCI Red Supercomputer wurde von Intel für das Sandia National Laboratory des US-Energieministeriums entwickelt. Der Rechner nahm eine Fläche von circa 185 Quadratmetern ein, verfügte über nahezu 10.000 Intel Pentium Pro Prozessoren mit 200 MHz und besaß eine Leistungaufnahme von über 500 Kilowatt. Weitere 500 Kilowatt wurden zudem allein für die Kühlung des Raumes, in dem sich der Supercomputer befand, benötigt.

25 Jahre ComputerBase!
Im Podcast erinnern sich Frank, Steffen und Jan daran, wie im Jahr 1999 alles begann.