AMD Radeon: Vega-GPU mit neuen Shadern, höherer IPC und HBM2 3/3

Wolfgang Andermahr 473 Kommentare

New CU: Schneller, flexibler und besser ausgelastet

Mit Graphics Core Next hatte AMD im Jahr 2011 auch neue ALUs eingeführt, sie kommen noch heute in nur leicht veränderter Form zum Einsatz. Wie Mike Mentor, der Verantwortliche für die Entwicklung eben jener Compute Units, erklärt, sind die ALUs auf Vega massiv aufgebohrt worden. Wie genau, bleibt allerdings noch völlig im Unklaren. Kein Wunder, dürfte in diesen Anpassungen doch ein wesentlicher Erfolgsfaktor von Vega liegen.

Vega hat Next Compute Units

Vega mit neuer Compute Engine
Vega mit neuer Compute Engine (Bild: AMD)

AMD spricht auf Vega nicht mehr von CUs, sondern von NCUs – den Next Compute Units. Pro NCU kann Vega 128 FP32-Operationen, 256 FP16-Operationen und 512 INT8-Operationen pro Takt durchführen. Auch Double Precision wird unterstützt, wobei die Durchsatzrate „konfigurierbar“ ist. Es ist nicht davon auszugehen, dass die erste Vega-GPU mit voller FP64-Leistung im 2:1-Verhältnis arbeiten kann. Wie schnell die doppelte Genauigkeit maximal unterstützt wird, hat AMD noch nicht verraten.

Schon Tonga konnte FP16, um entsprechend ausgelegte Befehle sehr energieeffizient zu berechnen. Bei Vega ist das jetzt erstmals mit doppelter Geschwindigkeit gegenüber dem Standard FP32 möglich, ganz so wie auf der PlayStation 4 Pro. INT8-Operationen arbeiten mit vierfacher Geschwindigkeit. Damit ist Vega diesbezüglich identisch zum GP100 von Nvidia.

AMD ändert bei den NCUs vermutlich auch den Aufbau der Compute Units

Die von AMD angesprochenen 128 FP32-Operationen pro Takt pro NCU deuten auch darauf hin, dass AMD mehr ALUs in einer solchen Einheit vereint. Das entspräche der Konfiguration wie Nvidia Maxwell und Pascal (außer GP100).

Zu einer höheren Leistung der NCU pro Takt sollen aber auch andere Anpassungen sorgen. So wurde der Instruction Buffer vergrößert, sodass der Datendurchsatz unabhängig von der Art der Berechnung ansteigen soll. AMD spricht von einer doppelt so hohen IPC – was jedoch nur im Vergleich FP32 auf einer CU gegenüber FP16 auf einer NCU gilt und damit keine relevante Information beinhaltet. Die IPC-Steigerung bei reinen FP32-Operationen bleibt damit unklar.

„Signifikant höhere Taktraten möglich“

Die Architektur sowie der Prozess soll auf „signifikant höhere Taktraten“ ausgelegt sein. Was das heißt? AMD verrät es noch nicht. Wenn man aber den Gerüchten glaubt, dass das Vega-Flaggschiff erneut über 4.094 Shadereinheiten verfügt und wenn man bedenkt, dass der professionelle-Beschleuniger Instinct MI25 auf 12,5 TFLOPs FP32-Datendurchsatz zurückgreifen kann, würde der Takt auf der Karte bei 1.525 MHz liegen. Und Consumer-Grafikkarten takten oft höher als professionelle Varianten. Allerdings gilt die Frequenz eben nur, wenn Vega tatsächlich über 4.096 ALUs verfügt.

Unnötigen Rechenaufwand früher vermeiden

Als letzte große Neuerung nennt AMD die Pixel-Engine, die die fertig berechnete Geometrie mit Pixeln belegt. Sie wurde mit einem neuen Rasterizer ausgestattet, der auf die Bezeichnung Draw Stream Binning Rasterizer hört. Er soll schneller und energieeffizienter arbeiten und gleichzeitig den Speicherverbrauch reduzieren.

Möglich macht das ein integrierter Cache, der überlappende Dreiecke schneller erfasst und deren unsichtbaren Teile nicht mehr unnötiger Weise berechnet werden. Damit sollen auch Pixel, die im finalen Bild nicht sichtbar sind, deutlich schneller aus dem Rechenprozess entfernt werden.

Mehr Performance für Spiele mit Deferred Shading

Zusätzlich kommt Vega mit einer überarbeiteten Cache-Hierarchie daher. Die Render Backends sind erstmals direkt an den L2-Cache angeschlossen und können auf benötigte Daten entsprechend schneller zugreifen und der L1-Cache hat eine direkte Verbindung zum L2-Cache. Durch diese Maßnahmen sollen vor allem Spiele mit Deferred Shading deutlich beschleunigt werden.

Vega bringt viel neues mit unbekanntem Ergebnis

AMD hat sowohl mit dem eigenen Auftreten auf dem Tech Summit Anfang Dezember in den USA als auch mit den präsentierten Einblicken in die Technik erfolgreich den Eindruck erweckt, Vega gegenüber Graphics Core Next aus dem Jahr 2011 signifikant weiterentwickelt zu haben. Ein großer Sprung in der Leistungsfähigkeit erscheint zweifelsohne möglich zu sein.

AMD Vega GPU-Architektur
AMD Vega GPU-Architektur

Den großen Sprung braucht es allerdings auch, um im High-End-Segment wieder mit Nvidia konkurrieren zu können. Auch Polaris war schlussendlich nicht mehr als ein großer, wenn auch recht effektiver Flicken auf die Schwachstellen von Graphics Core Next im unteren und mittleren Leistungssegment.

Es fehlt die Praxis

Auch mit diesem Tag bleibt weiterhin offen, ob der Sprung in der Praxis gelingt. Bis auf die von AMD gewährten technischen Einblicke und ein auf der CES 2017 abermals ausgestelltes Demo-System mit hohen Frameraten in Star Wars: Battlefront in Ultra HD bei maximalen Details gibt es nur einen neuen vagen Anhaltspunkte: Ein Video von Doom in Ultra HD auf Vega. Aber auch hier bleiben die genauen Hintergründe für eine fundierte Analyse unbekannt, weshalb ComputerBase auf diesen Informationen keine Vergleiche zu anderen Produkten zieht.

Wann sich Vega wirklich in der Praxis beweisen können wird? AMD spricht weiterhin wenig spezifisch von „im ersten Halbjahr“.

Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung in Form deaktivierter Werbeblocker oder eines Abonnements von ComputerBase Pro. Mehr zum Thema Anzeigen auf ComputerBase.