RDNA 2 vs. RDNA vs. GCN im Test: IPC und CU-Skalierung bei Radeon RX seit GCN analysiert

Wolfgang Andermahr
185 Kommentare
RDNA 2 vs. RDNA vs. GCN im Test: IPC und CU-Skalierung bei Radeon RX seit GCN analysiert

Wie stark profitieren die RDNA-2-Grafikkarten RX 6900 XT und 6800 (XT) von zusätzlichen Shadern-Clustern gegenüber der Radeon RX 6700 XT mit 40 CUs? Und wie viel schneller sind 40 RDNA-2-CUs als 40 von RDNA oder GCN? Umfangreiche Skalierungs- und IPC-Vergleiche liefern interessante, ja teilweise sogar überraschende Antworten.

Navi 22 ermöglicht den Drei-Generationen-Vergleich

Mit der Navi-22-GPU der Radeon RX 6700 XT (Test) hat es AMDs RDNA-2-Architektur in dieser Woche auch ins Performance-Segment geschafft. Die kleinere GPU mit 40 CUs macht einige interessante Tests und Vergleiche möglich, die bis jetzt nur schwer durchzuführen gewesen sind.

So erlaubt die Konfiguration der Navi-22-GPU mit 40 CUs zum Beispiel die Messung des Leistungsunterschiedes zwischen RDNA auf Navi 10 (Radeon RX 5700 XT) und RDNA 2 (Radeon RX 6700 XT). Darüber hinaus lässt sich noch besser untersuchen, wie gut die neue GPU-Architektur mit den vielen Compute-Units auf der Radeon RX 6800 XT (72 CUs) und der RX 6900 XT (80 CUs) überhaupt skaliert. Und weil schon die Hawaii-GPU der Radeon R9 390 auf Basis von GCN 40 CUs bot, ist sogar ein Drei-Generationen-Vergleich möglich.

Dieser Artikel geht also ins Detail. Wer sich dagegen mehr für die Grafikkarten an sich interessiert, sollte den Grafikkarten-Tests auf ComputerBase einen Besuch abstatten, die sich großflächig mit allen aktuellen und auch älteren Produkten beschäftigen.

AMD RDNA 2 vs. RDNA: Sind die CUs schneller geworden?

RDNA 2 enthält viele Verbesserungen gegenüber RDNA, nur so wurde die verdoppelte Performance möglich. An den Compute-Units („Shadern“) selbst liegt das aber nur bedingt. Denn die sind laut AMD lediglich indirekt schneller geworden, weil sie beispielsweise mit geringerer Latenz mit Daten aus dem „Infinity Cache“ versorgt werden.

AMD RDNA 2 (Navi 21), RDNA (Navi 10) und GCN (Hawaii) mit 40 CU im Vergleich
AMD RDNA 2 (Navi 21), RDNA (Navi 10) und GCN (Hawaii) mit 40 CU im Vergleich

Mit den bisher vorgestellten RDNA-2-Grafikkarten beziehungsweise der Navi-21-GPU hat sich das aber nicht direkt überprüfen lassen, denn die neue Generation bot mindestens 60, die alte nur 40 CUs. Mit der Radeon RX 6700 XT hat sich dies nun aber geändert: Navi 22 (RDNA 2) verfügt über 40 Compute-Units mit insgesamt 2.560 Shader-Einheiten – also genau wie Navi 10 (RDNA). Bei gleichem Takt gibt es mit beiden GPUs damit auch dieselbe theoretische Rechenleistung, sodass RDNA 2 sehr präzise mit RDNA verglichen werden kann.

Natürlich gibt es durchaus ein paar weitere Unterschiede zwischen den Architekturen und ein für den direkten Vergleich stark angepasster Takt hat möglicherweise auch zur Folge, dass die interne Abstimmung der GPU-Komponenten nicht mehr perfekt funktioniert. So genau wie in diesem Artikel gelang der Vergleich aber noch nie – und präziser dürfte er außerhalb der Labore bei AMD auch nicht werden.

Was neben der GPU nicht ganz passt: Navi 10 hat ein 256-Bit-Interface, Navi 22 aber ein 192-Bit-Interface mit „Infinity Cache“.

So werden Radeon R9 390, RX 5700 XT und RX 6700 XT getestet
Radeon R9 390 Radeon RX 5700 XT Radeon RX 6700 XT
GPU / Architektur Hawaii
GCN Gen 2
Navi 10
RDNA
Navi 22
RDNA 2
Shader-Einheiten 2.560
GPU-Takt 1.000 MHz
Theoretische Rechenleistung 5,1 TFLOPS
Speichergröße 8 GB 12 GB
Speicherinterface 512 Bit 256 Bit 192 Bit
Speichertakt 3.000 MHz 7.000 MHz 8.000 MHz
Speicherbandbreite 384 GB/s 448 GB/s 384 GB/s
Infinity Cache Nein Ja (1,5 TB/s)
AMD SAM / Resizable BAR Deaktiviert

GCN mischt auch noch mit

Die Testreihe kann aber noch ein wenig interessanter gestaltet werden, da die alte Hawaii-GPU in Form der Radeon R9 390 ebenfalls über 40 Compute-Units verfügt. Und damit ist es dann auch möglich, die zweite GCN-Iteration mit in den Vergleich aufzunehmen. Diese hat zudem die identische Speicherbandbreite wie die Radeon RX 6700 XT, wenngleich natürlich keinen „Infinity Cache“. Bei der Speicherbandbreite ist Graphics Core Next bei diesem Vergleich also etwas im Nachteil, doch letztendlich ist der Cache der RDNA-2-GPUs ja auch ein Vorteil der Architektur.

Weil Hawaii keine hohen Taktraten zulässt, mussten die RDNA-Grafikkarten für den Vergleich massiv im Takt reduziert werden: 1.000 MHz sind der gemeinsame Nenner.

Die gute Nachricht ist allerdings, dass auf den RDNA-GPUs (Navi 22 mit RDNA 2 kommt von 2,5 GHz und mehr) die Telemetrie nicht durcheinandergebracht wird, sodass auch die Frametimes immer noch korrekt dargestellt werden. Zudem lässt sich durch den reduzierten GPU-Takt eigentlich ausschließen, dass die höhere Bandbreite von Navi 10 in irgendeiner Form noch eine Rolle spielt. Denn durch den quasi halbierten GPU-Takt wird auch weniger Bandbreite benötigt, um die Einheiten maximal auszulasten. Die Benchmarks werden in 1.920 × 1.080 bei maximalen Grafikdetails erstellt.

GCN vs. RDNA vs. RDNA 2: Benchmarks in Full HD

RDNA macht gegenüber GCN einen gewaltigen Leistungssprung pro Compute-Unit, was aufgrund des Alters der Basis-Architektur (2011) aber nicht verwunderlich ist. Es gibt zwar noch etwas schnellere GCN-Ableger als die hier eingesetzte zweite Generation (die 4. Generation „Polaris“ war am schnellsten, „Vega“ ist langsamer), groß ist der Unterschied aber ohnehin nicht.

Und so ist RDNA bei gleicher Rechenleistung im Durchschnitt satte 41 Prozent bei den Durchschnitts-FPS und 43 Prozent bei den Perzentil-FPS schneller als GCN. In den einzelnen Spielen variieren die Unterschiede allerdings deutlich. Assassin's Creed Valhalla scheint GCN zum Beispiel zu mögen, dort ist RDNA „nur“ 27 Prozent performanter. Andersherum verhält sich dagegen Horizon Zero Dawn, wo RDNA gleich um 50 Prozent vorne liegt, während es in Cyberpunk 2077 sowie Doom Eternal 49 Prozent und in Dirt 5, Serious Sam 4 und Watch Dogs: Legion 48 Prozent sind.

RDNA 2 taktet deutlich höher als RDNA und erzielt daraus einen nicht unbedeutenden Teil seiner Mehrleistung. Um die höheren Frequenzen zu erreichen, wurden unter anderem die Pipelines innerhalb der ALUs verlängert, was die Latenzen erhöht und so trotz eigentlich gleicher Fähigkeiten bei Latenz-sensitiven Berechnungen die Rechenleistung pro CU bei RDNA 2 gegenüber RDNA verringert.

RDNA 2 ist etwas langsamer geworden

Das sieht man in den Tests. So ist RDNA 2 im Durchschnitt um 4 und 5 Prozent langsamer als RDNA bei gleicher Rechenleistung. Zugleich zeigt dies aber auch, dass die längeren Pipelines bei RDNA 2 eine gute Entscheidung gewesen sind. Denn dieser 4 Prozent verringerten Rechenleistung stehen in der Praxis bei Navi 21 (RX 6800 XT) ein rund 24 Prozent und bei Navi 22 (RX 6700 XT) ein etwa 40 Prozent höherer Takt entgegen – ein guter Tausch: IPC gegen Frequenz.

In den einzelnen Spielen ist RDNA 2 im schlimmsten Fall dann auch mal 9 bis 11 Prozent langsamer, wie Horizon Zero Dawn zeigt. Genauso gibt es aber auch Spiele wie Cyberpunk 2077, wo RDNA 2 absolut gleich schnell wie RDNA arbeitet – offenbar spielen die höheren Latenzen dort keine Rolle. Und in Borderlands 3 ist gar RDNA 2 4 und 5 Prozent schneller, in Control sind es 4 und 7 Prozent. Dort hilft vielleicht der „Infinity Cache“, was aufgrund der händisch massiv reduzierten Rechenleistung und damit auch der geringeren Bandbreitenanforderungen aber unwahrscheinlich erscheint. Vermutlich sind hier schlicht einige der anderen Verbesserungen von RDNA 2 die Ursache.

RDNA vs. RDNA 2 in WQHD

Eine Compute-Unit bei RDNA ist in Spielen also schneller als eine CU von RDNA 2, wenn der Einfluss der Speicherbandbreite möglichst reduziert wird. Damit nimmt man RDNA 2 aber eine seiner größten Stärken: Die eben massiv erhöhte Bandbreite durch den „Infinity Cache“. Geht das Duell also immer noch gleich aus, wenn der Einfluss der Bandbreite erhöht wird?

Gänzlich fair kann der Vergleich nicht gestaltet werden, RDNA 2 bleibt im Nachteil, denn RDNA lässt sich nun mal nicht so hoch takten. In der folgenden Testreihe agiert die Radeon RX 5700 XT mit 2.000 MHz und damit ziemlich nahe am maximal Möglichen von Navi 10. Die Rechenleistung wurde also gegenüber der vorherigen Testreihe verdoppelt, die Shader-Einheiten müssen entsprechend schneller mit Daten versorgt werden.

So werden Radeon RX 5700 XT und RX 6700 XT getestet
Radeon RX 5700 XT Radeon RX 6700 XT
GPU / Architektur Navi 10
RDNA
Navi 22
RDNA 2
Shader-Einheiten 2.560 (40 CUs)
GPU-Takt 2.000 MHz
Theoretische Rechenleistung 10,2 TFLOPS
Speichergröße 8 GB 12 GB
Speicherinterface 256 Bit 192 Bit
Speichertakt 7.000 MHz 8.000 MHz
Speicherbandbreite 448 GB/s 384 GB/s
Infinity Cache Nein Ja (1,5 TB/s)
AMD SAM / Resizable BAR Deaktiviert

Die Radeon RX 6700 XT wird derweil auf ebenso 2.000 MHz heruntergetaktet. Eigentlich taktet die Grafikkarte mit etwa zusätzlichen 500 MHz, was entsprechend nochmal mehr Bandbreite erfordert, sich mit Navi 10 aber nicht einmal im Ansatz erzielen lässt. Zugleich wurde die Auflösung auf 2.560 × 1.440 erhöht. Das entspricht nicht nur mehr dem eigentlichen Einsatzgebiet der Radeon RX 6700 XT, zusätzlich benötigen mehr Pixel auch mehr Speicherbandbreite.

Der Infinity Cache dreht das Bild

Werden die Anforderungen an die Speicherbandbreite erhöht, dreht sich das Bild. Denn mit dem doppelten GPU-Takt arbeitet Navi 22 in 2.560 × 1.440 im Durchschnitt nun 2 und 3 Prozent schneller als Navi 10. Hier kann der „Infinity Cache“ von RDNA 2 seine Muskeln spielen lassen und die ALUs schnell genug mit Daten versorgen, während RDNA trotz höherer Speicherbandbreite beim klassischem VRAM, aber eben ohne großen Cache, dies offenbar nicht schafft.

Besonders groß ist der Vorteil von RDNA 2 in Control, das gleich um 11 und 10 Prozent schneller läuft als mit dem originalen RDNA. Auch in Borderlands 3 liegt RDNA 2 mit 5 und 4 Prozent eindeutig vorne, in Star Wars: Squadrons sind es 6 und 8 Prozent.

Es gibt aber auch Spiele, in denen es RDNA offenbar schafft die ALUs auszulasten. So ist in F1 2020 RDNA 3 Prozent schneller als RDNA 2, in Serious Sam 4 sind es 2 Prozent. In Assassin's Creed Valhalla, Call of Duty: Black Ops Cold War, Dirt 5 und Hitman 3 gibt es einen Gleichstand.

Auf der nächsten Seite: RDNA 2: CU-Skalierung analysiert