RDNA 2 vs. RDNA vs. GCN im Test: RDNA 2: CU-Skalierung analysiert

 2/2
Wolfgang Andermahr
185 Kommentare

40, 60, 72 und 80 CUs: Vergleich in 7 Spielen

Navi 22 verfügt auf der Radeon RX 6700 XT über 40 Compute-Units und damit 2.560 Shader-Einheiten, Navi 21 auf der Radeon RX 6900 XT derweil über 80 CUs und 5.120 ALUs. Im Datenblatt ist der Leistungszuwachs riesig, weil der Takt nicht signfikant fällt. Die doppelte Anzahl der Einheiten muss in der Praxis aber erst einmal ausgelastet werden, was in der Vergangenheit längst nicht immer ordentlich funktioniert hat.

AMD RDNA 2 mit 40 (Navi 22), 60, 72 und 80 CU (Navi 21) im Vergleich
AMD RDNA 2 mit 40 (Navi 22), 60, 72 und 80 CU (Navi 21) im Vergleich

Ob dies AMD bei RDNA 2 gelungen ist, klärt die folgende Testreihe. Auch hier ist es erneut entscheidend, dass alle Grafikkarten mit demselben GPU-Takt arbeiten, in diesem Fall mit 2,0 GHz, da dieser Takt von allen vier RDNA-2-Modellen problemlos erreicht und gehalten werden kann. Der Takt kann als Variable fast vollständig aus der Gleichung genommen werden.

So werden Radeon RX 6000 getestet
Radeon RX 6700 XT Radeon RX 6800 Radeon RX 6800 XT Radeon RX 6900 XT
GPU / Architektur Navi 22
RDNA 2
Navi 21
RDNA 2
Shader-Einheiten 2.560 (40 CUs) 3.840 (60 CUs) 4.680 (72 CUs) 5.120 (80 CUs)
Zusätzliche Einheiten +50 % +20 % +11 %
GPU-Takt 2.000 MHz
Theoretische Rechenleistung 10,2 TFLOPS 15,4 TFLOPS 18,7 TFLOPS 20,5 TFLOPs
Speichergröße 12 GB 16 GB
Speicherinterface 192 Bit 256 Bit
Speichertakt 8.000 MHz
Speicherbandbreite 384 GB/s 512 GB/s
Infinity Cache Ja (1,5 TB/s) Ja (2,0 TB/s)
AMD SAM / Resizable BAR Aktiviert

Beim Speicher gelingt dies nicht ganz. Radeon RX 6800, Radeon RX 6800 XT und Radeon RX 6900 XT verfügen allesamt über ein 256-Bit-Interface mit 16-Gbps-Speicher und einen 128 MB großen „Infinity Cache“ mit 2,0 TB/s – sind also absolut identisch. Die Radeon RX 6700 XT greift dagegen nur auf ein 192-Bit-Interface, 16-Gbps-Speicher und einen 96 MB großen „Infinity Cache“ mit 1,5 TB/s zu. Die Radeon RX 6700 XT hat also weniger Speicherbandbreite sowie einen kleineren und langsameren „Infinity Cache“. Das lässt sich auch nicht ausgleichen.

Damit ist die Grafikkarte zwangsweise im Nachteil, der jedoch durch den abgsenkten GPU-Takt und die deutlich geringere Anzahl CUs recht klein sein sollte. Denn eine GPU mit 40 CUs braucht nun mal nicht so viel Speicherbandbreite wie ein Pendant mit 80 CUs, um diese möglichst schnell mit Daten versorgen zu können. Aber ein Nachteil lässt sich weder ausschließen noch exakt beziffern.

In höheren Auflösungen ist es immer leichter, viele Shader-Einheiten auszulasten, als in niedrigen Auflösungen. In 1.920 × 1.080 muss das Front-End schneller arbeiten als in 3.840 × 2.160, wo die ALUs länger brauchen und das Front-End entsprechend langsamer zu Werke gehen kann. Aus diesem Grund werden die Benchmarks in 1.920 × 1.080, 2.560 × 1.440 und in 3.840 × 2.160 durchgeführt. Um den Arbeitsaufwand nicht massiv zu erhöhen, wird die Anzahl der Testspiele aber auf sieben reduziert.

CU-Skalierung in 1.920 × 1.080 (Full HD)

Für eine niedrige Auflösung wie 1.920 × 1.080 muss zunächst angemerkt werden, dass für die großen Grafikkarten trotz deren Leistungsreduzierung und des eingesetzten Ryzen 9 5950X natürlich das CPU-Limit eine Rolle spielt. Das trifft auch auf diese Testreihe zu, jedoch zeichnet sich nur ein geringes CPU-Limit ab. Die GPUs werden in allen Spielen immer noch nahezu komplett ausgelastet.

Unabhängig vom CPU-Limit haben es GPUs mit vielen Compute-Units in niedrigen Auflösungen schwer und das zeichnet sich auch für RDNA 2 ab. Trotz 50 Prozent mehr Compute-Units bei der Radeon RX 6800 und ein gutes Stück mehr Speicherbandbreite steigt die Performance gegenüber der 40-CU-Konfiguration nur um durchschnittlich 28 Prozent an. Der Zuwachs an ALU-Leistung wird also nur zu 56 Prozent in mehr FPS umgesetzt. Hier kann das Front-End die ALUs schlicht nicht schnell genug mit Daten beliefern. Das zeigt sich vor allem in Assassin's Creed Valhalla und Death Stranding, die nur um 24 Prozent zulegen. Borderlands 3 profitiert dagegen mit plus 33 Prozent deutlicher.

1.920 × 1.080, CU-Skalierung
AVG-FPS – 1.920 × 1.080, CU-Skalierung
    • 80 Compute Units
      158,6
    • 72 Compute Units
      149,9
    • 60 Compute Units
      135,1
    • 40 Compute Units
      105,5
Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

Interessanterweise ist die Skalierung von RDNA 2 mit noch mehr CUs dann nicht mehr schlechter, sondern bleibt in etwa auf dem Niveau beim Sprung von 40 CUs auf deren 60. 72 CUs bringen gegenüber 60 CUs zusätzliche 11 Prozent an FPS (20 Prozent mehr CUs), 80 CUs dann noch einmal 6 Prozent (11 Prozent mehr CUs) – also etwas mehr als die Hälfte des relativen ALU-Zuwachses wird auch in mehr FPS umgesetzt.

Offenbar hat RDNA 2 also kein generelles Problem damit, viele CUs in niedrigen Auflösungen mit Daten zu beliefern, da die Skalierung bis hinauf zu 80 CUs bei etwas mehr als der Hälfte vom rechnerisch Möglichen liegt und diese Skalierung bis hin zu 80 CUs nicht abnimmt.

CU-Skalierung in 2.560 × 1.440 (WQHD)

Mit steigender Auflösung wird die Skalierung besser. Schon in 2.560 × 1.440 bringen 60 CUs gegenüber 40 CUs einen Leistungssprung von 33 statt 28 Prozent, 72 CUs weitere 12 statt 11 Prozent und 80 CUs dann schlussendlich 7 statt 6 Prozent mehr Performance. Doch interessanter ist der Blick auf Ultra HD und damit auf die bestmögliche Skalierung, ohne dass die Auflösung unrealistisch hoch wird.

2.560 × 1.440, CU-Skalierung
AVG-FPS – 2.560 × 1.440, CU-Skalierung
    • 80 Compute Units
      121,8
    • 72 Compute Units
      113,7
    • 60 Compute Units
      101,3
    • 40 Compute Units
      76,3
Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

CU-Skalierung in 3.840 × 2.160 (Ultra HD)

In Ultra HD zeigt sich im Schnitt ein Leistungsschub von 36 Prozent beim Wechsel von 40 auf 60 CUs, wobei Borderlands 3 und Cyberpunk 2077 mit 40 Prozent den größten Schub und Watch Dogs: Legion mit 32 Prozent den geringsten Schub zeigen. Bei 50 Prozent investierter zusätzlicher Rechenleistung sind bis zu 36 Prozent mehr Performance zwar kein perfektes, aber durchaus ein gutes Skalierungsergebnis. Denn 1:1 lässt sich Rechenleistung nie in Geschwindigkeit umsetzen.

72 statt 60 CUs ergeben in 3.840 × 2.160 dann eine 15 Prozent höhere Leistung mit einem 19-Prozent-Schub in Hitman 3 als Highlight und 12 Prozent in Assassin's Creed Valhalla sowie Watch Dogs: Legion als schwächstes Ergebnis. 80 statt 72 CUs beschleunigen RNDA 2 im Schnitt um 8 Prozent mit einer perfekten Skalierung von 10 Prozent in Borderlands 3 als bestes Ergebnis und mit plus 5 Prozent in Hitman 3 als schwächstes.

3.840 × 2.160, CU-Skalierung
AVG-FPS – 3.840 × 2.160, CU-Skalierung
    • 80 Compute Units
      75,4
    • 72 Compute Units
      69,9
    • 60 Compute Units
      60,9
    • 40 Compute Units
      44,7
Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

Damit bestätigt UHD, dass die Skalierung von RDNA 2 mit steigender Anzahl CUs nicht schlechter wird. Ganz im Gegenteil sogar: Mit 60 statt 40 respektive 72 statt 60 CUs werden rund 72 Prozent beziehungsweise 75 Prozent der zusätzlichen ALUs in mehr Leistung umgesetzt und der Sprung von 72 auf 80 hat immer noch eine Effizienz von 73 Prozent.

RDNA 2 skaliert mit jedem CU-Schritt gleich

Damit lässt sich grob sagen, dass RDNA 2 unabhängig von der Gesamtzahl der ALUs diese in Ultra HD im Bereich zwischen 72 und 75 Prozent zu mehr Performance umsetzen kann. In Full HD beträgt die „Effizienz“ 55 bis 56 Prozent, in WQHD sind es 60 bis 66 Prozent. Die geringen Unterschiede in den einzelnen Auflösungen zeigen, dass sowohl Front-End als auch Speicherbandbreite bei RDNA 2 so gewählt sind, dass selbst 80 CUs problemlos mit genug Daten gefüllt werden können.

Schlussworte

Mit dem Artikel hat die Redaktion zwei interessante Eigenschaften von RDNA 2 herausstellen können. So zeigt sich, dass RDNA 2 in Spielen mit wenigen Ausnahmen pro Shader-Einheit sogar ein wenig langsamer als RDNA ist, was mit der längeren Pipeline begründet werden kann, die aber erst die sehr hohen Taktraten ermöglicht, über die RDNA 2 dann – abgesehen von neuen Features wie Raytracing – RDNA weit hinter sich lässt. AMD hat also etwas Performance pro Compute-Unit geopfert, die höheren Frequenzen rechtfertigen diesen Schritt jedoch zweifelsohne.

Darüber hinaus hat sich gezeigt, dass RDNA 2 überhaupt keine Probleme hat, den Vollausbau und damit die 80 CUs mit Aufgaben zu versorgen. So skalieren die 80 CUs der Radeon RX 6900 XT gegenüber den 72 CUs der Radeon RX 6800 XT absolut gleich wie die 60 CUs der Radeon RX 6800 gegenüber den 40 CUs der Radeon RX 6700 XT und das gilt gleichermaßen für Full HD, WQHD und Ultra HD. Das bedeutet aber nicht, dass RDNA 2 eine perfekte CU-Skalierung zeigt, denn mehr als 75 Prozent der zusätzlichen Einheiten werden zu keiner Zeit in mehr Leistung umgewandelt.

Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.

Das EM-2024-Tippspiel ⚽ auf ComputerBase – heute schon getippt?