Nvidia GeForce RTX 4090 im Test: Benchmarks in WQHD, UHD & 5K mit und ohne Raytracing

 2/6
Update 3 Wolfgang Andermahr
3.234 Kommentare

Taktraten unter Last

Nvidia nennt für die GeForce RTX 4090 Founders Edition einen durchschnittlichen Boost-Takt von 2.520 MHz. Doch wie von den letzten GeForce-Generationen bekannt, takten die Grafikkarten in Spielen für gewöhnlich deutlich höher. Dabei zeigt sich, dass der Boost-Mechanismus von Ampere auf Ada Lovelace quasi gleich geblieben ist, Nvidia die Grafikkarte aber völlig anders konfiguriert hat.

Nvidia GeForce RTX 4090 Founders Edition
Nvidia GeForce RTX 4090 Founders Edition
Nvidia GeForce RTX 4090 Founders Edition: Drei Slot dick und mit 16-Pin-Anschluss (12VHPWR)
Nvidia GeForce RTX 4090 Founders Edition: Drei Slot dick und mit 16-Pin-Anschluss (12VHPWR)
Nvidia GeForce RTX 4090 Founders Edition
Nvidia GeForce RTX 4090 Founders Edition

Das Power-Target ist nur selten ein Limit

Der maximale Takt des Testmusters der RTX 4090 FE lag ohne manuelle Anpassungen bei 2.790 MHz. Sichtbar war das kurz bei niedriger Last und geringen GPU-Temperaturen.

Bei den meisten Ampere-Grafikkarten lag der maximale Takt in Spielen in der Regel deutlich niedriger, da die GPUs für so hohe Frequenzen viel zu viel Energie benötigt hätten und vom Power-Target gebremst wurden. Das ist bei Ada Lovelace in der Regel nicht der Fall, weshalb der Takt in Games im Test nicht weit unter dem theoretischen Maximum rangierte.

AD102 taktet nahe am Maximum

Mit 2.775 MHz lag der höchste protokollierte Takt in Spielen tatsächlich nur einen „Takt-Schritt“ unter dem generellen Maximum, denn AD102 wechselt den Takt in 15-MHz-Schritten. Und auch im Durchschnitt aller Spiele taktete die GeForce RTX 4090 mit 2.744 MHz nicht viel weiter vom theoretischen Maximum (-46 MHz) entfernt.

Bereits ohne einen Blick auf die gemessene Leistungsaufnahme ist damit klar, dass Ada Lovelace massiv an Energieeffizienz gegenüber Ampere gewonnen hat. Nvidia hat sich daraufhin offensichtlich dafür entschieden, die Taktraten deutlich näher an das theoretische Maximum zu bringen, ohne dass es einen gravierenden Malus auf die Leistungsaufnahme gibt. In vielen Fällen erreicht die GeForce RTX 4090 selbst mit dieser Konfiguration die maximale TDP von 450 Watt nicht.

Die tatsächlichen durchschnittlichen Taktraten im Fractal Design Torrent
3.840 × 2.160 Nvidia GeForce RTX 4090 FE
Maximaler Takt in Spielen 2.775 MHz
CoD: Vanguard 2.727 MHz
Cyberpunk 2077 2.760 MHz
Cyberpunk 2077 + RT 2.714 MHz
Deathloop 2.745 MHz
Deathloop + RT 2.749 MHz
Doom Eternal 2.723 MHz
Doom Eternal + RT 2.745 MHz
Dying Light 2 2.760 MHz
Dying Light 2 + RT 2.708 MHz
F1 22 2.754 MHz
F1 22 + RT 2.688 MHz
Far Cry 6 2.760 MHz
Far Cry 6 + RT 2.760 MHz
Forza Horizon 5 2.745 MHz
Ghostwire: Tokyo 2.760 MHz
Ghostwire: Tokyo + RT 2.760 MHz
God of War 2.745 MHz
Guardians of the Galaxy 2.760 MHz
Guardians of the Galaxy + RT 2.745 MHz
Halo Infinite 2.745 MHz
Metro Exodus Enhanced 2.702 MHz
Saints Row 2.760 MHz
Saints Row + RT 2.760 MHz
Shadow Warrior 3 2.749 MHz
Sniper Elite 5 2.760 MHz
Spider-Man Remastered 2.744 MHz
Spider-Man Remastered + RT 2.745 MHz
Tiny Tina's Wonderlands 2.745 MHz
Durchschnitt 2.744 MHz

In den einzelnen Spielen zeigten sich dann auch nur leichte Variationen. 2.760 MHz lagen als höchster durchschnittlicher Takt in Cyberpunk 2077, Dying Light 2, Far Cry 6, Ghostwire: Tokyo, Guardians of the Galaxy, Saints Row und Sniper Elite 5 an.

Unter 2.700 MHz rutscht der Takt nur sehr selten

Den geringsten Takt gab es wiederum in F1 22 bei angeschaltetem Raytracing, nur dort rutschte der Takt unter 2.700 MHz. Doch auch dieser Wert war mit 2.688 MHz lediglich 102 MHz vom theoretischen Maximum entfernt. Metro Exodus Enhanced Edition war mit 2.702 MHz das Spiel mit dem zweitniedrigsten Takt.

Wenig verwunderlich änderte sich an den Taktraten wenig bis gar nichts, wenn auf der RTX 4090 das Power-Limit ohne manuelle Taktanpassung angehoben wurde. Nur dort, wo das Power-Limit überhaupt limitierte, ging es leicht nach oben, so dass mindestens 2.745 MHz anlagen. Die verbleibende Differenz zum Maximum von 2.790 MHz hatte eine andere Ursache als das neue Power-Limit, das nicht erreicht wurde.

Bei der GeForce-RTX-3000-Serie war das anders: Da diese Modelle in der Regel so hoch takteten, wie es das Power-Limit erlaubte, konnte der Takt durch ein höheres Power-Limit direkt mit angehoben werden.

Taktverlauf – Ultra HD, Doom Eternal
2.6002.6402.6802.7202.7602.800MHz 11002003004005006007008009001.0001.1001.2001.3001.4001.5001.6001.7001.800Sekunden

Benchmarks mit und ohne RT in 3.840 × 2.160

Die GeForce RTX 4090 zeigt in 3.840 × 2.160 bei den Rasterizer-Spielen bei den Durchschnitts-FPS eine um 65 Prozent bessere Performance als die GeForce RTX 3090 Ti. Das Plus gegenüber der Asus GeForce RTX 3090 Strix OC liegt bei 73 Prozent, während die Radeon RX 6900 XT XTXH als schnellste AMD-Grafikkarte eine Differenz von 83 Prozent aufweist. Bei den Perzentil-FPS liegt der Vorsprung der GeForce RTX 4090 zu den beiden Vorgängern aus dem eigenen Haus bei 60 und 70 Prozent.

Bei den Raytracing-Spielen kann die GeForce RTX 4090 ihren Vorsprung nochmal etwas aufbauen, auch wenn die Unterschiede im Performancerating nur gering sind. Dann liegt das neue Nvidia-Flaggschiff bei den AVG-FPS um 69 Prozent vor der GeForce RTX 3090 Ti und um 79 Prozent vor der GeForce RTX 3090. Die AMD-Grafikkarten auf Basis von RDNA 2 sind bei den angehobenen Raytracing-Einstellungen chancenlos: Hier bietet die GeForce RTX 4090 mal eben 159 Prozent mehr Leistung als die Radeon RX 6900 XT XTXH – AMD hat mit RDNA 3 viel aufzuholen.

Die Rohleistung kommt in Spielen oft nicht an

Die Benchmarks zeigen eine massive Leistungssteigerung der GeForce RTX 4090, doch mit Blick auf die theoretische Rechenleistung (+107 Prozent gegenüber der RTX 3090 Ti) wird klar: So einiges kommt nicht an. Das gilt für den Einsatz ohne und mit Raytracing.

Offenbar hat die AD102-GPU Schwierigkeiten damit, ihre vielen FP32-ALUs auszulasten – etwas, mit dem auch schon Ampere zu kämpfen hatte. Da Nvidia das Frontend bei Ada Lovelace nicht großartig geändert hat, verwundert es auch nicht, dass die Schwierigkeiten geblieben sind.

Performancerating 3.840 × 2.160
Performancerating 3.840 × 2.160 – Rasterizer, AVG-FPS
    • Nvidia GeForce RTX 4090 FE
      129,6
    • Nvidia GeForce RTX 3090 Ti
      78,4
    • Asus GeForce RTX 3090 Strix OC
      74,8
    • XFX Radeon RX 6900 XT Black
      71,0
    • Nvidia GeForce RTX 3080 Ti FE
      70,3
    • AMD Radeon RX 6900 XT
      67,3
    • Nvidia GeForce RTX 3080 FE
      63,6
    • AMD Radeon RX 6800 XT
      61,0
    • AMD Radeon RX 6800
      51,8
    • Nvidia GeForce RTX 3070 FE
      44,4
    • AMD Radeon RX 6700 XT
      41,0
    • Nvidia GeForce RTX 3060 Ti FE
      38,8
Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

Das heißt aber nicht, dass es keine Spiele gibt, in denen deutlich mehr Performance ankommt. In Call of Duty: Vanguard ist die GeForce RTX 4090 mal eben satte 90 Prozent schneller als die GeForce RTX 3090 Ti und bewegt sich damit durchaus recht nahe am theoretischen Maximum. In Forza Horizon 5 lässt sich ein sehr gutes Plus von 87 Prozent messen, in Sniper Elite 5 immerhin 82 Prozent und in Halo Infinite 81 Prozent. Auf der anderen Seite gibt es aber auch Titel, in denen die Skalierung schlechter ist. In Cyberpunk 2077 legt die neue GeForce so „nur“ um 57 Prozent zu, in Dying Light 2 sind es 55 Prozent, in Far Cry 6 50 Prozent und in Ghostwire: Tokyo 41 Prozent. Und ein CPU-Limit gibt es dort nicht.

Manche Spiele profitieren spürbar von den RT-Verbesserungen

In den einzelnen Spielen zeigt sich dann auch besser, dass Ada Lovelace bei der Raytracing-Performance mehr zulegt als bei der Rasterizer-Leistung, was im Performancerating ein wenig untergeht. So läuft Cyberpunk 2077 bei Rasterizer-Grafik um 57 Prozent schneller als die GeForce RTX 3090 Ti, mit Raytracing sind es dagegen klar bessere 84 Prozent. In Deathloop liegen die Verhältnisse bei 61 zu 82 Prozent, bei Dying Light 2 bei 55 zu 75 Prozent und in Ghostwire: Tokyo bei 41 zu 67 Prozent. Bei den anderen RT-Titeln sind die Unterschiede deutlich geringer oder gar nicht vorhanden. Dabei hat dies nichts mit „viel oder wenig Raytracing“ zu tun. So hat Deathloop keine hohen RT-Kosten, hier ist Ada Lovelace aber klar besser als Ampere. Guardians of the Galaxy hat dagegen hohe RT-Kosten, profitiert aber überhaupt nicht von den RT-Verbesserungen.

3.840 × 2.160
Call of Duty: Vanguard – 3.840 × 2.160
  • FPS, Durchschnitt:
    • Nvidia GeForce RTX 4090 FE
      130,3
    • XFX Radeon RX 6900 XT Black
      71,7
    • AMD Radeon RX 6900 XT
      68,9
    • Nvidia GeForce RTX 3090 Ti
      68,7
    • Asus GeForce RTX 3090 Strix OC
      67,8
    • Nvidia GeForce RTX 3080 Ti FE
      62,8
    • AMD Radeon RX 6800 XT
      62,1
    • Nvidia GeForce RTX 3080 FE
      56,3
    • AMD Radeon RX 6800
      51,2
    • Nvidia GeForce RTX 3070 FE
      41,4
    • AMD Radeon RX 6700 XT
      38,5
    • Nvidia GeForce RTX 3060 Ti FE
      35,5
  • FPS, 1% Perzentil:
    • Nvidia GeForce RTX 4090 FE
      103,6
    • XFX Radeon RX 6900 XT Black
      55,2
    • Nvidia GeForce RTX 3090 Ti
      53,3
    • AMD Radeon RX 6900 XT
      51,1
    • Asus GeForce RTX 3090 Strix OC
      47,4
    • Nvidia GeForce RTX 3080 Ti FE
      46,9
    • AMD Radeon RX 6800 XT
      46,3
    • Nvidia GeForce RTX 3080 FE
      41,7
    • AMD Radeon RX 6800
      38,0
    • AMD Radeon RX 6700 XT
      30,2
    • Nvidia GeForce RTX 3070 FE
      27,3
    • Nvidia GeForce RTX 3060 Ti FE
      25,7
Einheit: Bilder pro Sekunde (FPS)

DLSS ist auf der RTX 4090 eine Option – aber kein Must-have

Wer bis jetzt mit Raytracing in Ultra HD spielen möchte, ist auf Upsampling angewiesen – ansonsten reicht die Performance einfach nicht aus. Mit der GeForce RTX 4090 ist dies anders. Die Grafikkarte hat eine so hohe Rechenleistung, dass DLSS eine sinnvolle Option, aber kein Muss mehr ist. Einzig Cyberpunk 2077 krebst mit 34 FPS in 3.840 × 2.160 herum, alle anderen Spiele laufen mit mindestens 60 FPS oder gleich deutlich mehr. Keine andere Grafikkarte ist aktuell dazu auch nur im Ansatz in der Lage.

Benchmarks mit RT und FSR 2.x/DLSS 2.x in 3.840 × 2.160

Wird in Ultra HD DLSS 2.x Quality aktiviert, steigt die Performance der GeForce RTX 4090 spürbar an, der Vorsprung zur GeForce RTX 3090 Ti reduziert sich jedoch auf 51 Prozent. Das verwundert auch nicht, weil bei weniger Renderpixeln AD102 den Vorteil der vielen ALUs weniger ausspielen kann. Zudem rückt das CPU-Limit in der Auflösung automatisch deutlich näher – gerade, wenn Raytracing aktiviert ist.

Rating 3.840 × 2.160 + DLSS 2.x/FSR 2.x
Rating 3.840 × 2.160 + DLSS 2.x/FSR 2.x – Raytracing, AVG-FPS
    • Nvidia GeForce RTX 4090 FE
      115,9
    • Nvidia GeForce RTX 3090 Ti
      76,6
    • Asus GeForce RTX 3090 Strix OC
      73,0
    • Nvidia GeForce RTX 3080 Ti FE
      68,2
    • Nvidia GeForce RTX 3080 FE
      58,5
    • XFX Radeon RX 6900 XT Black
      56,0
    • AMD Radeon RX 6900 XT
      53,1
    • AMD Radeon RX 6800 XT
      48,3
    • AMD Radeon RX 6800
      41,4
    • Nvidia GeForce RTX 3070 FE
      40,9
    • Nvidia GeForce RTX 3060 Ti FE
      35,8
    • AMD Radeon RX 6700 XT
      32,1
Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

Während Deathloop, God of War und Spider-Man mit DLSS zum Beispiel kaum flotter werden, legen Dying Light 2 und Ghostwire: Tokyo deutlich zu. In Dying Light 2 erhöht sich die Framerate um starke 68 Prozent von kaum mehr als 60 FPS in den dreistelligen Framebereich. Und in Ghostwire: Tokyo liegt das Plus bei immer noch sehr guten 50 Prozent, was von knapp 60 FPS in leicht mehr als 90 FPS resultiert.

3.840 × 2.160 + DLSS 2.x/FSR 2.x
Deathloop (RT) – 3.840 × 2.160 + DLSS 2.x/FSR 2.x
  • FPS, Durchschnitt:
    • Nvidia GeForce RTX 4090 FE
      126,8
    • Nvidia GeForce RTX 3090 Ti
      93,3
    • Asus GeForce RTX 3090 Strix OC
      89,2
    • Nvidia GeForce RTX 3080 Ti FE
      75,8
    • Nvidia GeForce RTX 3080 FE
      72,1
    • XFX Radeon RX 6900 XT Black
      63,1
    • AMD Radeon RX 6900 XT
      61,6
    • AMD Radeon RX 6800 XT
      55,8
    • AMD Radeon RX 6800
      47,5
    • Nvidia GeForce RTX 3070 FE
      45,7
    • Nvidia GeForce RTX 3060 Ti FE
      38,8
    • AMD Radeon RX 6700 XT
      36,3
  • FPS, 1% Perzentil:
    • Nvidia GeForce RTX 4090 FE
      113,4
    • Nvidia GeForce RTX 3090 Ti
      88,0
    • Asus GeForce RTX 3090 Strix OC
      83,5
    • Nvidia GeForce RTX 3080 Ti FE
      66,5
    • Nvidia GeForce RTX 3080 FE
      60,6
    • XFX Radeon RX 6900 XT Black
      54,3
    • AMD Radeon RX 6900 XT
      53,5
    • AMD Radeon RX 6800 XT
      50,1
    • AMD Radeon RX 6800
      43,8
    • Nvidia GeForce RTX 3070 FE
      41,8
    • Nvidia GeForce RTX 3060 Ti FE
      34,9
    • AMD Radeon RX 6700 XT
      29,3
Einheit: Bilder pro Sekunde (FPS)

Benchmarks mit und ohne RT in 2.560 × 1.440

In 2.560 × 1.440 gerät die GeForce RTX 4090 dann auch mit dem Intel Core i9-12900K immer mal wieder in ein CPU-Limit. Darüber hinaus fällt es der GPU automatisch schwerer, die vielen FP32-ALUs auszulasten. Und damit kann sich die neue Grafikkarte in WQHD dann „nur“ noch um 47 Prozent in Rasterizer-Spielen von der GeForce RTX 3090 Ti absetzen, was deutlich weniger als bei Ultra HD ist.

In Raytracing-Titeln ist das Plus mit 51 Prozent dann wieder etwas höher als ohne die Strahlen, fällt aber auch mit diesen klar gegenüber den Ergebnissen von Ultra HD zurück. Das verwundert nicht, denn Raytracing benötigt oft mehr CPU-Leistung als reine Rasterizer-Grafik.

Performancerating 2.560 × 1.440
Performancerating 2.560 × 1.440 – Rasterizer, AVG-FPS
    • Nvidia GeForce RTX 4090 FE
      188,9
    • Nvidia GeForce RTX 3090 Ti
      128,3
    • Asus GeForce RTX 3090 Strix OC
      124,0
    • XFX Radeon RX 6900 XT Black
      123,3
    • Nvidia GeForce RTX 3080 Ti FE
      117,9
    • AMD Radeon RX 6900 XT
      117,0
    • Nvidia GeForce RTX 3080 FE
      107,3
    • AMD Radeon RX 6800 XT
      106,5
    • AMD Radeon RX 6800
      90,4
    • Nvidia GeForce RTX 3070 FE
      83,8
    • AMD Radeon RX 6700 XT
      74,7
    • Nvidia GeForce RTX 3060 Ti FE
      72,1
Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

Das CPU-Limit ist dabei das größere Problem als die komplexere Auslastung der ALUs. In Deathloop bremst es die GeForce RTX 4090 zum Beispiel deutlich ein, die neue Grafikkarte liefert dann nur noch 24 Prozent höhere FPS als das alte Flaggschiff. Mit Raytracing sind es gar nur 16 Prozent, da die CPU eine noch größere Rolle spielt. Ähnlich sieht es in F1 22 ohne Raytracing sowie generell in Far Cry 6 und Ghostwire: Tokyo aus.

In manchen Games bremst die GPU dann jedoch nicht und die GeForce RTX 4090 legt wieder massiv gegenüber der GeForce RTX 3090 Ti zu, wenn auch in kleinerem Ausmaß als in 3.840 × 2.160. In CoD: Vanguard beträgt das Plus immer noch sehr hohe 76 Prozent, in Cyberpunk 2077 mit RT sind es 78 Prozent, in Doom Eternal mit RT 70 Prozent und in Dying Light 2 mit RT 75 Prozent. Das Highlight ist Forza Horizon 5 mit einer sehr hohen Leistungssteigerung von 83 Prozent.

2.560 × 1.440
Call of Duty: Vanguard – 2.560 × 1.440
  • FPS, Durchschnitt:
    • Nvidia GeForce RTX 4090 FE
      219,9
    • XFX Radeon RX 6900 XT Black
      137,1
    • AMD Radeon RX 6900 XT
      128,8
    • Nvidia GeForce RTX 3090 Ti
      125,0
    • Asus GeForce RTX 3090 Strix OC
      118,4
    • AMD Radeon RX 6800 XT
      115,1
    • Nvidia GeForce RTX 3080 Ti FE
      111,8
    • Nvidia GeForce RTX 3080 FE
      101,8
    • AMD Radeon RX 6800
      97,6
    • Nvidia GeForce RTX 3070 FE
      78,6
    • AMD Radeon RX 6700 XT
      77,0
    • Nvidia GeForce RTX 3060 Ti FE
      67,8
  • FPS, 1% Perzentil:
    • Nvidia GeForce RTX 4090 FE
      171,0
    • XFX Radeon RX 6900 XT Black
      110,0
    • AMD Radeon RX 6900 XT
      102,7
    • Nvidia GeForce RTX 3090 Ti
      101,0
    • Asus GeForce RTX 3090 Strix OC
      93,0
    • AMD Radeon RX 6800 XT
      92,8
    • Nvidia GeForce RTX 3080 Ti FE
      88,7
    • AMD Radeon RX 6800
      80,4
    • Nvidia GeForce RTX 3080 FE
      78,9
    • AMD Radeon RX 6700 XT
      61,9
    • Nvidia GeForce RTX 3070 FE
      53,3
    • Nvidia GeForce RTX 3060 Ti FE
      51,2
Einheit: Bilder pro Sekunde (FPS)

Benchmarks mit und ohne RT in 5.120 × 2.880

Bei der extrem hohen Auflösung von 5.120 × 2.880 sollte man eigentlich davon ausgehen, dass die GeForce RTX 4090 ihre Shader-Einheiten nochmal etwas besser als in Ultra HD auslasten kann. Dennoch kann sich die Grafikkarte in der Auflösung mit 62 Prozent etwas weniger als in Ultra HD von der GeForce RTX 3090 Ti absetzen. Technisch gibt es dafür eigentlich keinen Grund, vermutlich hat Nvidia jedoch den Treiber einfach weniger auf die ungewöhnliche Auflösung angepasst.

Performancerating 5.120 × 2.880
Performancerating 5.120 × 2.880 – Rasterizer, AVG-FPS
    • Nvidia GeForce RTX 4090 FE
      84,0
    • Nvidia GeForce RTX 3090 Ti
      51,7
    • Asus GeForce RTX 3090 Strix OC
      48,6
    • Nvidia GeForce RTX 3080 Ti FE
      45,5
    • XFX Radeon RX 6900 XT Black
      44,7
    • AMD Radeon RX 6900 XT
      42,4
    • AMD Radeon RX 6800 XT
      38,8
    • Nvidia GeForce RTX 3080 FE
      37,3
Einheit: Bilder pro Sekunde (FPS), Geometrisches Mittel

Dennoch schafft es die GeForce RTX 4090 spielend, in den meisten Games teils klar mehr als 60 FPS zu erreichen. Einzig in Cyberpunk 2077 und Ghostwire: Tokyo bleibt die Grafikkarte knapp unter der Marke. Anders als die GeForce RTX 3090 Ti erreicht das neue Modell dennoch gut spielbare Frameraten. In letztgenanntem Titel müsste die GeForce RTX 4090 eigentlich deutlich mehr FPS liefern, doch ohne Raytracing kommt sie hier nicht so richtig gegenüber dem Vorgänger vorwärts.

5.120 × 2.880
Call of Duty: Vanguard – 5.120 × 2.880
  • FPS, Durchschnitt:
    • Nvidia GeForce RTX 4090 FE
      78,2
    • XFX Radeon RX 6900 XT Black
      43,9
    • Nvidia GeForce RTX 3090 Ti
      43,0
    • AMD Radeon RX 6900 XT
      41,1
    • Asus GeForce RTX 3090 Strix OC
      40,0
    • Nvidia GeForce RTX 3080 Ti FE
      37,8
    • AMD Radeon RX 6800 XT
      37,6
    • Nvidia GeForce RTX 3080 FE
      34,1
  • FPS, 1% Perzentil:
    • Nvidia GeForce RTX 4090 FE
      58,1
    • XFX Radeon RX 6900 XT Black
      33,8
    • Nvidia GeForce RTX 3090 Ti
      33,7
    • AMD Radeon RX 6900 XT
      30,8
    • Asus GeForce RTX 3090 Strix OC
      28,2
    • AMD Radeon RX 6800 XT
      27,8
    • Nvidia GeForce RTX 3080 Ti FE
      27,2
    • Nvidia GeForce RTX 3080 FE
      23,4
Einheit: Bilder pro Sekunde (FPS)

Spiele-Benchmarks im Überblick

Die nachfolgende Tabelle fasst alle Spiele-Einzelergebnisse im Vergleich GeForce RTX 4090 zu GeForce RTX 3090 Ti abschließend übersichtlich zusammen. Das bereits angesprochene Verhalten mit aktivem Raytracing, wo es mal deutlich und mal weniger deutlich zugunsten der neuen Generation ausgeht, wird so noch einmal deutlicher.

Spiel RTX 4090 FE vs. RTX 3090 Ti
WQHD (RT) UHD (RT)
inkl. FSR/DLSS
UHD (RT) 5K
COD Vanguard +76 % - +90 % +82 %
Cyberpunk 2077 +48 % - +75 % +63 %
Cyberpunk 2077 + RT +78 % - +84 % -
Deathloop +24 % - +61 % +53 %
Deathloop + RT +16 % - +82 % -
Doom Eternal +59 % - +68 % +61 %
Doom Eternal + RT +70 % +36 % +69 % -
Dying Light 2 +60 % - +55 % +57 %
Dying Light 2 + RT +75 % +75 % +75 % -
F1 22 +17 % - +69 % +69 %
F1 22 + RT +66 % - +76 % -
Far Cry 6 +19 % - +50 % +42 %
Far Cry 6 + RT +12 % - +48 % -
Forza Horizon 5 +83 % - +87 % +82 %
Ghostwire Tokyo + 19 % - +41 % +36 %
Ghostwire Tokyo + RT +41 % +46 % +67 % -
God of War +49 % +54 % 58 % +58 %
Guardians of the Galaxy +51 % - +60 % +55 %
Guardians of the Galaxy + RT +66 % - +64 % -
Halo Infinite +45 % - +81 % +72 %
Metro Exodus Enhanced +63 % - +64 % -
Saints Row +57 % - +61 % +64 %
Saints Row + RT +58 % - +63 % -
Shadow Warrior 3 +39 % - +59 % +48 %
Sniper Elite 5 +85 % - +82 % +72 %
Spider-Man Remastered +50 % - +77 % +76 %
Spider Man Remastered + RT +32 % +49 % +74 % -
Tiny Tina's Wonderlands +48 % - +63 % +57 %

Benchmarks in Anwendungen

Spiele sind das eine, doch Grafikkarten können heute weit mehr als das und Nvidia hat mit CUDA eine besonders mächtige API zu bieten, die sich am Markt einer weiten Verbreitung erfreut. In der aktuellen Version macht CUDA nicht nur die Shader, sondern auch die RT- und die Tensor-Kerne zugänglich.

Mit Adobe Premiere Pro, Agisoft Metashape und Blender Benchmark musste sich die GeForce RTX 4090 sowohl der versammelten letzten Generation als auch Radeon RX 6000 und Intel Arc stellen.

Rendern ist die Paradedisziplin

Am deutlichsten fällt der Leistungszugewinn in Blender Benchmark aus, wo die RTX 4090 satte 90 Prozent vor der RTX 3090 Ti liegt. Ein Grund dafür ist auch, weil in diesem Test weder die CPU noch die Video-Einheit einen Einfluss haben, die Rohleistung der GPU also ungebremst in Performance umgesetzt werden kann.

Beim Projekt-Export in Adobe Premiere Pro 22.5 ist das nicht der Fall. Hier spielen auch die CPU (immer ein Ryzen 7 7700X, DDR5-5200CL32) und die Video-Einheit eine Rolle, so dass der Vorsprung der neuen GPU weniger als 10 Prozent beträgt. In Agisoft Metashape sind es gut 15 Prozent.

Diagramme
Adobe Premiere Pro 22.5
  • 4K60/8K24 + Effects/Color Grading to 4K60 H.265 (Hardware):
    • Nvidia GeForce RTX 4090
      7700X, DDR5-5200, FE
      0:50
    • Nvidia GeForce RTX 3090 Ti
      7700X, DDR5-5200, Asus ROG
      0:54
    • Nvidia GeForce RTX 3080
      7700X, DDR5-5200, FE
      0:55
    • Nvidia GeForce RTX 3080 Ti
      7700X, DDR5-5200, FE
      0:56
    • AMD Radeon RX 6800 XT
      7700X, DDR5-5200, Ref.
      0:56
    • AMD Radeon RX 6800
      7700X, DDR5-5200, Ref.
      0:57
    • Nvidia GeForce RTX 3060 Ti
      7700X, DDR5-5200, FE
      1:00
    • AMD Radeon RX 6900 XT(XH)
      7700X, DDR5-5200, XFX Merch319
      1:00
    • Nvidia GeForce RTX 3070
      7700X, DDR5-5200, FE
      1:01
    • Nvidia GeForce RTX 3060
      7700X, DDR5-5200, Asus ROG
      1:07
    • AMD Radeon RX 6700 XT
      7700X, DDR5-5200, Ref.
      1:08
    • Intel Arc A770 Ltd.
      7700X, DDR5-5200, Limited
      1:10
    • Intel Arc A750 Ltd.
      7700X, DDR5-5200, Limited
      1:10
    • AMD Radeon RX 6600 XT
      7700X, DDR5-5200, Sapphire Pulse
      1:18
    • Medion Erazer Major X10
      Core i7-12700H, Arc A730M, Turbo
      1:19
    • AMD Radeon RX 6650 XT
      7700X, DDR5-5200, PC Hellhound
      1:21
    • Nvidia GeForce RTX 3050
      7700X, DDR5-5200, GB Eagle
      1:29
    • AMD Radeon RX 6600
      7700X, DDR5-5200, XFX Swift
      1:31
    • Asus ROG Zephyrus G14 (2022)
      Ryzen 9 6900HS, RX 6800S, Turbo
      1:45
    • Asus ROG Strix G15 (2021)
      Ryzen 9 5900HX, RX 6800M, Turbo
      1:46
    • Intel Arc A380
      7700X, DDR5-5200, Gunnir
      2:23
    • Asus ROG Zephyrus G14 (2022), iGPU
      Ryzen 9 6900HS, 680M, Turbo
      3:44
    • Lenovo Yoga Slim 9i (2022)
      Core i7-1280P, Iris Xe, Leistung
      3:52
    • Medion Erazer Major X10, iGPU
      Core i7-12700H, Iris Xe, Turbo
      4:11
    • Lenovo ThinkPad Z13 G1
      Ryzen 5 6650U Pro, 660M, Leistung
      4:48
    • Asus Zenbook 13S (2022)
      Ryzen 7 6800U, 680M, Leistung
      5:01
    • Lenovo Yoga Slim 7
      Ryzen 7 4800U, Vega8, DDR4...
      5:57
    • AMD Ryzen 7 7950X, 5200CL32
      230 Watt, iGPU, DDR5-5200
      6:00
    • AMD Ryzen 7 7700X, 5200CL32
      142 Watt, iGPU, DDR5-5200
      6:10
    • Intel Core i9-12900KS max
      max. W, UHD 770, DDR5-4800CL38
      6:32
    • Intel Core i9-12900K
      241 W, UHD 770, DDR5-4800CL38
      6:37
    • Intel Core i7-12700K
      190 W, UHD 770, DDR5-4800CL38
      6:38
    • Intel Core i5-12500
      117 W, UHD 770, DDR5-4800CL38
      6:54
    • Intel Core i5-12600K
      150 W, UHD 770, DDR5-4800CL38
      7:11
    • Asus ROG Strix G15 (2021), iGPU
      Ryzen 9 5900HX, Vega8, Turbo
      7:11
Einheit: Minuten, Sekunden

Nvidia NVENC im Test

Ebenfalls beschleunigen respektive effizienter als die CPU abwickeln können GPUs das De- und Encodieren von Videos über ihre dedizierte Video-Einheit. Im Vergleich Ampere zu Ada Lovelace haben NVDEC (Decoder) und NVENC (Encoder) folgende wesentliche Überarbeitungen erfahren:

  • NVENC unterstützt AV1, bis dato beherrschte das nur Intel Arc.
  • NVENC ist leistungsfähiger.
  • NVENC liegt in AD102 zweifach vor, was die Leistung beim Encoding (H.265, AV1) theoretisch verdoppeln kann.

Dass NVENC in AD102 schneller arbeitet, kann in der aktuellen Nightly von HandBrake nachvollzogen werden, da es prinzipiell auch AV1-Hardware-Encoding unterstützt. Genutzt werden konnte diese Funktion allerdings nur auf Intel Arc, „AV1 (NVENC)“ blieb als Codec auf der RTX 4090 verborgen. Der Test mit H.265 zeigt dafür: NVENC in Ada ist etwas über 20 Prozent schneller fertig als NVENC in Ampere, Quicksync in Intel Arc für Desktop-PCs ist aber noch flotter unterwegs.

HandBrake Nightly
HandBrake Nightly – 2160p60 H.264 zu 2160p60 H.265
  • Hardware (GPU):
    • Intel Arc A380
      7700X, DDR5-5200, Gunnir
      1:12
    • Intel Arc A770 Ltd.
      7700X, DDR5-5200, Limited
      1:13
    • Intel Arc A750 Ltd.
      7700X, DDR5-5200, Limited
      1:13
    • Nvidia GeForce RTX 4090
      7700X, DDR5-5200, FE
      1:17
    • Asus ROG Zephyrus G14 (2022)
      Ryzen 9 6900HS, RX 6800S, Turbo
      1:25
    • AMD Radeon RX 6900 XT(XH)
      7700X, DDR5-5200, XFX Merch319
      1:25
    • AMD Radeon RX 6700 XT
      7700X, DDR5-5200, Ref.
      1:25
    • AMD Radeon RX 6650 XT
      7700X, DDR5-5200, PC Hellhound
      1:25
    • AMD Radeon RX 6600 XT
      7700X, DDR5-5200, Sapphire Pulse
      1:25
    • AMD Radeon RX 6600
      7700X, DDR5-5200, XFX Swift
      1:25
    • AMD Radeon RX 6800 XT
      7700X, DDR5-5200, Ref.
      1:26
    • AMD Radeon RX 6800
      7700X, DDR5-5200, Ref.
      1:27
    • Intel Core i9-12900KS max
      max. W, UHD 770, DDR5-4800CL38
      1:33
    • Intel Core i7-12700K
      190 W, UHD 770, DDR5-4800CL38
      1:36
    • Asus ROG Zephyrus G14 (2022), iGPU
      Ryzen 9 6900HS, 680M, Turbo
      1:36
    • Intel Core i5-12600K
      150 W, UHD 770, DDR5-4800CL38
      1:38
    • Intel Core i5-12500
      117 W, UHD 770, DDR5-4800CL38
      1:38
    • AMD Ryzen 7 7950X, 5200CL32
      230 Watt, iGPU, DDR5-5200
      1:38
    • Nvidia GeForce RTX 3070
      7700X, DDR5-5200, FE
      1:39
    • Nvidia GeForce RTX 3090 Ti
      7700X, DDR5-5200, Asus ROG
      1:40
    • Nvidia GeForce RTX 3060 Ti
      7700X, DDR5-5200, FE
      1:40
    • Nvidia GeForce RTX 3060
      7700X, DDR5-5200, Asus ROG
      1:42
    • Nvidia GeForce RTX 3080 Ti
      7700X, DDR5-5200, FE
      1:43
    • Nvidia GeForce RTX 3080
      7700X, DDR5-5200, FE
      1:43
    • Nvidia GeForce RTX 3050
      7700X, DDR5-5200, GB Eagle
      1:45
    • Asus Zenbook 13S (2022)
      Ryzen 7 6800U, 680M, Leistung
      1:47
    • Lenovo ThinkPad Z13 G1
      Ryzen 5 6650U Pro, 660M, Leistung
      1:48
    • Lenovo Yoga Slim 9i (2022)
      Core i7-1280P, Iris Xe, Leistung
      1:48
    • Medion Erazer Major X10
      Core i7-12700H, Arc A730M, Turbo
      1:49
    • Medion Erazer Major X10, iGPU
      Core i7-12700H, Iris Xe, Turbo
      1:49
    • Asus ROG Strix G15 (2021)
      Ryzen 9 5900HX, RX 6800M, Turbo
      1:52
    • Lenovo Yoga Slim 7
      Ryzen 7 4800U, Vega8, DDR4...
      2:14
    • Asus ROG Strix G15 (2021), iGPU
      Ryzen 9 5900HX, Vega8, Turbo
      2:16
    • Lenovo ThinkPad X13s
      Qualcomm Snapdragon 8cx Gen 3
      3:58
    • AMD Ryzen 7 7700X, 5200CL32
      142 Watt, iGPU, DDR5-5200
      4:19
    • Intel Core i9-12900K
      241 W, UHD 770, DDR5-4800CL38
      4:39
Einheit: Minuten, Sekunden

Dass AD102 auf der Nvidia GeForce RTX 4090 AV1-Encoding beherrscht, konnte die Redaktion in DaVinci Resolve 18 Studio bestätigen. Auch war dort der von Nvidia versprochene Leistungszugewinn bei Nutzung beider NVENC sichtbar. Das galt allerdings nur in dem von Nvidia bereitgestellten Projekt auf Basis einer angepassten Variante von DaVinci Resolve 18 Studio.

Ein von der Redaktion genutztes Projekt in derselben App zeigte beim Export in AV1 wiederum lediglich den in HandBrake sichtbaren Zugewinn gegenüber Ampere, obwohl die erforderlichen Einstellungen (Output in 4K oder 8K, Preset „Very Fast“ oder „Faster“, Tuning „High Quality“) auch in Rücksprache mit Nvidia korrekt gesetzt waren. Die Redaktion ist mit Nvidia um eine Klärung bemüht.

Davon unabhängig gilt: Nvidia NVENC in Ada Lovelace ist schneller als der Vorgänger und beherrscht AV1. Durch parallele Nutzung beider Encoder lässt sich die Leistung in der Tat verdoppeln. Dafür ist allerdings angepasste Software vonnöten.