GeForce RTX 3080 FE im Test: Benchmarks in Anwendungen

 4/7
Wolfgang Andermahr (+1)
3.259 Kommentare

Warum Tests in Anwendungen?

GPUs können heute mehr als nur (Spiele-)Grafik ausgeben. Seit 2001 ist die Berechnung anderer Aufgaben auf einem extrem parallelisierten Grafikprozessor als GPGPU bekannt. Seit 2007 stellt Nvidia Entwicklern mit CUDA eine Programmier-Technik zur Verfügung, mit der Programmteile standardisiert durch Nvidia-GPUs abgearbeitet werden können. Ein herstellerübergreifendes Pendant wurde mit OpenCL im Jahr 2008 vorgestellt, AMD setzt darauf.

OpenCL und CUDA wurden zu Anfangszeiten vor allem bei wissenschaftlichen und technischen Berechnungen eingesetzt, beschleunigt inzwischen aber immer mehr Anwendungen, die von Kreativen genutzt werden. Mit Nvidia Turing und jetzt auch Ampere stehen über CUDA inzwischen nicht nur die klassischen Shader zur Verfügung, Programme können sich auch der Tensor- und RT-Kerne zur Hardware-Beschleunigung von KI-Algorithmen und Raytracing-Berechnungen bedienen.

Die Bedeutung der GPU im professionellen Umfeld abseits von Rechenzentren und Wissenschaft hat über die letzten Jahre in Folge dessen stetig zugenommen. Aus diesem Grund sind auch Anwendungs-Benchmarks Teil dieses Tests.

Getestet hat ComputerBase in diesem Fall auf einem System mit AMD Ryzen Threadripper 3990X (64K/128T) und 64 GB Corsair Dominator DDR4-3200 auf dem MSI Creator TRx40, um das Spiele-Testsystem nicht doppelt zu belegen.

Rendern der Vorschau mit Blender 2.90

Blender ist ein weit verbreitetes Rendering-Programm. Es ist mächtig, frei und für Windows, macOS und Linux verfügbar. Je komplexer das Projekt, desto höher fallen die Anforderungen an die Hardware aus. Und das betrifft nicht nur das finale Rendern beim Projekt-Export, sondern auch die Vorschau.

Neben OpenCL und CUDA steht in dieser Anwendung mittlerweile Nvidias API OptiX zur Verfügung. Mit OptiX lassen sich nicht nur die GPU-Shader, sondern auch die RT- (seit Blender 2.81, zum Rendern) und die Tensor-Kerne (seit Bender 2.83, für Denoising) der Ampere- und Turing-GPUs nutzen. Dabei gilt es allerdings zu bedenken: Die OptiX-Integration ist noch experimentell, noch nicht alle Funktionen der Rendering-Engine Cycles werden unterstützt.

Diesen Viewport gilt es unter WQHD zu rendern
Diesen Viewport gilt es unter WQHD zu rendern

ComputerBase hat für den Benchmark die Zeit gemessen, die bis zum Abschluss der Render-Vorschau im Projekt Blenderman benötigt wird. Grafikkarten von Nvidia wurden mit (Optix) und ohne RT-Kerne (CUDA) getestet. Denoising war im Viewport nicht aktiv. Motion Blur, das die RT-Kerne der Ampere-GPUs jetzt erstmals effizient berechnen können, spielt keine Rolle.

Blender 2.90 (Erstellen der Vorschau Blenderman)
    • GeForce RTX 3080 FE – RTX on
      1:05
    • GeForce RTX 2080 Ti FE – RTX on
      1:41
    • GeForce RTX 2080 Super FE – RTX on
      1:57
    • GeForce RTX 2070 Super FE – RTX on
      2:00
    • GeForce RTX 3080 FE – RTX off
      2:52
    • GeForce RTX 2080 Ti FE – RTX off
      4:00
    • GeForce RTX 2080 Super FE – RTX off
      5:10
    • GeForce RTX 2070 Super FE – RTX off
      5:20
    • GeForce GTX 1080 FE – RTX off
      9:08
    • Radeon RX 5700 XT
      10:00
    • Ryzen TR 3990WX
      10:20
    • Radeon VII
      12:16
Einheit: Minuten, Sekunden

Sowohl mit RT-Kernen als auch ohne erledigt die GeForce RTX 3080 FE die Renderarbeit im Vergleich zur GeForce RTX 2080 Super FE fast doppelt so schnell – die von Nvidia versprochene doppelte Leistung gegenüber einer GeForce RTX 2080 FE wird also erreicht.

Rendern mit OTOY OctaneRender

Das Render-Programm OctaneRender von OTOY, das schon immer für mehr Leistung exklusiv auf GPU-Rendering über CUDA setzte, kann das Rendern durch Nutzung der RT-Kerne der Turing-Architektur inzwischen weiter deutlich beschleunigen. Verfügbar ist die RT-Kern-Unterstützung allerdings weiterhin nur in einer Vorschau auf OctaneRender 2020 sowie einem Benchmark auf Basis von OctaneRender 2019. ComputerBase hat die nicht öffentliche Vorschau OctaneRender 2020.1.5 genutzt.

OctaneRender 2020.1.5
  • Path Tracing:
    • GeForce RTX 3080 FE – RTX on
      74,6
    • GeForce RTX 2080 Ti FE – RTX on
      48,9
    • GeForce RTX 2080 Super FE – RTX on
      36,7
    • GeForce RTX 2070 Super FE – RTX on
      35,0
    • GeForce RTX 3080 FE – RTX off
      29,3
    • GeForce RTX 2080 Ti FE – RTX off
      21,4
    • GeForce RTX 2080 Super FE – RTX off
      15,7
    • GeForce RTX 2070 Super FE – RTX off
      14,8
    • GeForce GTX 1080 FE – RTX off
      7,9
  • Direct Lighting:
    • GeForce RTX 3080 FE – RTX on
      94,5
    • GeForce RTX 2080 Ti FE – RTX on
      63,4
    • GeForce RTX 2080 Super FE – RTX on
      47,6
    • GeForce RTX 2070 Super FE – RTX on
      46,4
    • GeForce RTX 3080 FE – RTX off
      38,3
    • GeForce RTX 2080 Ti FE – RTX off
      28,5
    • GeForce RTX 2080 Super FE – RTX off
      20,7
    • GeForce RTX 2070 Super FE – RTX off
      19,7
    • GeForce GTX 1080 FE – RTX off
      10,5
Einheit: Megatexel pro Sekunde (MTex/s)

In OctaneRender legt die GeForce RTX 3080 FE mit RT-Kern-Unterstützung um knapp 50 Prozent gegenüber der GeForce RTX 2080 Ti FE zu, ohne RT-Kerne sind es etwas geringere knapp 40 Prozent. Hier zeigt sich der überproportionale Leistungszugewinn der RT-Kerne von Ampere gegenüber Turing.

Post-Processing und Export in Premiere Pro

Video-Bearbeitung in Adobe Premiere kann an vielen Stellen von der Beschleunigung durch eine GPU profitieren, sei es bei der Anwendung von Effekten in der Live-Vorschau oder beim Export. Seit diesem Frühjahr kann darüber hinaus Nvidias Video-Encoder NVENC zum Exportieren genutzt werden. Eine reine GPU-Anwendung ist Adobe Premiere Pro aber noch lange nicht, die CPU bleibt bei vielen Aufgaben und Filtern noch das Rechenwerk der Wahl.

Um das breite Band an Anforderungen in Adobe Premiere Pro im Test abzubilden, hat ComputerBase auf den PugetBench für Adobe Premiere Pro Version 0.92 Beta (Download und ausführliche Beschreibung) von Puget Systems aus den USA zurückgegriffen.

Der Benchmark ermittelt die Leistung in verschiedenen Export- und Bearbeitungs-Szenarien auf Basis unterschiedlicher Quellmedien. Die gewählten Effekte sind zum Teil stark auf die GPU, zum Teil stark auf die CPU angewiesen. Das zeigt auch das in Punkten gewichtete Endergebnis: Turing und Ampere liegen hier vergleichsweise dicht beieinander.

Premiere Pro (PugetBench 0.92 Beta)
  • Gesamtergebnis:
    • GeForce RTX 3080 FE
      1.164,0
    • GeForce RTX 2080 Ti FE
      1.111,0
    • GeForce RTX 2080 Super FE
      1.077,0
    • GeForce RTX 2070 Super FE
      1.069,0
    • Radeon RX 5700 XT
      1.019,0
    • Radeon VII
      931,0
    • GeForce GTX 1080 FE
      887,0
    • Ryzen TR 3990WX
      486,0
  • Export-Ergebnis:
    • GeForce RTX 3080 FE
      138,7
    • GeForce RTX 2080 Ti FE
      131,4
    • GeForce RTX 2080 Super FE
      124,4
    • GeForce RTX 2070 Super FE
      123,7
    • Radeon RX 5700 XT
      111,9
    • GeForce GTX 1080 FE
      98,5
    • Radeon VII
      94,1
    • Ryzen TR 3990WX
      14,0
  • Live-Vorschau-Ergebnis:
    • GeForce RTX 3080 FE
      94,0
    • Radeon VII
      92,1
    • Radeon RX 5700 XT
      91,9
    • GeForce RTX 2080 Super FE
      90,9
    • GeForce RTX 2080 Ti FE
      90,7
    • GeForce RTX 2070 Super FE
      90,1
    • Ryzen TR 3990WX
      83,2
    • GeForce GTX 1080 FE
      78,9
  • GPU-Ergebnis:
    • GeForce RTX 3080 FE
      88,2
    • GeForce RTX 2080 Ti FE
      82,2
    • GeForce RTX 2080 Super FE
      77,1
    • GeForce RTX 2070 Super FE
      72,3
    • Radeon VII
      62,8
    • Radeon RX 5700 XT
      57,6
    • Ryzen TR 3990WX
      37,4
    • GeForce GTX 1080 FE
      24,5
Einheit: Punkte

Werden allerdings die Szenarien herausgegriffen, die die GPU besonders stark fordern, sind auch hier erneut deutliche Vorteile für Ampere sichtbar.

Premiere Pro (PugetBench 0.92 Beta)
  • Lumetri Color - Export (H.264 40Mbps UHD):
    • GeForce RTX 3080 FE
      135,6
    • GeForce RTX 2080 Ti FE
      128,6
    • GeForce RTX 2080 Super FE
      125,5
    • GeForce RTX 2070 Super FE
      121,2
    • Radeon RX 5700 XT
      97,5
    • GeForce GTX 1080 FE
      87,1
    • Radeon VII
      58,2
    • Ryzen TR 3990WX
      7,0
  • Lumetri Color - Export (H.264 40Mbps UHD):
    • GeForce RTX 3080 FE
      125,5
    • GeForce RTX 2080 Ti FE
      100,9
    • GeForce RTX 2080 Super FE
      90,2
    • GeForce RTX 2070 Super FE
      85,0
    • Radeon RX 5700 XT
      81,4
    • Radeon VII
      58,1
    • GeForce GTX 1080 FE
      52,6
    • Ryzen TR 3990WX
      4,7
  • 4K RED (59.94FPS) – Export:
    • GeForce RTX 3080 FE
      192,4
    • GeForce RTX 2080 Ti FE
      153,7
    • GeForce RTX 2080 Super FE
      144,5
    • GeForce RTX 2070 Super FE
      139,9
    • Radeon RX 5700 XT
      129,4
    • Radeon VII
      115,3
    • GeForce GTX 1080 FE
      103,5
    • Ryzen TR 3990WX
      7,7
  • 4K Heavy GPU Effects (59.94FPS) – Playback:
    • GeForce RTX 3080 FE
      56,9
    • GeForce RTX 2080 Ti FE
      55,4
    • GeForce RTX 2080 Super FE
      52,9
    • GeForce RTX 2070 Super FE
      47,5
    • Radeon VII
      29,7
    • Ryzen TR 3990WX
      29,1
    • Radeon RX 5700 XT
      28,9
      Auf CPU berechnet
    • GeForce GTX 1080 FE
      12,6
  • 4K Heavy GPU Effects (59.94FPS) – Playback:
    • GeForce RTX 3080 FE
      57,0
    • GeForce RTX 2080 Ti FE
      55,6
    • GeForce RTX 2080 Super FE
      52,9
    • GeForce RTX 2070 Super FE
      47,5
    • Radeon VII
      29,7
    • Radeon RX 5700 XT
      28,8
      Auf CPU berechnet
    • Ryzen TR 3990WX
      28,2
    • GeForce GTX 1080 FE
      12,7
  • 4K Heavy GPU Effects Advanced (59.94FPS) – Export:
    • GeForce RTX 3080 FE
      61,9
    • GeForce RTX 2080 Ti FE
      48,1
    • Radeon VII
      38,2
    • GeForce RTX 2080 Super FE
      38,1
    • GeForce RTX 2070 Super FE
      34,3
    • Radeon RX 5700 XT
      24,3
    • GeForce GTX 1080 FE
      7,0
    • Ryzen TR 3990WX
      3,0
  • 4K Heavy GPU Extreme (59.94FPS) – Export:
    • GeForce RTX 3080 FE
      21,8
    • GeForce RTX 2080 Ti FE
      17,1
    • GeForce RTX 2080 Super FE
      13,4
    • GeForce RTX 2070 Super FE
      11,5
    • Radeon VII
      8,4
    • Radeon RX 5700 XT
      7,1
    • GeForce GTX 1080 FE
      3,8
    • Ryzen TR 3990WX
      3,1
  • 4K Heavy GPU Effects (59.94FPS) – Playback:
    • GeForce RTX 3080 FE
      97,1
    • GeForce RTX 2080 Ti FE
      96,1
    • GeForce RTX 2080 Super FE
      94,1
    • GeForce RTX 2070 Super FE
      89,4
    • Radeon VII
      74,7
    • Radeon RX 5700 XT
      73,2
    • Ryzen TR 3990WX
      53,6
    • GeForce GTX 1080 FE
      32,3
  • 4K Heavy GPU Effects (59.94FPS) – Export:
    • GeForce RTX 3080 FE
      69,8
    • GeForce RTX 2080 Ti FE
      54,4
    • GeForce RTX 2080 Super FE
      42,9
    • Radeon VII
      38,8
    • GeForce RTX 2070 Super FE
      38,2
    • Radeon RX 5700 XT
      26,2
    • GeForce GTX 1080 FE
      9,1
    • Ryzen TR 3990WX
      5,1
Einheit: Bilder pro Sekunde (FPS)

Post-Processing und Export in DaVinci Resolve

Als letzte Anwendung hat ComputerBase das Video-Bearbeitungsprogram DaVinci Resolve getestet. Auch in diesem Fall wurde auf eine Test-Umgebung von Puget Systems zurückgegriffen. Neben dem PugetBench für DaVinci Resolve Version 0.61 Beta (Download und ausführliche Beschreibung) wurden die GPUs im Standard Candle Benchmark von Sascha Haber getestet. Basis war jeweils DaVinci Resolve 16.2

DaVinci Resolve (Standard Candle Benchmark)
  • 09 Nodes:
    • GeForce RTX 3080 FE
      126,0
    • Radeon VII
      107,0
    • GeForce RTX 2080 Ti FE
      104,0
    • GeForce RTX 2070 Super FE
      78,0
    • Radeon RX 5700 XT
      69,0
    • GeForce GTX 1080 FE
      64,0
  • 18 Nodes:
    • GeForce RTX 3080 FE
      73,0
    • GeForce RTX 2080 Ti FE
      58,0
    • Radeon VII
      55,0
    • GeForce RTX 2070 Super FE
      43,0
    • Radeon RX 5700 XT
      37,0
    • GeForce GTX 1080 FE
      35,0
  • 30 Nodes:
    • GeForce RTX 3080 FE
      47,0
    • GeForce RTX 2080 Ti FE
      37,0
    • Radeon VII
      33,0
    • GeForce RTX 2070 Super FE
      27,0
    • Radeon RX 5700 XT
      23,0
    • GeForce GTX 1080 FE
      22,0
  • 66 Nodes:
    • GeForce RTX 3080 FE
      24,0
    • GeForce RTX 2080 Ti FE
      18,0
    • Radeon VII
      15,0
    • GeForce RTX 2070 Super FE
      13,0
    • Radeon RX 5700 XT
      11,0
    • GeForce GTX 1080 FE
      10,0
  • 1 TRN Node:
    • GeForce RTX 3080 FE
      141,0
    • GeForce RTX 2080 Ti FE
      128,0
    • Radeon VII
      112,0
    • GeForce RTX 2070 Super FE
      104,0
    • Radeon RX 5700 XT
      86,0
    • GeForce GTX 1080 FE
      84,0
  • 2 TRN Nodes:
    • GeForce RTX 3080 FE
      78,0
    • GeForce RTX 2080 Ti FE
      69,0
    • Radeon VII
      63,0
    • GeForce RTX 2070 Super FE
      54,0
    • Radeon RX 5700 XT
      43,0
    • GeForce GTX 1080 FE
      42,0
  • 4 TRN Nodes:
    • GeForce RTX 3080 FE
      42,0
    • GeForce RTX 2080 Ti FE
      36,0
    • Radeon VII
      33,0
    • GeForce RTX 2070 Super FE
      27,0
    • Radeon RX 5700 XT
      22,0
    • GeForce GTX 1080 FE
      21,0
  • 6 TRN Nodes:
    • GeForce RTX 3080 FE
      29,0
    • GeForce RTX 2080 Ti FE
      25,0
    • Radeon VII
      22,0
    • GeForce RTX 2070 Super FE
      19,0
    • GeForce GTX 1080 FE
      15,0
    • Radeon RX 5700 XT
      14,0
Einheit: Bilder pro Sekunde (FPS)

Im Standard-Candle-Benchmark geht die GeForce RTX 3080 FE erneut als Sieger vom Platz, die GeForce RTX 2080 Ti FE wird allerdings nur um 10 bis 30 Prozent geschlagen.

DaVinci Resolve (PugetBench 0.61 Beta)
  • Gesamtergebnis 4K:
    • GeForce RTX 3080 FE
      1.633,0
    • Radeon VII
      1.414,0
    • GeForce RTX 2080 Ti FE
      1.354,0
    • GeForce RTX 2070 Super FE
      1.116,0
    • Radeon RX 5700 XT
      908,0
    • GeForce GTX 1080 FE
      837,0
  • Gesamtergebnis 8K:
    • GeForce RTX 3080 FE
      582,0
    • Radeon VII
      537,0
    • GeForce RTX 2080 Ti FE
      524,0
    • GeForce RTX 2070 Super FE
      490,0
    • Radeon RX 5700 XT
      409,0
    • GeForce GTX 1080 FE
      397,0
Einheit: Punkte

In der Test-Suite von Puget Systems sind es 10 Prozent bei der Nutzung von 8K-Quellmaterial und 21 Prozent bei der Nutzung von 4K-Quellmaterial. Wie bei Adobe Premier Pro gilt, dass viele Szenarien im Test von der CPU abhängig sind, das gleicht die Ergebnisse an. Das Resultat in 8K ist darüber hinaus davon beeinträchtigt, dass der Testlauf nach 20 GB Grafikspeicher verlangt – die GeForce RTX 3090 mit 24 GB sollte hier schon allein deshalb deutlich stärker abschneiden.

AV1-Decoding mit Nvidia NVDEC

Keine klassische Anwendung, aber dennoch ein zukünftiges Alltagsszenario ist das Decoding des zukünftigen Video-Codes AV1. Bisher gelang das nur in Software, was in 8K selbst auf schnellen CPUs und GPUs nicht schnell genug vonstatten ging.

Grafikkarten auf Basis von Nvidia Ampere sind die ersten GPUs, die den neuen Internet-Video-Codec AV1 nativ in Hardware beschleunigen können. Damit können erstmals AV1-8K-Videos mit 60 FPS über YouTube flüssig wiedergegeben werden. Intels Xe-iGPU in Tiger Lake wird es in Kürze ebenfalls können.

GeForce-RTX-3000-Grafikkarten können AV1 über Nvidias Hardware-Decoder (NVDEC) decodieren. Voraussetzung sind aktuell allerdings noch Windows 10, die AV1 Extension aus dem Microsoft Store sowie Chrome 85 oder neuer. Unterstützt wird AV1 Profile 0 (monochrome/4:2:0, 8/10 bit) bis zu 8K mit 60 FPS. Details dazu liefert das Whitepaper zu Ampere GA102 ab Seite 33 (PDF).

Das nachfolgende Video zeigt die Wiedergabe des Videos „Japan in 8K“ auf YouTube mit AV1-Codec sowohl in 4K als auch 8K auf einer GeForce RTX 3080 (Ampere) im Vergleich zur GeForce RTX 2070 Super (Turing) und GeForce GTX 1080 (Pascal).

Bei der GeForce GTX 1080 und GeForce RTX 2070 Super werden in 8K über die Hälfte der Frames ausgelassen, zu langsam läuft das Decoding über die Shader und die CPU (Ryzen Threadripper 3990X) ab. Die GeForce RTX 3080 schafft die Wiedergabe mit 60 FPS über NVDEC hingegen mit wenigen ausgelassenen Frames. Ein zum Vergleich herangezogenes 8K-Video mit 30 FPS wurde gänzlich ohne „dropped Frames“ abgespielt.