GeForce GTX 1080 im Test: Ein Paukenschlag in 16 nm mit 1,8 GHz und GDDR5X

 11/13
Wolfgang Andermahr
1.638 Kommentare

Sondertests

Pascal basiert auf Maxwell, Anpassungen finden sich im Detail. Dem Standard-Parcours sind deren Auswirkungen nur schwer zu entnehmen, die nachfolgenden Sondertests beleuchten sie hingegen im Detail.

Pascal profitiert tatsächlich von Async Compute

Nvidias Maxwell-GPU konnte anders als aktuelle Radeon-Grafikkarten nicht signifikant von der Low-Level-API DirectX 12 profitieren. Ein Grund dafür ist in Nvidias sehr gutem DirectX-11-Treiber zu suchen, der oft schon die DirectX-12-Performance (oder bessere im GPU-Limit) mit der alten API bringt. Der andere liegt im Feature Async-Compute, durch das Nvidia in den bisher verfügbaren Tests höchstens langsamer und nicht schneller wurde. Mit Pascal soll sich das ändern.

Um dem Versprechen nachzugehen, muss zunächst das von Microsoft entwickelte nBodyGravity-Sample aus dem DX12-SDK herhalten, was jedoch in einer von AMD veränderten Version genutzt wird, die eine höhere GPU-Last erzeugt als das Original-Sample. Vergleiche haben gezeigt, dass dieses mit dem höheren Grafik-Workload tatsächlich GPUs besser auslastet, wobei dies jedoch nicht zugunsten eines GPU-Entwicklers geht.

MS DX12-Sample „nBodyGravity“ (GPUOpen) – Vorteil durch Async Compute -10-4281420Prozent 8.192 Particles16.384 Particles32.768 Particles65.536 Particles  AMD Radeon R9 Fury X  Nvidia GeForce GTX 980 Ti  Nvidia GeForce GTX 1080

Und in der Tat zeigt das modifizierte DirectX-12-Sample ein bessere Async Compute auf Pascal als noch auf Maxwell. Während die letzte GeForce-Generation unabhängig von der Anzahl der genutzten Partikel nur langsamer wird, kann die GP104-GPU auf der GeForce GTX 1080 tatsächlich leicht zulegen.

Pascal ist die erste Nvidia-Grafikkarte, die von Async Compute profitiert

So liefert die neue Grafikkarte bei 8.192 Partikel eine um 2,5 Prozent bessere Leistung, bei 16.384 Partikel bleibt davon noch ein Prozent übrig. Auch bei 65.536 Partikel zeigt sich kein Leistungsverlust. Zwar kann AMDs GCN-GPU massiv mehr von Async Compute profitieren, jedoch hat AMD auch anders als Nvidia Schwierigkeiten, die vielen ALUs auszulasten – und unter anderem genau dort ist Async Compute hilfreich. Alleine deswegen schneidet AMD automatisch besser als Nvidia ab. Nvidias Problem war bis jetzt immer nur, dass die Maxwell-Grafikkarten mit dem Feature langsamer als ohne werden.

Ashes of the Singularity ist derzeit leider das einzige DirectX-12-Spiel, bei dem sich Async Compute gezielt an- oder abschalten lässt. Dennoch reicht dieses aus, um der GeForce GTX 1080 ein gutes Zeugnis auszustellen. So kann die Pascal-Grafikkarte in 2.560 × 1.440 immerhin um drei Prozent mit Async Compute zulegen, während die GeForce GTX 980 Ti genau jene drei Prozent langsamer wird. Und in den anderen Szenarien ändert sich nicht viel an dem Bild. Die GeForce GTX 1080 wird zu keiner Zeit langsamer durch Async Compute.

Async Compute
Ashes of the Singularity – Async Compute
  • 2.560 × 1.440, Extreme-Preset – kompletter Benchmark:
    • GeForce GTX 1080 @ DX12 + Async
      65,6
    • GeForce GTX 1080 @ DX12
      63,8
    • GeForce GTX 1080 @ DX11
      62,1
    • Radeon R9 Fury X @ DX12 + Async
      57,8
    • Radeon R9 Fury X @ DX12
      52,9
    • GeForce GTX 980 Ti @ DX11
      46,9
    • GeForce GTX 980 Ti @ DX12
      46,7
    • Radeon R9 Fury X @ DX11
      46,6
    • GeForce GTX 980 Ti @ DX12 + Async
      45,4

Damit macht das DirectX-12-Feature auf der GP104- und auch allen kommenden Pascal-GPU einen Schritt nach vorne. Dieses mag zwar noch nicht so effektiv wie AMDs äußerst gelungene Integration sein, bringt nun jedoch auch auf GeForce-Karten das ein oder andere Prozent an Leistung anstatt es zu vernichten.

Die große Stärke Tessellation weiter ausgebaut?

Tessellation war schon immer eine Stärke der Nvidia-Grafikkarten. Der SubD11-Test aus dem Microsoft-SDK zeigt auch in diesem Fall schnell, ob es Änderungen bei der Performance gegeben hat – denn es lässt sich jeder der 64 Tessellation-Faktoren separat einstellen. Und in der Tat gibt es eine interessante Entdeckung.

Beim Blick auf die Ergebnisse gilt es zu bedenken, dass die GeForce GTX 980 Ti über 22 Polymorph-Engines und damit 22 Tessellation-Einheiten verfügt, die GeForce GTX 1080 jedoch nur über deren 20. Allerdings taktet in dem Test die neue Pascal-Grafikkarte knapp 60 Prozent höher. Eine bis zu 50 Prozent höhere Leistung könnte man also erwarten, ganz ankommen tut sie nicht.

DirectX SDK - SubD11 Tessellation 06001.2001.8002.4003.000Bilder pro Sekunde (FPS) Faktor 1Faktor 3Faktor 5Faktor 7Faktor 9Faktor 11Faktor 13Faktor 15Faktor 17Faktor 19Faktor 21Faktor 23Faktor 25Faktor 27Faktor 29Faktor 31Faktor 33Faktor 35Faktor 37Faktor 39Faktor 41Faktor 43Faktor 45Faktor 47Faktor 49Faktor 51Faktor 53Faktor 55Faktor 57Faktor 59Faktor 61Faktor 63  AMD Radeon R9 Fury X  Nvidia GeForce GTX 980 Ti  Nvidia GeForce GTX 1080

Interessant ist: Umso niedriger die Tessellation-Faktoren sind, desto besser kann sich die GeForce GTX 1080 von der GeForce GTX 980 Ti in dieser Disziplin absetzen. Knapp 45 Prozent mehr Leistung – und damit fast ein optimales Ergebnis, zeigt sich dann. Ab dem Tessellation-Faktor 26 zeigt sich dann jedoch ein Einbruch.

Zwischen den Faktoren 26 und 36 ist Pascal plötzlich nur noch gleich schnell bis zehn Prozent zügiger und nimmt erst danach wieder Fahrt auf. Bei hohen Faktoren ist der GP104 plötzlich wieder 20 bis 25 Prozent voraus. Warum die GeForce GTX 1080 bei den mittleren Faktoren so stark einbricht und dann wieder anzieht, ist derzeit unklar. AMDs Grafikkarten werden trotzdem noch deutlich geschlagen.

Auf der nächsten Seite: Der GDDR5X könnte noch schneller sein