Next-Gen-Grafikkarten: Unbekannte Nvidia-GPUs im Geekbench aufgetaucht

Update 2.3.2020 10:38 Uhr

Bild: Nvidia

Zwei Geekbench-Ergebnisse sind die Tage in den Fokus gerückt, denn sie wurden mit noch nicht erschienenen Nvidia-Grafikkarten erstellt. Sie stammen zwar bereits von Ende 2019, sind aber erst am Wochenende aufgefallen. Bei den verwendeten GPUs handelt es sich möglicherweise um die (professionelle) Next-Gen-Generation Ampere.

Das sind die Fakten

Die zwei Einträge in Geekbench stammen von zwei verschiedenen Grafikkarten beziehungsweise Konfigurationen. Das schnellere Modell ist laut dem Benchmark mit 118 Compute Units ausgestattet, die Frequenz ist mit 1,11 GHz angegeben, der Speicherausbau mit 24 GB. Das langsamere Modell greift auf 108 Compute Units zurück, die mit 1,01 GHz arbeiten und auf einen 47 GB großen Speicher zurückgreifen können.

Geekbench-Ergebnisse mit 118 Compute Units (Bild: Geekbench)

Geekbench-Ergebnisse mit 108 Compute Units — Geekbench-Ergebnisse mit 118 Compute Units (Bild: Geekbench)

Die schnellere Karte kommt auf einen OpenCL-Score von 184.096 Punkten, die langsamere auf 141.654 Punkte. Zur Einordnung: Die GeForce RTX 2080 Ti kommt auf 129.019 Punkte, die Titan V auf 132.601 Punkte und die professionelle Tesla V100 in der PCIe-Version auf 153.741 Punkte. Die schnellere Variante schneidet also um 42 Prozent besser als die GeForce RTX 2080 Ti und 20 Prozent besser als die Tesla V100 ab, die langsamere muss sich dem aktuellen Tesla-Topmodell hingegen geschlagen geben.

Wie sind die Einträge zu deuten?

Das sind die Fakten, aber wie sind sie zu interpretieren? Zuerst stellt sich die wichtige Frage, ob die Ergebnisse überhaupt echt sind. Mit Sicherheit lässt das nicht beantwortet. So kann zum Beispiel die krumme Speicherbestückung von 47 Gigabyte ein Auslesefehler des Tools sein. Genauso ist aber denkbar, dass Nvidia Experimente durchgeführt hat und im Zuge dessen zum Beispiel ALUs und Speicher deaktiviert hat. Daher lässt sich aktuell nicht verifizieren, ob die Benchmarks stimmig sind. Diese sollten aber auf jeden Fall mit einer ordentlichen Portion Skepsis gesehen werden.

Wenn Nvidia bei der neuen GPU-Generation das Verhältnis der ALUs pro „Compute Unit“, Nvidia nennt diese bei den GeForce-Produkten „Streaming Multiprocessor“, nicht geändert hat, laufen 118 CUs auf 7.552 ALUs hinaus, 108 CUs auf 6.912 ALUs (jede CU hat 64 ALUs bei Volta und Turing). Die GeForce RTX 2080 Ti kann auf 4.352 ALUs zurückgreifen, die Tesla V100 auf 5.120. Das Plus würde also bei knapp 50 Prozent gegenüber der professionellen Lösung liegen.

Die angegebenen Taktraten sind zu niedrig

Die angegebenen Taktraten von 1,11 GHz und 1,01 GHz sind sehr niedrig. Geekbench meldet gewöhnlich den durchschnittlichen Turbo, der bei der Tesla V100 1.455 MHz beträgt. Da es unwahrscheinlich erscheint, dass Nvidia den Takt so stark senken muss und dies das Plus an Rohleistung fast wieder auffressen würde, ist es wahrscheinlicher, dass die Modelle entweder noch nicht mit dem finalen Takt arbeiten, oder er schlicht falsch ausgelesen wird. Wäre er zu niedrig eingestellt gewesen, müsste die Leistung allerdings noch steigerungsfähig sein.

Die Speicherkapazitäten sollen bei dem schnelleren Modell bei 23,8 GB, bei dem langsameren bei 46,8 GB liegen. Daraus lässt sich per se wenig schließen, denn vor allem im Experimentalstatus neuer Hardware kann viel herumprobiert werden. 47 sollten am Ende allerdings 48 sein. Beide Kapazitäten lassen sich sowohl mit GDDR6 als auch mit HBM2E realisieren und aktuell bietet Nvidia mit der Quadro RTX 8000 schon eine Grafikkarte mit 48 GB an.

Ende März könnte die Situation klarer werden

Am Ende stellt sich dann noch die Frage, ob die Ergebnisse von Consumer- oder von professionellen Produkten stammen. Die Redaktion geht aktuell von professionellen Tesla-Produkten aus, darauf deutet alleine der Speicherausbau von 48 GB hin. Denn der Speicherausbau scheint selbst für eine potentielle nächste Titan viel zu hoch. Darüber hinaus wird die neue Profi-Generation bereits in Kürze erwartet, sie wird vermutlich auf der Hausmesse GTC Ende März vorgestellt.

Die Consumer-Modelle der GeForce-Reihe erscheinen dagegen vermutlich einige Monate später, entsprechend wären die Benchmark-Einträge von Oktober und November sehr früh. Hinzu kommt der unrealistisch große Speicher. Wenn es sich tatsächlich um die Profi-Generation Ampere handelt (selbst deren finaler Name ist noch nicht gesichert), stellt sich die Frage, in wie weit die Consumer-Produkte technische Anpassungen erhalten werden. Denn Nvidia passt die Profi-Produkte für den HPC/KI-Markt immer stärker an dessen Anforderungen an, Spiele und zum Beispiel Renderprogramme haben andere Anforderungen, die für optimale Ergebnisse auch andere Hardware benötigen.

Update 03.03.2020 16:42 Uhr

Es ist noch ein weiteres Geekbench-Ergebnis einer dritten Nvidia-Grafikkarte beziehungsweise eine weitere Konfiguration aufgetaucht, die wohlmöglich der professionellen Generation Ampere entsprechen. Diese attestiert der Grafikkarte 124 Compute Units, was 7.936 und damit 384 zusätzliche ALUs entspricht. Die Taktrate ist mit 1,11 GHz erneut sehr niedrig. Der Speicher liegt mit 32 GB dieses Mal in der Mitte der beiden anderen Konfigurationen. Die Benchmarks an sich sind nicht miteinander vergleichbar, da die neue Testreihe mit CUDA und nicht mit OpenCL durchgeführt worden ist. Allerdings verrät CUDA dafür den Speichertakt, der bei 1,2 GHz liegt, was wenig verwunderlich auf HBM2 hindeutet. Bei vier HBM2-Stacks würde die Bandbreite so bei 1,2 TB/s liegen, bei sechs Stacks wären es satte 1,8 TB/s.

Nice find (Credit to @W_At_Ar_U )

> 7936 Cuda cores (124 CU/SM)
> 1.1GHz core clock
> 32GB of VRAM (ECC) running at 1.2GHz so HBM2 on a 4096-bit bus
> Driver 445.01
> 32MB of L2 cache
> Two Async Engines
> Not a multi-GPU boardhttps://t.co/zt2iEfjjaF https://t.co/L43VyHSVXn pic.twitter.com/iCp1IBDCnV
— _rogame (@_rogame) March 3, 2020