Ryzen Threadripper 2000 im Test: 32 Kerne sind verrückt, 16 sehr gut nutzbar 2/4

Volker Rißka et al. 656 Kommentare

Testergebnisse zu Threadripper 2990WX & 2950X

AMD Ryzen Threadripper 2990WX und 2950X treten im Test gemeinsam auf einem Asus ROG Zenith Extreme an. Das BIOS wurde auf eine Beta-Version mit dem Stand Ende Juli aktualisiert. Das genutzte Testsystem entspricht ansonsten exakt dem aus dem großen Ryzen-2000-Test, in dem auch die Threadripper-Vorgänger enthalten waren, sodass die Vergleichbarkeit gegeben ist.

Laut AMD sollen alle Mainboards, die für den Sockel TR4 im Handel stehen, auch mit 32 Kernen umgehen können. Dafür bedarf es jeweils eines BIOS-Updates, das durch BIOS-Flashback aber nicht die gleichen Probleme hervorrufen soll wie bei Ryzen 2000, bei denen neue CPUs nur auf Mainboards bootfähig waren, die bereits das neue BIOS installiert hatten.

32 Kerne machen im Alltag (noch) Probleme

Die Beschränkung der beiden großen CPUs auf ein Quad-Channel-Interface dient nur indirekt der Abgrenzung von Epyc, denn schon die X399-Plattform sieht mit ihrem Sockel TR4 schlichtweg nur ein Quad-Channel-Speicherinterface vor. Auch die I/O wurde deshalb neu verlegt. Am Ende haben zwei der vier Dies deshalb nicht nur kein Speicherinterface, sondern gar keine Anschlüsse nach außen. Stattdessen werden die „Compute Dies“ intern an die beiden anderen „I/O Dies“ weitergegeben, die diese dann nach außen führen.

Im Worst-Case-Szenario führt das zwangsläufig zu höheren Latenzen, da Anfragen aus den Kernen der Compute Dies erst durch Schaltzentren und den Infinity Fabric On Package (IFOP) in den I/O-Die gelangen und von dort in den RAM gesendet werden müssen, um anschließend den gleichen Weg wieder zurück müssen. WikiChip hat dies in einem Schaubild anschaulich dargestellt.

Vom Compute Die über den I/O Die zum RAM – und zurück
Vom Compute Die über den I/O Die zum RAM – und zurück (Bild: WikiChip)

Die Speicherbandbreitenmessung von AIDA64 zeigt, mit welchen Einschränkungen die Art der Umsetzung einhergeht. So liegt die Speicherbandbreite in MB/s auf dem 32-Kerner unterhalb der des 2950X mit halb so vielen Kernen, obwohl an der Plattform nichts bis auf die CPU getauscht wurde und beide nach außen ein Quad-Channel-Interface bieten.

AIDA64 im Cache- und Speichertest: 2990WX vs. 2950X
AIDA64 im Cache- und Speichertest: 2990WX vs. 2950X

Dass der Redaktion hier keine Fehler unterlaufen sind, zeigt die Messung der Latenzen, denn die von AMD präsentierten Ergebnisse werden hier getroffen – und die Nachteile für den 2990WX werden ebenfalls sichtbar. Die Abweichungen beim DRAM sind damit zu erklären, dass AMD mit DDR4-3200 gemessen, ComputerBase aber das offizielle Maximum von DDR4-2933 genutzt hat.

AMD-Angaben zur Latenz Messung durch ComputerBase
L1 Cache 0,920 ns (2950X), 1 ns (2990WX) 0,9 ns (2950X), 1 ns (2990WX)
L2 Cache 2,76 ns (2950X), 2,9 ns (2990WX) 2,8 ns (2950X), 2,9 ns (2990WX)
L3 Cache 8,64 ns (2950X), 9,03 ns (2990WX) 8,6 ns (2950X), 9,0 ns (2990WX)
DRAM Latency 64 ns 68,3 ns (2950X), 67,1 ns (2990WX)

Was AMD vorab gegenüber der Presse nicht groß thematisiert hatte, sind die mit den Einschnitten (aktuell und) potentiell noch einhergehenden Leistungseinbußen in Anwendungen. Und auch mit 64 Threads müssen viele Programme überhaupt erst einmal umgehen können. Hier sei auch der Scheduler von Windows nicht unbeteiligt, so AMD. Zusammen mit Microsoft arbeitet man bereits daran, Windows für den Umgang mit mehr als 32 Threads auf Threadripper 2000 zu optimieren.

Die Software hat Probleme mit 64 Threads und dem Speicherinterface

Dass die Konfiguration der RAM-Controller nicht jeder Software schmeckt, zeigt sich beispielsweise im TrueCrypt-Nachfolger VeraCrypt in der aktuellsten Version 1.22. Die Leistung des 32-Kerners ist dort nur noch halb so hoch wie die des 16-Kerners und entspricht dem Niveau, das sich einstellen würde, wenn auf dem 32-Kerner nur der Dual-Channel-Speichermodus gefahren werden würde. Die Probe aufs Exempel mit nur zwei statt vier Speicherriegeln beim Ryzen Threadripper 2990WX gibt folglich exakt das gleiche Ergebnis wie mit vier Speicherriegeln aus: rund 10,5 GB/s. Aktuell schmeckt diesem Programm die Compute-Die-I/O-Die-Anordnung also gar nicht.

Threadripper 2950X mit 16 Kernen bringt das Quad-Channel-Speicherinterface hingegen immer zum Laufen und liefert so wie sein Vorgänger knapp 21 GB/s. Auch der Legacy-Modus im Ryzen Master Tool und die Halbierung der Kerne bringt beim 2990WX keine Besserung.

Auch 7-zip in der aktuellen Version 18.05 reagiert kaum auf den Unterschied zwischen zwei und vier Speicherbänken beim 2990WX: 107.335 MIPS sind es mit zwei Modulen, 111.624 MIPS im Quad-Channel-Betrieb. Das entspricht einer Steigerung von nur drei Prozent. Der 16-Kerner kommt bereits auf knapp 106.000 MIPS – auch hier bleibt letztlich die Skalierung über die zusätzlichen Speicherriegel und Kerne aus.

Andere Programme wie das Rendern in Cinebench oder POV-ray oder Anwendungen von Adobe skalieren mitunter zwar potentiell über die Threads, doch die Leistung des 2990WX liegt am Ende in einigen Fällen trotzdem unterhalb der des 2950X, weil die Bandbreite von Speicher/Fabric viel zu gering ist um die 32 Kerne mit ausreichend Daten zu versorgen. AMD hatte Redaktionen deshalb einen Arbeitstag vor dem Start noch drei zusätzliche Programme zum Testen zur Verfügung gestellt: alle drei sind Render-Programme. Der von ComputerBase unabhängig von Hersteller-Empfehlungen genutzte Parcours und diese Empfehlungen legen nahe, dass Rendering derzeit der wesentliche Anwendungsbereich ist, auf dem 32 Kerne zur Entfaltung kommen können. Und in der Tat werden viele Workstations genau für diesen Einsatzzweck angeschafft.

Aber auch hier gibt es Ausnahmen. Neben dem Standard-Benchmark in Blender, der den 2990WX vor dem 2950X sieht, kehrt sich das Bild in einer anderen Projektdatei sogar um: Während sie der 16-Kerner in einer Stunde fertigstellt, benötigt der 32-Kerner eine Stunde und 20 Minuten. Dabei spielt es keine Rolle, ob Blender in finaler Version 2.79 oder experimenteller Version 2.80 genutzt wird: Das spezifische Projekt kann auf AMDs Threadripper in beiden Fällen nicht alle Threads auslasten.

Auch ein zusätzlicher Test mit zwei Projekten in Handbrake mit der neuesten Version 1.1.1 sieht für den 32-Kerner eher schlecht aus. Zwar liegt er nahe am 16-Kerner, aber eben auch nicht davor. Auch hier scheitert es an der Auslastung der Kerne.

Benchmarks in Anwendungen

Ende Oktober hat AMD mit Ryzen Threadripper 2970WX und 2920X auch die 24- und 12-Kern-Variante der neue Generation vorgestellt. Der Testbericht Ryzen Threadripper 2000 im Test: 2990WX, 2970WX, 2950X und 2920X im Vergleich enthält nicht nur zu diesen zwei CPUs neue Messwerte, auch die Tests mit den 16- und 32-Kern-Varianten wurden wiederholt.

Zum Start im August fehlerhafte Treiber von Nvidia und ein damals potentiell erstmals präsentes Problem mit dem Testsystem der Redaktion in Spielen sind in diesen Ergebnissen nicht mehr enthalten. Die neuen Testergebnisse ersetzen die Ergebnisse aus dem alten Artikel damit vollumfänglich, die alten Messwerte wurden zur besseren Übersicht aber nicht entfernt.

Moderne Anwendungen profitieren von Kernen, Threads und Takt – in der Theorie. Denn im Standard-Testparours werden die im vorangegangenen Abschnitt im Details besprochenen Grenzen und Probleme mit den 64 Threads des Ryzen Threadripper 2990WX und seiner internen Architektur sichtbar. In der Spitze liegt die CPU 61 Prozent vor dem Ryzen Threadripper 2950X mit 16 Kernen, im schlechtesten Fall fehlen im 50 Prozent auf das kleinere Modell.

In Anbetracht dieser extremen Bandbreite verzichtet ComputerBase auf die Ausgabe eines durchschnittlichen Ratings, denn wie schnell der 32-Kern-Prozessor ist, lässt sich aktuell offensichtlich nur ganz konkret an der spezifisch genutzten Anwendung festmachen.

Zu bedenken gilt es: Ein Testparours für Prozessoren vom Celeron mit zwei Kernen bis zum High-End-Prozessor mit nun 64 Threads hat natürlich Schwächen, die insbesondere auch im Fokus auf die Mehr-Kern-Nutzung liegen. Blender mit der Standardszene zeigt den 2990WX beispielsweise nur knapp vor dem 2950X, weil der eigentliche Rendering-Prozessor extrem schnell abgeschlossen ist und die Initialisierungsphase, die nicht von vielen Kernen profitiert, damit einen immer höheren Anteil gewinnt.

Benchmarks in Spielen

Ende Oktober hat AMD mit Ryzen Threadripper 2970WX und 2920X auch die 24- und 12-Kern-Variante der neue Generation vorgestellt. Der Testbericht Ryzen Threadripper 2000 im Test: 2990WX, 2970WX, 2950X und 2920X im Vergleich enthält nicht nur zu diesen zwei CPUs neue Messwerte, auch die Tests mit den 16- und 32-Kern-Varianten wurden wiederholt.

Zum Start im August fehlerhafte Treiber von Nvidia und ein damals potentiell erstmals präsentes Problem mit dem Testsystem der Redaktion in Spielen sind in diesen Ergebnissen nicht mehr enthalten. Die neuen Testergebnisse ersetzen die Ergebnisse aus dem alten Artikel damit vollumfänglich, die alten Messwerte wurden zur besseren Übersicht aber nicht entfernt.

Für Spiele hat AMD auch mit Threadripper 2000 den bereits im vergangenen Jahr eingeführten Game Mode im Gepäck. Dieser halbiert beim 16-Kerner die Anzahl der Kerne und Threads, beim 32-Kerner werden diese sogar geviertelt. Damit will AMD Kompatibilitätsproblemen in Spielen entgegnen.

Im Vergleich zum Vorjahr war der Einsatz des Game Mode beim 16-Kern-Prozessor allerdings nicht mehr notwendig, um Spiele zur Zusammenarbeit zu bewegen. Etwas mehr Leistung lieferte der ein oder andere Titel in diesem Modus aber trotzdem: Mit dem Game Mode kann der Threadripper 2950X in einigen Spielen mit dem Ryzen 7 2700X gleichziehen. Das sollte im Idealfall auch so sein, denn die Taktraten liegen ebenfalls auf nahezu gleichem Niveau.

Der 2990WX braucht den „Game Mode“

Beim 32-Kerner musste der Game Mode hingegen zwingend zum Einsatz kommen, um Abstürzen in Far Cry 5 oder extrem niedrigen FPS in Total War vorzubeugen. Aber auch in anderen Titeln zogen die FPS mit weniger aktiven Kernen an. Auch in den Spielen wird am Ende aber auf das Rating verzichtet, weil es das Bild zu stark verzerrt.

Auf der nächsten Seite: Leistungsaufnahme und Temperatur