Ryzen Threadripper 2000 im Test: 32 Kerne sind verrückt, 16 sehr gut nutzbar

 2/4
Update Volker Rißka (+1)
656 Kommentare

Testergebnisse zu Threadripper 2990WX & 2950X

AMD Ryzen Threadripper 2990WX und 2950X treten im Test gemeinsam auf einem Asus ROG Zenith Extreme an. Das BIOS wurde auf eine Beta-Version mit dem Stand Ende Juli aktualisiert. Das genutzte Testsystem entspricht ansonsten exakt dem aus dem großen Ryzen-2000-Test, in dem auch die Threadripper-Vorgänger enthalten waren, sodass die Vergleichbarkeit gegeben ist.

Laut AMD sollen alle Mainboards, die für den Sockel TR4 im Handel stehen, auch mit 32 Kernen umgehen können. Dafür bedarf es jeweils eines BIOS-Updates, das durch BIOS-Flashback aber nicht die gleichen Probleme hervorrufen soll wie bei Ryzen 2000, bei denen neue CPUs nur auf Mainboards bootfähig waren, die bereits das neue BIOS installiert hatten.

32 Kerne machen im Alltag (noch) Probleme

Die Beschränkung der beiden großen CPUs auf ein Quad-Channel-Interface dient nur indirekt der Abgrenzung von Epyc, denn schon die X399-Plattform sieht mit ihrem Sockel TR4 schlichtweg nur ein Quad-Channel-Speicherinterface vor. Auch die I/O wurde deshalb neu verlegt. Am Ende haben zwei der vier Dies deshalb nicht nur kein Speicherinterface, sondern gar keine Anschlüsse nach außen. Stattdessen werden die „Compute Dies“ intern an die beiden anderen „I/O Dies“ weitergegeben, die diese dann nach außen führen.

Im Worst-Case-Szenario führt das zwangsläufig zu höheren Latenzen, da Anfragen aus den Kernen der Compute Dies erst durch Schaltzentren und den Infinity Fabric On Package (IFOP) in den I/O-Die gelangen und von dort in den RAM gesendet werden müssen, um anschließend den gleichen Weg wieder zurück müssen. WikiChip hat dies in einem Schaubild anschaulich dargestellt.

Vom Compute Die über den I/O Die zum RAM – und zurück
Vom Compute Die über den I/O Die zum RAM – und zurück (Bild: WikiChip)

Die Speicherbandbreitenmessung von AIDA64 zeigt, mit welchen Einschränkungen die Art der Umsetzung einhergeht. So liegt die Speicherbandbreite in MB/s auf dem 32-Kerner unterhalb der des 2950X mit halb so vielen Kernen, obwohl an der Plattform nichts bis auf die CPU getauscht wurde und beide nach außen ein Quad-Channel-Interface bieten.

AIDA64 im Cache- und Speichertest: 2990WX vs. 2950X
AIDA64 im Cache- und Speichertest: 2990WX vs. 2950X

Dass der Redaktion hier keine Fehler unterlaufen sind, zeigt die Messung der Latenzen, denn die von AMD präsentierten Ergebnisse werden hier getroffen – und die Nachteile für den 2990WX werden ebenfalls sichtbar. Die Abweichungen beim DRAM sind damit zu erklären, dass AMD mit DDR4-3200 gemessen, ComputerBase aber das offizielle Maximum von DDR4-2933 genutzt hat.

AMD-Angaben zur Latenz Messung durch ComputerBase
L1 Cache 0,920 ns (2950X), 1 ns (2990WX) 0,9 ns (2950X), 1 ns (2990WX)
L2 Cache 2,76 ns (2950X), 2,9 ns (2990WX) 2,8 ns (2950X), 2,9 ns (2990WX)
L3 Cache 8,64 ns (2950X), 9,03 ns (2990WX) 8,6 ns (2950X), 9,0 ns (2990WX)
DRAM Latency 64 ns 68,3 ns (2950X), 67,1 ns (2990WX)

Was AMD vorab gegenüber der Presse nicht groß thematisiert hatte, sind die mit den Einschnitten (aktuell und) potentiell noch einhergehenden Leistungseinbußen in Anwendungen. Und auch mit 64 Threads müssen viele Programme überhaupt erst einmal umgehen können. Hier sei auch der Scheduler von Windows nicht unbeteiligt, so AMD. Zusammen mit Microsoft arbeitet man bereits daran, Windows für den Umgang mit mehr als 32 Threads auf Threadripper 2000 zu optimieren.

Die Software hat Probleme mit 64 Threads und dem Speicherinterface

Dass die Konfiguration der RAM-Controller nicht jeder Software schmeckt, zeigt sich beispielsweise im TrueCrypt-Nachfolger VeraCrypt in der aktuellsten Version 1.22. Die Leistung des 32-Kerners ist dort nur noch halb so hoch wie die des 16-Kerners und entspricht dem Niveau, das sich einstellen würde, wenn auf dem 32-Kerner nur der Dual-Channel-Speichermodus gefahren werden würde. Die Probe aufs Exempel mit nur zwei statt vier Speicherriegeln beim Ryzen Threadripper 2990WX gibt folglich exakt das gleiche Ergebnis wie mit vier Speicherriegeln aus: rund 10,5 GB/s. Aktuell schmeckt diesem Programm die Compute-Die-I/O-Die-Anordnung also gar nicht.

Threadripper 2950X mit 16 Kernen bringt das Quad-Channel-Speicherinterface hingegen immer zum Laufen und liefert so wie sein Vorgänger knapp 21 GB/s. Auch der Legacy-Modus im Ryzen Master Tool und die Halbierung der Kerne bringt beim 2990WX keine Besserung.

Auch 7-zip in der aktuellen Version 18.05 reagiert kaum auf den Unterschied zwischen zwei und vier Speicherbänken beim 2990WX: 107.335 MIPS sind es mit zwei Modulen, 111.624 MIPS im Quad-Channel-Betrieb. Das entspricht einer Steigerung von nur drei Prozent. Der 16-Kerner kommt bereits auf knapp 106.000 MIPS – auch hier bleibt letztlich die Skalierung über die zusätzlichen Speicherriegel und Kerne aus.

Andere Programme wie das Rendern in Cinebench oder POV-ray oder Anwendungen von Adobe skalieren mitunter zwar potentiell über die Threads, doch die Leistung des 2990WX liegt am Ende in einigen Fällen trotzdem unterhalb der des 2950X, weil die Bandbreite von Speicher/Fabric viel zu gering ist um die 32 Kerne mit ausreichend Daten zu versorgen. AMD hatte Redaktionen deshalb einen Arbeitstag vor dem Start noch drei zusätzliche Programme zum Testen zur Verfügung gestellt: alle drei sind Render-Programme. Der von ComputerBase unabhängig von Hersteller-Empfehlungen genutzte Parcours und diese Empfehlungen legen nahe, dass Rendering derzeit der wesentliche Anwendungsbereich ist, auf dem 32 Kerne zur Entfaltung kommen können. Und in der Tat werden viele Workstations genau für diesen Einsatzzweck angeschafft.

Aber auch hier gibt es Ausnahmen. Neben dem Standard-Benchmark in Blender, der den 2990WX vor dem 2950X sieht, kehrt sich das Bild in einer anderen Projektdatei sogar um: Während sie der 16-Kerner in einer Stunde fertigstellt, benötigt der 32-Kerner eine Stunde und 20 Minuten. Dabei spielt es keine Rolle, ob Blender in finaler Version 2.79 oder experimenteller Version 2.80 genutzt wird: Das spezifische Projekt kann auf AMDs Threadripper in beiden Fällen nicht alle Threads auslasten.

Auch ein zusätzlicher Test mit zwei Projekten in Handbrake mit der neuesten Version 1.1.1 sieht für den 32-Kerner eher schlecht aus. Zwar liegt er nahe am 16-Kerner, aber eben auch nicht davor. Auch hier scheitert es an der Auslastung der Kerne.

Benchmarks in Anwendungen

Ende Oktober hat AMD mit Ryzen Threadripper 2970WX und 2920X auch die 24- und 12-Kern-Variante der neue Generation vorgestellt. Der Testbericht Ryzen Threadripper 2000 im Test: 2990WX, 2970WX, 2950X und 2920X im Vergleich enthält nicht nur zu diesen zwei CPUs neue Messwerte, auch die Tests mit den 16- und 32-Kern-Varianten wurden wiederholt.

Zum Start im August fehlerhafte Treiber von Nvidia und ein damals potentiell erstmals präsentes Problem mit dem Testsystem der Redaktion in Spielen sind in diesen Ergebnissen nicht mehr enthalten. Die neuen Testergebnisse ersetzen die Ergebnisse aus dem alten Artikel damit vollumfänglich, die alten Messwerte wurden zur besseren Übersicht aber nicht entfernt.

Moderne Anwendungen profitieren von Kernen, Threads und Takt – in der Theorie. Denn im Standard-Testparours werden die im vorangegangenen Abschnitt im Details besprochenen Grenzen und Probleme mit den 64 Threads des Ryzen Threadripper 2990WX und seiner internen Architektur sichtbar. In der Spitze liegt die CPU 61 Prozent vor dem Ryzen Threadripper 2950X mit 16 Kernen, im schlechtesten Fall fehlen im 50 Prozent auf das kleinere Modell.

In Anbetracht dieser extremen Bandbreite verzichtet ComputerBase auf die Ausgabe eines durchschnittlichen Ratings, denn wie schnell der 32-Kern-Prozessor ist, lässt sich aktuell offensichtlich nur ganz konkret an der spezifisch genutzten Anwendung festmachen.

Diagramme
Blender 2.80
    • AMD Ryzen TR 2990WX
      1:02
    • AMD Ryzen TR 2950X
      1:12
    • AMD Ryzen TR 1950X
      1:12
    • Intel Core i9-7900X
      1:24
    • AMD Ryzen TR 1920X
      1:24
    • Intel Core i7-7820X
      1:41
    • AMD Ryzen 7 2700X
      1:41
    • Intel Core i7-8086K LE
      1:54
    • Intel Core i7-8700K
      1:55
    • AMD Ryzen 7 2700
      1:59
    • AMD Ryzen 5 2600X
      2:09
    • Intel Core i7-8700T
      2:09
    • AMD Ryzen 5 2600
      2:16
    • Intel Core i5-8400
      2:43
    • Intel Core i7-7700K
      2:45
    • Intel Core i5-8500T
      3:14
    • Intel Core i7-8700T (35 Watt LT)
      3:21
    • AMD Ryzen 5 2400G
      3:28
    • AMD Ryzen 5 1400
      3:56
    • Intel Core i3-8100
      4:15
    • AMD Ryzen 3 2200G
      4:49
    • AMD Ryzen 3 1200
      5:34
    • AMD A10-7890K
      8:42
    • Intel Pentium Gold G5400
      9:06
    • AMD A12-9800E
      9:33
    • Intel Pentium G4560
      9:39
Einheit: Minuten, Sekunden

Zu bedenken gilt es: Ein Testparours für Prozessoren vom Celeron mit zwei Kernen bis zum High-End-Prozessor mit nun 64 Threads hat natürlich Schwächen, die insbesondere auch im Fokus auf die Mehr-Kern-Nutzung liegen. Blender mit der Standardszene zeigt den 2990WX beispielsweise nur knapp vor dem 2950X, weil der eigentliche Rendering-Prozessor extrem schnell abgeschlossen ist und die Initialisierungsphase, die nicht von vielen Kernen profitiert, damit einen immer höheren Anteil gewinnt.

Benchmarks in Spielen

Ende Oktober hat AMD mit Ryzen Threadripper 2970WX und 2920X auch die 24- und 12-Kern-Variante der neue Generation vorgestellt. Der Testbericht Ryzen Threadripper 2000 im Test: 2990WX, 2970WX, 2950X und 2920X im Vergleich enthält nicht nur zu diesen zwei CPUs neue Messwerte, auch die Tests mit den 16- und 32-Kern-Varianten wurden wiederholt.

Zum Start im August fehlerhafte Treiber von Nvidia und ein damals potentiell erstmals präsentes Problem mit dem Testsystem der Redaktion in Spielen sind in diesen Ergebnissen nicht mehr enthalten. Die neuen Testergebnisse ersetzen die Ergebnisse aus dem alten Artikel damit vollumfänglich, die alten Messwerte wurden zur besseren Übersicht aber nicht entfernt.

Für Spiele hat AMD auch mit Threadripper 2000 den bereits im vergangenen Jahr eingeführten Game Mode im Gepäck. Dieser halbiert beim 16-Kerner die Anzahl der Kerne und Threads, beim 32-Kerner werden diese sogar geviertelt. Damit will AMD Kompatibilitätsproblemen in Spielen entgegnen.

Im Vergleich zum Vorjahr war der Einsatz des Game Mode beim 16-Kern-Prozessor allerdings nicht mehr notwendig, um Spiele zur Zusammenarbeit zu bewegen. Etwas mehr Leistung lieferte der ein oder andere Titel in diesem Modus aber trotzdem: Mit dem Game Mode kann der Threadripper 2950X in einigen Spielen mit dem Ryzen 7 2700X gleichziehen. Das sollte im Idealfall auch so sein, denn die Taktraten liegen ebenfalls auf nahezu gleichem Niveau.

Der 2990WX braucht den „Game Mode“

Beim 32-Kerner musste der Game Mode hingegen zwingend zum Einsatz kommen, um Abstürzen in Far Cry 5 oder extrem niedrigen FPS in Total War vorzubeugen. Aber auch in anderen Titeln zogen die FPS mit weniger aktiven Kernen an. Auch in den Spielen wird am Ende aber auf das Rating verzichtet, weil es das Bild zu stark verzerrt.

1.920 × 1.080
Total War: Warhammer – 1.920 × 1.080
  • FPS, Durchschnitt:
    • Intel Core i7-8086K LE
      62,5
    • Intel Core i7-8700K
      59,6
    • Intel Core i7-8700T (35 Watt LT)
      55,7
    • Intel Core i7-8700T
      55,2
    • Intel Core i5-8400
      50,2
    • TR 2950X (Game Mode 8C/16T)
      49,8
    • AMD Ryzen 7 2700X
      49,2
    • AMD Ryzen 5 2600X
      47,9
    • AMD Ryzen 5 2600
      47,6
    • TR 2990WX (Game Mode 8C/16T)
      46,9
    • AMD Ryzen 7 2700
      46,7
    • Intel Core i7-7700K
      46,7
    • TR 2950X (Default 16C/32T)
      44,7
    • AMD Ryzen 7 1800X
      44,0
    • Intel Core i5-8500T
      43,9
    • AMD Ryzen 5 1600X
      43,2
    • AMD Ryzen TR 1920X
      41,5
    • Intel Core i9-7900X
      39,3
    • Intel Core i7-7820X
      38,9
    • AMD Ryzen TR 1950X
      38,4
    • AMD Ryzen 5 2400G
      35,3
    • Intel Core i3-8100
      33,8
    • TR 2990WX (Custom Mode 16C/32T)
      33,3
    • Intel Pentium Gold G5400
      27,7
    • Intel Pentium G4560
      27,2
    • TR 2990WX (Default 32C/64T)
      9,9
  • 99th Percentile (Frametimes in FPS):
    • Intel Core i7-8086K LE
      51,1
    • Intel Core i7-8700K
      48,3
    • Intel Core i7-8700T
      46,1
    • Intel Core i7-8700T (35 Watt LT)
      45,8
    • AMD Ryzen 7 2700X
      42,2
    • TR 2950X (Game Mode 8C/16T)
      41,7
    • AMD Ryzen 7 2700
      41,3
    • TR 2990WX (Game Mode 8C/16T)
      40,5
    • AMD Ryzen 5 2600X
      39,2
    • AMD Ryzen 7 1800X
      39,1
    • AMD Ryzen 5 2600
      39,1
    • TR 2950X (Default 16C/32T)
      39,0
    • AMD Ryzen TR 1920X
      37,6
    • Intel Core i5-8400
      36,9
    • AMD Ryzen 5 1600X
      36,2
    • Intel Core i9-7900X
      35,7
    • Intel Core i7-7820X
      33,7
    • Intel Core i7-7700K
      33,3
    • Intel Core i5-8500T
      32,7
    • AMD Ryzen TR 1950X
      31,4
    • TR 2990WX (Custom Mode 16C/32T)
      27,7
    • Intel Core i3-8100
      26,0
    • AMD Ryzen 5 2400G
      25,4
    • Intel Pentium Gold G5400
      21,0
    • Intel Pentium G4560
      20,1
    • TR 2990WX (Default 32C/64T)
      7,1
Einheit: Bilder pro Sekunde (FPS)