AMD Ryzen Threadripper im Test: 1950X und 1920X im Duell mit Core X

Volker Rißka et al. 744 Kommentare
AMD Ryzen Threadripper im Test: 1950X und 1920X im Duell mit Core X

tl;dr: Mit Ryzen Threadripper 1950X und 1920X mit 16 respektive 12 Kernen tritt AMD jetzt auch mit Intels High-End-Plattform rund um Core X in direkte Konkurrenz. Und das gilt nicht nur bei der Leistung im Test: Auch in Sachen Ausstattung kann sich die neue Plattform mit riesigem Sockel TR4 und X399-Chipsatz sehen lassen.

Ryzen Threadripper 1950X, 1920X und 1900X im Detail

Mit Ryzen 5 (Test) und Ryzen 3 (Test) hat AMD das Angebot an Zen-CPUs für Privatanwender nach dem Auftakt mit Ryzen 7 (Test) am 2. März zuletzt nach unten hin erweitert, mit Ryzen Threadripper kommt jetzt die erste echte High-End-Plattform seit vielen Jahren am oberen Ende dazu – auch die Preismarke von 1.000 Euro teuren Prozessoren im Desktop fällt seit über einer Dekade bei AMD erstmals wieder.

Während alle bisher verfügbaren Prozessoren auf die AM4-Plattform setzen, benötigt Threadripper Sockel TR4 mit Chipsatz X399. Die Basis bietet nicht nur den CPUs mit bis zu 16 Kernen Platz, sie bietet auch ein Quad-Channel-Speicherinterface und PCIe-Lanes satt. Damit tritt AMD in direkte Konkurrenz zu Intels Core-X-Prozessoren mit Skylake-X (Test).

Drei AMD Threadripper, zwei ab sofort verfügbar

Drei CPUs der neuen Serie bringt AMD zum Start auf den Markt: Ryzen Threadripper 1950X, 1920X und 1900X. Wobei es die beiden großen Modelle ab heute, das kleinste hingegen erst ab Ende August geben wird. Insgesamt erhöht sich das Portfolio an Ryzen-CPU damit auf zwölf Modelle für den Desktop.

AMD Ryzen Threadripper 1950X und 1920X im Test
AMD Ryzen Threadripper 1950X und 1920X im Test

Heraus sticht bei den neuen Prozessoren natürlich die im Extremfall von 8 auf 16 verdoppelte Anzahl an Kernen, die nicht zu Ungunsten des Taktes geht. So taktet das Topmodell 1950X bei Last auf maximal vier Kernen sogar höher als der Ryzen 7 1800X, bei Last auf mehr Kernen herrscht Gleichstand. Der Preis: Die TDP verdoppelt sich ausgehend von 95 Watt ebenfalls fast, 180 Watt setzt AMD für alle drei Threadripper-Prozessoren an.

AMDs Ryzen-CPUs für den Desktop
Kerne/Threads Takt Basis Turbo (inkl. XFR)
1 / 2 / 4 / 4+ Kerne
L2/L3-Cache TDP UVP
Ryzen Threadripper 1950X 16 / 32 3,4 GHz 4,2 / 4,2 / 4,2 / 3,7 GHz 8 MB/32 MB 180 Watt 1.039 Euro
Ryzen Threadripper 1920X 12 / 24 3,5 GHz 4,2 / 4,2 / 4,2 / 3,7 GHz 6 MB/32 MB 180 Watt 829 Euro
Ryzen Threadripper 1900X 8 / 16 3,5 GHz 4,2 / 4,2 / 4,2 / 3,8 GHz 4 MB/32 MB 180 Watt 549 US-Dollar
Ryzen 7 1800X 8 / 16 3,6 GHz 4,1 / 4,0 / 3,7 / 3,7 GHz 4 MB/16 MB 95 Watt 440 Euro
Ryzen 7 1700X 8 / 16 3,4 GHz 3,9 / 3,8 / 3,5 / 3,5 GHz 4 MB/16 MB 95 Watt 338 Euro
Ryzen 7 1700 8 / 16 3,0 GHz 3,75 / 3,7 / 3,2 / 3,2 GHz 4 MB/16 MB 65 Watt 285 Euro
Ryzen 5 1600X 6 / 12 3,6 GHz 4,1 / 4,0 / 3,7 / 3,7 GHz 3 MB/16 MB 95 Watt 237 Euro
Ryzen 5 1600 6 / 12 3,2 GHz 3,7 / 3,6 / 3,4 / 3,4 GHz 3 MB/16 MB 65 Watt 200 Euro
Ryzen 5 1500X 4 / 8 3,5 GHz 3,9 / 3,7 / 3,6 / – GHz 2 MB/16 MB 65 Watt 176 Euro
Ryzen 5 1400 4 / 8 3,2 GHz 3,45 / 3,4 / 3,2 / – GHz 2 MB/8 MB 65 Watt 154 Euro
Ryzen 3 1300X 4 / 4 3,4 GHz 3,9 / 3,7 / 3,6 / – GHz 2 MB/8 MB 65 Watt 127 Euro
Ryzen 3 1200 4 / 4 3,1 GHz 3,45 / 3,4 / 3,1 / – GHz 2 MB/8 MB 65 Watt 106 Euro

Turbo und XFR sind mehrteilig

Turbo ist nicht XFR, das gilt auch für Threadripper. Während beispielsweise der „garantierte“ Basistakt des 1950X bei nur 3,4 GHz liegt, können für Last auf allen 16 Kernen maximal 3,7 GHz zur Verfügung gestellt werden, erklärt AMD. Bei Last auf nur vier aktiven Kernen werden 4,0 GHz freigeschaltet, mit XFR kommen, sofern Temperatur und Leistungsaufnahme es zulassen, weitere 200 MHz hinzu. Bei Ryzen 7/5/3 gibt es XFR nur bis maximal Zwei-Kern-Last. Das Turbo- und XFR-Verhalten gilt auch für den 1920X und mit Ausnahme der Mehr-als-vier-Kerne-Last auch für den Ende August erwarteten 1900X.

AMD Ryzen Threadripper 1950X im maximalen XFR-Takt
AMD Ryzen Threadripper 1950X im maximalen XFR-Takt

Threadripper sind doppelte Ryzen und irgendwie auch halbe Epyc

Die neuen Prozessoren sehen auf den ersten Blick zwar so aus wie die Epyc-Server-CPUs, intern sind es jedoch eher zwei Ryzen, sagt AMD. Warum vier statt zwei Kerne mit dem XFR-Aufschlag bedacht werden können erklärt sich damit ebenso wie die Tatsache, dass die Threadripper-CPUs noch im B1-Stepping aufgelegt sind, während Epyc bereits ein B2-Stepping vorweist, welche minimal Fehlerkorrekturen vornimmt, die für Endkunden im Alltag aber nicht relevant sind.

AMD hat, wie Joe Macri gegenüber ComputerBase erklärte, seit Monaten Dies für Threadripper gesammelt, es sollen ungefähr die besten fünf Prozent aus der Produktion aufgehoben worden sein.

Auch bei den Eckdaten abseits von Takt und Kernen sind die Threadripper im wahrsten Sinne doppelte Ryzen 7 1700X/1800X respektive Ryzen 5. Neben 8 MB L3-Cache pro CCX verfügen die Prozessoren über 512 KB L2-Cache pro Kern – summa summarum sind es insgesamt 8 MByte L2-Cache und 32 MByte L3-Cache beim Ryzen Threadripper 1950X.

Beim Vollausbau Ryzen Threadripper 1950X mit seinen 16 Kernen bestehen die beiden Dies aus jeweils zwei CCX, die jeweils alle vier Kerne aktiviert haben. Beim 12-Kerner 1920X sind es folglich jeweils 3 Kerne eines CPU Complex (CCX), er ist damit quasi ein doppelter Ryzen 5 1600X. Wie von Ryzen bekannt, erfolgt die Aufteilung der aktiven Kerne immer einheitlich über die CCX hinweg.

Quad-Channel und 60 freie PCIe-Lanes

Der doppelte Ryzen 5/7 zeigt sich auch an anderer Stelle: Der Speichercontroller ist nun ebenfalls zweifach vertreten, auch die Anzahl der PCIe-Lanes wird massiv erhöht. Allerdings lässt hier auch Epyc grüßen. Denn statt zwei Mal 24 PCIe-Lanes von Ryzen stehen insgesamt 64 PCIe-Lanes zur Verfügung und damit die Hälfte von Epyc.

Vier der 64 Lanes sind für den Chipsatz und seine Anbindung an die CPU reserviert – somit bleiben 60 zur freien Verfügung für die Mainboardhersteller. Bei Ryzen sind es 20. Gängige Konfigurationen werden auf dieser Basis 3 × x16 für Grafikarten zuzüglich 4 × x4 für M.2 (NVMe) oder 2 × x16 plus 2 × x8 und 3 × x4 für SSDs. Weitere Kombinationen sind natürlich nicht ausgeschlossen, Storage-Plattform für maximal 16 SATA-Geräte oder sechs NVMe-Lösungen bei insgesamt sieben PCIe-Geräten sind denk- und realisierbar.

Zwei Dies arbeiten bei Threadripper zusammen
Zwei Dies arbeiten bei Threadripper zusammen (Bild: AMD)

Zwei der vier Dies auf dem Package sind Dummys

Die zwei aktiven Dies eines Threadripper-Prozessors sind auf dem riesigen neuen Package für den Sockel TR4 diagonal angeordnet, die jeweils flankierenden Gegenstücke sind leere Dummy-Dies, und eben keine zwei deaktivierten Dies einer Epyc-CPU mit nativ 32 Kernen respektive 8 CCX. In diesem Punkt ist AMDs Aussage also definitiv zutreffend: Ryzen Threadripper ist kein teildeaktivierter Epyc.

Der Einsatz der Dummys soll dem verlöteten Heatspreader eine gleichmäßige Auflagefläche bieten, auf den dann wiederum die (wuchtigen) Kühler geschraubt werden. Und für AMD ergeben sich daraus weitere praktische und wirtschaftlich positive Folgen: Threadripper unterscheidet sich in der End-Fertigung nicht von den Epyc-Server-Prozessoren, bei denen vier aktive Dies auf dem Package unter dem Heatspreader identisch angeordnet sind.

RAM-Konfigurationen für Ryzen Threadripper

Da der eigentliche CPU-Complex (CCX) bei Ryzen Threadripper unverändert geblieben ist und dieser den Speichercontroller beinhaltet, ändert sich an der Speicherunterstützung nichts. Auch Ryzen Threadripper unterstützt offiziell maximal DDR4-2666 und es gelten dieselben Konfigurationsmöglichkeiten wie schon bei Ryzen 3, 5 und 7 – nur in jetzt doppelter Ausführung der Anzahl der Module. Die nachfolgende Tabelle weist die offiziell unterstützten maximalen Taktraten nochmals aus.

Maximaler Takt in Abhängigkeit von Modulanzahl und Rank
Anzahl Module Modul-Typ maximaler Takt
4 Single Rank DDR4-2666
4 Dual Rank DDR4-2400
8 Single Rank DDR4-2133
8 Dual Rank DDR4-1866

Eine Besonderheit gibt es aber doch, auch sie ist von Epyc bekannt: Ryzen Threadripper unterstützt im Gegensatz zu Ryzen offiziell alle Formen von UDIMMs, 512 GByte pro Channel sind theoretisch möglich und damit ein Vollausbau von 2 TByte. Da es solche Module bisher aber nicht gibt, ist diese Unterstützung aktuell nur theoretischer Natur. Die meisten Mainboardhersteller schicken ihre Platinen deshalb mit Unterstützung für insgesamt 128 GByte DDR4-Speicher (8 × 16 GByte) ins Rennen.

Dass unabhängig von dieser offiziellen Unterstützung weitere Konfigurationen möglich sind und unter Umständen sogar einen Geschwindigkeitsvorteil bringen, haben die Benchmarks mit bis zu DDR4-3200 für AMD Ryzen und Intel Core i gezeigt.

NUMA/UMA-Schalter und Kompatibilitätsmodus

Ein Quasi-Server-Prozessor bringt mit mehr Kernen und mehr Cache Vorteile in gut skalierenden modernen Anwendungen, doch birgt das Design auch Probleme. Um die bei Bedarf umgehen zu können, bringt AMD aus dem Server-Bereich bekannte Features auch in den Desktop, allen voran Non-Uniform Memory Access (NUMA) und den Kompatibilitätsmodus Legacy Compatibility Mode, der bei Bedarf die Hälfte der Kerne deaktiviert. Im schlimmsten Fall führen nämlich auch heute noch zu viele Kerne dazu, dass Anwendungen gar nicht kooperieren.

Speicher-Tweaking: NUMA für Latenzen, UMA für Bandbreite

Die Default-Konfiguration ist der Distributed Mode, der das System in den Status Uniform Memory Access (UMA) versetzt. Dieser lässt alle Kerne auf einen logischen gemeinsamen Speicher mit hoher Bandbreite und einheitlichen – wenn auch erhöhten – Latenzen zugreifen. Laut AMD ist das für den vorgesehenen Einsatzzweck für die Threadripper-CPUs der empfehlenswerte Modus.

Der Creator Mode für UMA/NUMA
Der Creator Mode für UMA/NUMA

Der Local Mode hingegen setzte das System in den Modus Non-Uniform Memory Access (NUMA). Jeder CPU-Die kommuniziert nun vorrangig mit direkt zugewiesenen Speicherbereichen, weshalb die Latenz im Schnitt geringer ausfallen kann.

Doch beide Modi sind eine kleine Wissenschaft für sich, es gibt kein Patentrezept für ihre Anwendung. Denn jedes Spiel reagiert anders, das eine setzt auf viele Kerne, eine anderes auf hohe Taktraten, wieder ein anderes auf niedrige Speicherlatenzen. Zudem ist zwingend ein mitarbeitendes BIOS sowie das Windows-Tool Voraussetzung – beides sorgte vor dem Start für Komplikationen. Das Asus-Mainboard musste dazu mit einer speziellen Beta-Version 9960 bestückt werden, das Ryzen Master Tool wurde nach zwischenzeitlichem Rückruf ebenfalls noch einmal geupdatet.

Erschwerend kommt hinzu, dass keine Auslesetool aktuell die Umsetzung richtig erkennt, denn während die unterschiedlichen Latenzen schnell sichtbar werden, ist die Speicherbandbreite schwankend – das Auslesen funktioniert noch nicht richtig. AMD hat die Daten deshalb selbst zur Verfügung gestellt.

UMA vs. NUMA-Mode
UMA vs. NUMA-Mode (Bild: AMD)

Der Legacy Compatibility Mode deaktiviert die Hälfte der Threads

Konkret hat AMD DiRT Rally, F1 2016 sowie die letzten Far-Cry-Ableger (Far Cry und Far Cry Primal) und GTA V identifiziert, die mit mehr als 20 logischen Kernen nicht mehr zusammenarbeiten wollten. Eine Deaktivierung von SMT umgeht dies dann bei Prozessoren mit mehr als zehn Kernen.

Der Gaming Mode deaktivert die Kerne
Der Gaming Mode deaktivert die Kerne

Der Legacy Compatibility Mode kann über das Ryzen-Master-Tool (Download) in Windows aktiviert werden. Er nutzt grundsätzlich den NUMA-Modus, weil Spiele in der Regel eher von weniger Latenz als höherer Bandbreite profitieren – die ist mit dem Quad-Channel-Interface eh schon sehr hoch. Aus einem AMD Ryzen Threadripper 1950X wird dann ein 8C16T (4+4) NUMA-Prozessor (a.k.a. Ryzen 7), der AMD Ryzen Threadripper 1920X folglich ein 6C12T (3+3) NUMA-Modell (a.k.a. Ryzen 5).

Der Modus soll aber nicht nur gegen inkompatible Spiele helfen, sondern auch allgemein die Leistung in Games erhöhen. Je nach Spiel liegen Zugewinnen bei 2 bis 12 Prozent, im Mittel sind es laut AMD vier Prozent. Aber auch das Gegenteil kann der Fall sein, bis zu fünf Prozent weniger Leistung sind ebenfalls möglich. Zu den Titeln, die am meisten von einer Halbierung der Threads profitieren, zählen laut AMD Civilization VI, Call of Duty: Modern Warfare Remastered, Heroes of the Storm, Gears of War Ultimate, DOTA 2, Watch Dogs, Thief, Hitman: Absolution und Fallout 4.

Auf der nächsten Seite: Riesiger Sockel TR4, neue Chipsätze und Mainboards