News Dynamic Local Mode: Neuer NUMA-Modus für Threadripper 2990WX/2970WX

MichaG

Redakteur
Teammitglied
Dabei seit
Juli 2010
Beiträge
7.563
#1
Dabei seit
Mai 2009
Beiträge
576
#3
Ist das also ein Problem des Windows-Schedulers, welches AMD hier per Userland-Software umgehen will?
 
Dabei seit
Feb. 2007
Beiträge
169
#4
Interessant - aber so recht sicher bin ich nicht, was das wirklich bringen soll?
Ich mein da ist ne ganze Menge Marketing mal wieder drin, denn nicht dieses neue Feature bringt Leistung, wie in den Diagrammen zu sehen, sondern der schlicht und einfach marktunübliche Aufbau kostet Leistung... Aber schön zu sehen wie man da die Leute versucht zu lenken. Und es werden wieder viele drauf einsteigen ;)

PS: warum nicht direkt die Threads bei Start der Anwendung auf so einem NUMA Zwitter-Konstrukt fest zuweisen? Dann gibts direkt auch "Keine" Probleme... Games setzt man sinnigerweise auf DIE 0, also im Taskmanager Thread 0 bis 15, wer noch den zweiten CCX außen vor lassen will, eben 0 bis 7 und ab dafür...
Das geht effektiv bei jeder .exe mit "start /affinity # game.exe"

Im Zweifel einfach mal Google anschmeißen...

Ne "Lösung" über irgendwelche Dienste oder sowas ist zwar Cool - aber Windows wird mittlerweile im halbjahrestakt geändert, wer weis ob die Dieste IMMER funktionieren. -> die Zuweisung der Threads auf die richtigen Nodes sollte in jedem Fall funktionieren.
 
Dabei seit
März 2017
Beiträge
2.211
#5
https://www.tomshardware.com/news/amd-cpu-threadripper-2970wx-2920x,37895.html

Nein , ist für 2970WX / 2990WX , sorgt dafür das Threads mit hohem Memory Zugriff auf Cores/Dies umgelegt werden , die direkten Zugriff auf den Speicher haben , Threads mit weniger Speicherzugriff werden auf Cores / Dies umgelegt die keinen direkten Zugriff haben
aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS8xL0UvODAyMjc0L29yaWdpbmFsLzAxLkpQRw==.jpg


ist eher eine im Hintergrund arbeitende Anpassung an die relativ spezielle CPU Struktur des WX 2970/2990 mit seinen 4 Dies , von denen nur 2 direkt am Arbeitsspeicher angeschlossen sind , beim Epyc ist das weniger ein Problem da Octa Speicherchannel , TR hat jedoch nur Quadchannel
 
Dabei seit
Jan. 2010
Beiträge
3.483
#6
Habe den Gamemode von Ryzen Master einmal gebraucht bislang... Für The Saboteur weil das nicht Startet wenn es mehr als 8 Threads sieht...
 
Dabei seit
Juni 2008
Beiträge
1.993
#7
Îmmer her damit :)
 
Dabei seit
Feb. 2007
Beiträge
169
#8
Ist das also ein Problem des Windows-Schedulers, welches AMD hier per Userland-Software umgehen will?
Ansichtssache - in erster Linie ist es ein Problem durch die komisch unübliche NUMA Aufteilung. Und zusätzlich ein Resultat aus der Thematik, dass man ein 2-4x NUMA Konstrukt im "Desktop" vermarktet, obwohl es effektiv keine NUMA aware Software in diesem Markt gibt.
Der Windows Threadscheduler ist zwar auch eher kontraproduktiv bei dieser Art CPUs - aber Windows versucht primär den Task auf einem NUMA Node zu halten, sofern möglich. Für viele User wird dann aber einfach dazu kommen, dass man die Hardwarevorraussetzungen nicht immer einhalten kann. 2x NUMA Nodes mit lokalem Speicher = max. 1/2 RAM pro Task. Wer mehr belegt, bricht über die NUMA Grenze und wird auch über die anderen Nodes verteilt. Oder eben die Zuweisung der Threads -> wer mehr als 1/4tel der Threads nutzt, wird über die Nodes verteilt.

Im Serverbereich wird sowas meist beachtet, teils sogar explizit einkalkuliert. Der Desktop User sieht aber nur 32C/64T und ab dafür...
 
Dabei seit
Feb. 2008
Beiträge
895
#9
Ansichtssache - in erster Linie ist es ein Problem durch die komisch unübliche NUMA Aufteilung. Und zusätzlich ein Resultat aus der Thematik, dass man ein 2-4x NUMA Konstrukt im "Desktop" vermarktet, obwohl es effektiv keine NUMA aware Software in diesem Markt gibt.
Richtig, Ansichtssache. Und wenn Linux das "out of the box" bereits drauf hat und hatte, Windows jedoch nicht, würde ich den Fehler eher nicht in der Hardware suchen. Da ist der archaische Windows Scheduler mal wieder ein Klotz am Bein.
 
Dabei seit
Dez. 2013
Beiträge
4.967
#10
Dabei seit
Feb. 2007
Beiträge
20.521
#11
Anhand von ausgewählten Spiele- und Software-Tests stellt AMD Leistungsgewinne durch den Dynamic Local Mode in Aussicht, die von zehn Prozent (Far Cry 5) bis hin zu 47 Prozent (Battlefield 1) reichen sollen.
das würde ja voraussetzen dass die "Basis Leistung" gerade mehr als bescheiden wäre sofern man da über ne CPU bis 47% gewinnen können soll ^^
 
Dabei seit
Dez. 2015
Beiträge
621
#12
PS: warum nicht direkt die Threads bei Start der Anwendung auf so einem NUMA Zwitter-Konstrukt fest zuweisen? Dann gibts direkt auch "Keine" Probleme... Games setzt man sinnigerweise auf DIE 0, also im Taskmanager Thread 0 bis 15, wer noch den zweiten CCX außen vor lassen will, eben 0 bis 7 und ab dafür...
Das geht effektiv bei jeder .exe mit "start /affinity # game.exe"
Mach ich bei meine Ryzen 7 auch so. Erst die Spiele der letzten zwei Jahre profitieren nicht mehr davon. Bei allen älteren Spielen, die nur 2-4 Kerne nutzen, macht es sich echt bezahlt, das auf einen CCX zu zwängen.
 
Dabei seit
Feb. 2007
Beiträge
20.521
#14
PS: warum nicht direkt die Threads bei Start der Anwendung auf so einem NUMA Zwitter-Konstrukt fest zuweisen? Dann gibts direkt auch "Keine" Probleme... Games setzt man sinnigerweise auf DIE 0, also im Taskmanager Thread 0 bis 15, wer noch den zweiten CCX außen vor lassen will, eben 0 bis 7 und ab dafür...
Das geht effektiv bei jeder .exe mit "start /affinity # game.exe"
wem bitte will man sowas zumuten?
 
Dabei seit
Dez. 2015
Beiträge
621
#15
Einmal eine Batch-Datei und die passende Desktopverknüpfung erzeugt und es klappt. Man muss es halt einmal präparieren.
Braucht ja nicht jede Software.
 

Volkimann

Lt. Commander
Dabei seit
Jan. 2014
Beiträge
1.761
#17
Interessant - aber so recht sicher bin ich nicht, was das wirklich bringen soll?
Dann lies halt den Artikel...
Ich mein da ist ne ganze Menge Marketing mal wieder drin, denn nicht dieses neue Feature bringt Leistung, wie in den Diagrammen zu sehen, sondern der schlicht und einfach marktunübliche Aufbau kostet Leistung... Aber schön zu sehen wie man da die Leute versucht zu lenken. Und es werden wieder viele drauf einsteigen ;)
Aha, weil Microsoft nicht in der Lage ist ihren Scheduler in 2 Jahren anzupassen, "lenkt" AMD mit "Marketing" ab...
Ich würde eher sagen das AMD eine Lösung bereit stellt.

Ne "Lösung" über irgendwelche Dienste oder sowas ist zwar Cool - aber Windows wird mittlerweile im halbjahrestakt geändert, wer weis ob die Dieste IMMER funktionieren. ->
AMD wird schon entsprechende Anpassungen bringen. Natürlich könnte Microsoft auch in ihrem Halbjahrestakt auch ihren Scheduler anpassen. Wäre aber bestimmt auch nur Marketing, gell?
 

Simon

Fleet Admiral
Dabei seit
Jan. 2002
Beiträge
10.290
#18
Richtig, Ansichtssache. Und wenn Linux das "out of the box" bereits drauf hat und hatte, Windows jedoch nicht, würde ich den Fehler eher nicht in der Hardware suchen. Da ist der archaische Windows Scheduler mal wieder ein Klotz am Bein.
Tja, dummerweise ist Windows mit einem Marktanteil von > 90% im Desktop gesetzt.

Am Markt vorbei entwickeln kann sich heute kaum ein Unternehmen leisten, daher ist es völlig irrelevant, ob ein Nerd in irgendeinem Tech-Forum das kacke findet.
 
Dabei seit
Mai 2013
Beiträge
3.930
#19
Es muss ja nicht eins von beiden Schuld sein, beides hat seinen Anteil..
Aber dann kann man gar nicht mehr seinen Linux ist besser als Windows Quark ablassen :(

AMD wird schon entsprechende Anpassungen bringen. Natürlich könnte Microsoft auch in ihrem Halbjahrestakt auch ihren Scheduler anpassen. Wäre aber bestimmt auch nur Marketing, gell?
Kann es sein, dass Windows 10 Pro for Workstation das bereit drin hat. Ich meine ich hätte sowas in einer News gelesen. Weiß nur nicht mehr wo.
 

Volkimann

Lt. Commander
Dabei seit
Jan. 2014
Beiträge
1.761
#20
Tja, dummerweise ist Windows mit einem Marktanteil von > 90% im Desktop gesetzt.

Am Markt vorbei entwickeln kann sich heute kaum ein Unternehmen leisten, daher ist es völlig irrelevant, ob ein Nerd in irgendeinem Tech-Forum das kacke findet.
Als ob Threadripper für den 90% Desktopmarkt platziert worden wäre.

Die CPU ist für "Nerds" konzipiert.
 
Top