News DirectStorage 1.1: SDK von Microsoft und GPU-Treiber von AMD, Intel, Nvidia

NVMe Gen3 und HDD
 
  • Gefällt mir
Reaktionen: Mordekai2009
Viele verwechseln auch M2 SSDs mit reinen NVME SSDs es gibt auch M2 die über das Sata Protokoll laufen also ältere Modelle.
 
  • Gefällt mir
Reaktionen: goldeye und Lübke82
Gerade mal mit Alder Lake iGPU getestet (1260p)...

Mit GPU decompression ist es dort leider deutlich langsamer als wenn man die CPU dekomprimieren lässt (CPU ~3s, iGPU ~7.4s in der Avocado Demo).
Dann bin ich ja Mal gespannt ob sowas eine Einstellung wird oder schlau automatisch entschieden wird.

Edit: 12900K gegen 3090 ist dann ~1.7s zu 0.6s für 8.6GB (die Speichermenge scheint nicht konsistent zu sein)
 
Zuletzt bearbeitet:
T3rm1 schrieb:
Also Direct Storage 1.0 funktioniert mit SATA SSDs.

Direct Storage ist erstmal nur die API mit der Spiele zB effizienter große Mengen an Dateien laden lassen können, insbesondere in die GPU.

Das ist erstmal universell. Mit 1.1 davon gibt es jetzt auch die GPU decompression.

Eine weitere Möglichkeit ist dann, dass die GPU direkt auf die SSD zugreift und der Weg über die CPU gespart wird.

Ob das jetzt immer zusammen mit GPU decompression genutzt wird und auch notwendig für GPU Dekompression ist, weiß ich noch nicht genau. Letztendlich wäre das Dekomprimieren auf der GPU ja unabhängig davon wo die Daten herkommen.
Aber gut möglich dass es keinen Sinn macht auf der GPU zu dekomprimieren, wenn man eh auf den Datenträger warten muss, dann hätte die CPU ja vermutlich noch Luft und stellt nicht den Flaschenhals dar.
 
Zuletzt bearbeitet:
duskstalker schrieb:
dann wird microsoft für win10 user wieder irgendeinen dummen stolperstein einbauen, damit man die auch noch auf win11 zwingen kann.

Dafür müssten sie nur die künstliche TPM Abhängigkeit deaktivieren und die künstliche CPU Blockade. Dann würden sicher mehr Leute auf Win11 wechseln, besonders seit das Android Feature "fertig" ist, ist Win11 interessanter für viele geworden.

mxpower schrieb:

Was hat MS denn mit GNU/Linux hier zu tun. Wine wird sich damit irgendwann beschäftigen. Oder es wird ein "Community" Projekt geben was etwas ähnliches mit Vulkan und den Vulkan Compute Shadern implementiert. Der größte Aufwand wird wohl damit verbracht werden die unterschiedlichen Kompressionsvarianten auf den ALUs einer GPU schnell zu dekomprimieren.

Tanzmusikus schrieb:
Bei AMD & Intel kann man da fast schon sicher sein.

Die beiden machen so was aber auch nicht wenn es nicht notwengig ist.

Tanzmusikus schrieb:
Natürlich muss man das Ganze auch technisch in den WINE-Schlauch* bekommen. :daumen:
*Vermutlich über z.B. IO_uring oder VKD3D.

Ich würde vermuten das es darauf hinauslaufen wird. Wird aber wohl eine Frage sein wie sich die Technik durchsetzt. Der Fallback wird sicher noch länger vorhanden sein, entsprechend wird das eine geringe Priorität sicher haben wenn es nicht ein Enthusiast selber implementiert.
 
Imho die spannendste Entwicklung neben Raytracing im Gaming-Sektor. Wird Gameplay-Möglichkeiten eröffnen, die zuvor technisch nicht möglich gewesen sind, weil entweder die Systembandbreite nicht ausreichend gewesen ist oder der Zugriff auf hochauflösende Texturen oder andere Daten zu langsam vonstattenging.
Das aktuelle Ratchet & Clank auf der PS5 wurde damit beworben, dass erstmals dank der super hohen Bandbreite der PS5 es möglich gewesen ist, ohne eine Verzögerung instant durch Welten zu wechseln.
Später wurde dann von einigen Twitter-Typen und Entwicklern behauptet, auch ohne die Nutzung dieser hohen Bandbreite mitsamt der schnellen Nvme-SSD wäre die Umsetzung dieses Spiels möglich gewesen.
Wie dem auch sei, die kommenden Spiele werden daraus auf jeden Fall einen Nutzen ziehen.

Bin mir nicht sicher, aber glaube, dass Beispiel mit der hohen Bandbreite ist nicht passend gewählt.
DirectStorage bezieht sich nicht auf eine hohe Systembandbreite (ala PS5), sondern eher den direkten Zugriff der GPU auf die auf einem Datenträger abgelegten Spieledaten. Naja, Bandbreite kann nicht schaden ;)
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: StylishChiller
Es wird mit allerhand arten von Speicher funktionieren.

NVME SSDs haben jedoch den größten nutzen/effekt.

Auch SATA SSDs können daraus ihren nutzen ziehen, da eben die Latenz über die CPU entfällt.

Umso größer der Speicherdurchsatz und umso geringer die Latenz des Speichermediums ist, umso größer dürfte der Nutzen sein.
 
t3chn0 schrieb:
Regt mich schon seit Jahren auf, dass die Leistung von NVMe nicht richtig ausgenutzt wird. Ich habe seit 2015 nur noch NVMe's im Einsatz und hätte jetzt auch endlich mal was davon.
Der Preis für Early-Adaptor. Leute, die sich erstmals eine Nvme im Jahre 2028 kaufen, kennen dein Problem nicht. :daumen:
 
  • Gefällt mir
Reaktionen: Viper816 und StylishChiller
spannender als die Ladegeschwindigkeit eines Spiels bzw im Spiel finde ich, was das für die CPU-Nutzung heißt. Gegebenenfalls sind Framedrops dann nur noch sehr selten, wäre was feines.
 
  • Gefällt mir
Reaktionen: Nero1
Habs grad selber getestet. Scheint zu funktionieren.

CPU: Intel Core i7-3770 @ Stock (Delidded)
NVMe: WD Blue SN550 2TB @ PCIe 2.0 x4
SATA SSD: Samsung 860 EVO 1TB @ SATA 600

Grafikkarte: Gainward Geforce RTX 3060 12GB Ghost
Treiber: Nvidia Geforce 526.47 WHQL Game Ready
OS: Windows 10 Pro x64 (Version 21H1)

Ergebnis:
Größe: 6.71 GB
GDeflate GPU or CPU only. No raw CPU or Zlib.

--NVMe--
GPU: 1.14 secs (~11% max CPU usage) - 5.90 GB/s (Interpoliert auf circa 0.95 Sek gegenüber Newsartikel)
CPU: 5.00 secs (100% max CPU usage) - 1.34 GB/s

--SATA SSD--
GPU: 3.24 secs (~15% max CPU usage) - 2.07 GB/s
CPU: 5.02 secs (100% max CPU usage) - 1.34 GB/s

Ich bin froh dass es weiter geht.
 
  • Gefällt mir
Reaktionen: Ray519, Tanzmusikus und Viper816
Wunderbar, damit ist klar, dass GPU Decompression unabhängig vom Quelldatenträger funktioniert, nur je langsamer die Quelle, desto wahrscheinlicher dass der Vorteil der GPU vom Warten aufgefressen wird.
 
Ich weiß es nicht, ob ich den WD Blue SN550 2TB auf PCIe 1.1 runterstellen kann. Mal gucken.

EDIT: Nein. Option fehlt im UEFI-Menü.
 
Zuletzt bearbeitet:
t3chn0 schrieb:
Endlich,

ich hoffe das hält Einzug in die zukünftigen AAA Titel. Vor allem der FS2020 braucht Ewigkeiten um mal korrekt zu laden.

Regt mich schon seit Jahren auf, dass die Leistung von NVMe nicht richtig ausgenutzt wird. Ich habe seit 2015 nur noch NVMe's im Einsatz und hätte jetzt auch endlich mal was davon.

Nun dieses "Nicht-Ausnutzen" liegt eben daran, dass die Geschwindigkeit der Datenübertragung vom Speichermedium sehr oft nicht der Flaschenhals ist.
Der Flaschenhals ist dann eher die Dekomprimierung von Assets durch die CPU oder das "Zusammenbasteln" des Levels in Form von Geometriedaten usw. etc. pp.

Ich würde mir von DirectStorage gerade bei so etwas wie dem MSFS keine Wunder erwarten. Der Flaschenhals bzw. die Flaschenhälse beim MSFS dürften wegen der Komplexität der Sim sehr vielfältig sein. Da wird DirectStorage jetzt keine Wundertüte werden. Wäre schön, aber halte ich für unrealistisch.

Wobei das beim MSFS natürlich auch an der Asbach-Uralt-Engine-Basis liegt. Das ist ja im Kern leider immer noch die FSX Engine mit den bekannten Schwächen wie zum Beispiel Problemen bei der Auslastung.

Ich habe auf meinem PC (siehe Signatur) bei maximalen Details in 4K mit der RTX 4090 und DLSS Quality immer noch nur ca. 30fps und viel Geruckel und Gezuppel.
Jetzt wird schnell jemand sagen "hahaha Dein Asbach-9900k ist ja auch ein Würstschen und kann gar nix hahaha".

Mag sein, aber dann müsste der ja gut ausgelastet sein und am Anschlag laufen. Ist aber nicht mal ansatzweise der Fall. Der ist 50°C bis 60°C warm und ca. 30% bis 50% ausgelastet.
Und dasselbe Trauerspiel mit der 4090. Die ist lauwarm in den 50°Cern bis niedrige 60°Cer und ebenso nur mittelmäßig beschäftigt.

Beim MSFS ist einfach die Engine Murks. War schon beim FSX Murks, beim FSX-SE Murks, bei P3D Murks und sie ist trotz aller Modifikationen nun auch beim MSFS 2020 noch Murks.
Ich glaube daher, dass DS fast gar nichts bringen wird. Ich würde nicht sagen "nix", aber das dürfte sich alles in sehr überschaubaren Grenzen halten, weil beim MSFS andere Dinge, vor allem in Software, limitieren.
 
vander schrieb:
Wenn der hochoptimierte Vorzeige Anwendungsfall von 2,36s uaf 0,8s beschleunigt, dann sind das sagenhafte 1,56s Wartezeit die gespart wurden. Bei einer Gesamtmenge von 7GB an Daten sollte das schon das komplette Level sein? Mal hoch gegriffen, man spart 3s bei jedem Ladevorgang/Level ... schön, aber kein Weltuntergang wenn man das nicht hat.
Dein Beispiel ist lachhaft und einseitig. Es gibt leider auch viele Spiele mit viel längeren Ladezeiten, teilweise 10 bis 20 Sekunden. Da wäre eine Halbierung ein Segen. Aber wenn ein Ladevorgang statt nur 3 Sekunden nur noch 1 Sekunde dauert, wäre das auch toll. Wenn es Spiele sind, bei denen man oft lädt, sind auch 3 Sekunden nervig.
 
  • Gefällt mir
Reaktionen: Lübke82
duskstalker schrieb:
der PC ist halt für microsoft nicht mehr die lead-plattform.

Ich würde sagen, dass plattformübergreifendes "XBox Live" als Service Microsofts Zukunftsvision ist, nicht irgendeine spezielle Hardware. In einigen Jahren wird vielleicht kein Hahn mehr danach krähen, ob man auf PC, XBox, Playstation oder per Streaming spielt, sondern es interessiert hauptsächlich, über welchen Onlinedienst das Spiel erworben und betrieben wird.

Was DirectStorage angeht, wird man wohl zumindest auf dem PC keine deutlich spürbaren Veränderungen dadurch erwarten dürfen. Ist halt primär eine Methode um den konsolentypischen Flaschenhals RAM-Mangel (gemeinsamer Arbeits- und Grafikspeicher) durch beschleunigte Massenspeicherzugriffe zu umgehen. Aber nett von MS, das auch für PCs zu bringen.
 
  • Gefällt mir
Reaktionen: RogueSix und goldeye
T3rm1 schrieb:
Also Direct Storage 1.0 funktioniert mit SATA SSDs.
Durchaus denkbar, die Geschwindigkeitsvorteile gegenüber ohne DirectStorage sind dann aber vermutlich nur noch messbar, aber nicht mehr spürbar. Wobei es dennoch die Last der CPU senken dürfte, wenn auch 1.1 auf SATA SSDs läuft. Nur wirklich schneller laden vermutlich nicht, dafür könnte dann beim Gaming ein CPU Flaschenhals wesentlich seltener werden.
 
  • Gefällt mir
Reaktionen: mae1cum77
Fragt sich nur, ob das ganze auch DX13 unterstützt.
 
Stefan1200 schrieb:
Nur wirklich schneller laden vermutlich nicht, dafür könnte dann beim Gaming ein CPU Flaschenhals wesentlich seltener werden.
Yep. Die Leute vergessen gerne, daß auch Multithreading immernoch einen Masterthread zur Koordinierung benötigt. Die Teilergebnisse wollen wieder zusammengeführt werden. Mehr Multithreading erhöht diesen Verwaltungsaufwand, ist also nicht unendlich machbar.

Da ist jede Entlastung hilfreich.
 
Darken00 schrieb:
Dein Beispiel ist lachhaft und einseitig. Es gibt leider auch viele Spiele mit viel längeren Ladezeiten, teilweise 10 bis 20 Sekunden.
Wenn das laden so extrem lange dauert wie von dir beschrieben, dann hat das Entwicklerteam da ein Problem das sich so vermutlich nicht lösen lassen wird.

Ist mir schon bei diversen Spielen bezüglich Latenzprobleme aufgefallen.
Es gibt nun mal Entwickler die bekommen es nicht auf die Reihe, egal was für tolle neue Techniken sie implementieren.
Währenddessen andere auch ohne sowas bereits schneller sind und mit, dann noch mal zulegen.
Daher würde ich die höchsten Gewinne, nicht unbedingt bei den Teams erwarten die jetzt bereits schlechte Ergebnisse abliefern. Ist zwar Schade, aber das zeigt meine Erfahrung.
 
Zurück
Oben