Test BulkLoadDemo Benchmark: Die Community testet DirectStorage 1.20 mit Avocados 🥑

Ja, sie funktioniert auch als Startoption. Habe ich gerade nochmal probiert. Vorhin, als schneller Test, schien mir der Weg über das BIOS nur einfacher :D
 
Nachtrag zu mein vorherigen Ergebnis.
Meine beiden 512GB M.2 haben rund 2,1GB/s Lesen.
Im Benchmark komme ich auf 8,5 und 8,8 GB/s

Jetzt habe ich eine 2TB mit 3,25 GB/s (AS SSD) gegen eine 512er getauscht.
Maximaler Durchsatz beträgt 10,5 GB/s
 
Habe inzwischen festgestellt, dass mein Acronis "ngscan" Treiber aus 2021 den Direct Storage Modus lt. XBox Anzeige verhindert.
Nach Deinstallation von dieser Acronis Software kam dann mit meiner Seagate Firecuda 530 NVMe, 5900X CPU und 6900XT OCF Graphikkarte ein anderes Ergebnis zustande, wobei anscheinend immer nur das aktuelle Laufwerk gemessen wird, auf dem die BulkLoadDemo gestartet wurde:
 

Anhänge

  • Screenshot BulkLoadDemo Direct Storage 1_2.png
    Screenshot BulkLoadDemo Direct Storage 1_2.png
    2 MB · Aufrufe: 70
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: HisN
burkm schrieb:
Habe inzwischen festgestellt, dass mein Acronis "ngscan" Treiber aus 2021 den Direct Storage Modus lt. XBox Anzeige verhindert.

Das bestätigt mein Misstrauen gegen derartige "Live-Backup"-Systeme.

Ich starte Backupsoftware grundsätzlich nur von einem externen Bootmedium aus.
 
System: Samsung 970 EVO Plus 1TB, i7-10700F, RTX 3070, W10
Durchsatz in GB/s (Mittelwert aus den ersten 5 Durchgängen): 9,23
Ergänzung ()

System: PNY XLR8 CS3030 2TB, i7-10700F, RTX 3070, W10
Durchsatz in GB/s (Mittelwert aus den ersten 5 Durchgängen): 11,512
 
System: Samsung 990 Pro 2 TB, i7-13700K, RTX 3080 Ti, W11 22H2, PCI 4.0
Durchsatz in GB/s (Mittelwert aus den ersten 5 Durchgängen): 21

1694769400794.png


System: Samsung 990 Pro 2 TB, i7-13700K, RTX 3080 Ti, W11 22H2, PCI 3.0
Durchsatz in GB/s (Mittelwert aus den ersten 5 Durchgängen): 13.1

1694769320752.png
 
System: Seagate Firecuda 510 1TB, i7-12700, RX Vega 56, W10
Durchsatz in GB/s (Mittelwert aus den ersten 5 Durchgängen): 7,50


anbindung: msi mag b660m mortar ddr4 -> via m.2 slot pcie gen4 x4 (die nvme ist gen3 also effektiv gen3)
treiber: nvme 1.3, adrenalin 23.9.2

bulkload_12700.png
 
System: Solidigm D5-P5430 3.84 TB R5 5600, Arc A770, W11
Durchsatz in GB/s (Mittelwert aus den ersten 5 Durchgängen): 17,34


Das ist schon ein krasser Unterschied zu meiner vorherigen ersten Messreihe, als das gleiche System noch mit Windows 10 lief..
Ich weiß, Microsoft spricht ja davon dass unter W11 bestimmte "Optimierungen" für DirectStorage vorhanden sind,
aber dass das gleich derart viel ausmacht?

Bloß kann ich leider im Nachhinein nicht mehr nachvollziehen ob es wirklich nur am (nicht freiwilligen) Wechsel von W10 auf W11 liegt,
oder etwa am Intel Arc Treiber selbst, oder dem Füllstand der SSD..

Dennoch, der Durchsatz scheint sich 'mal eben so' verdoppelt zu haben...

€: Der Durchsatz bei der Kingston KC3000 ist in etwa gleich geblieben, und nur leicht gestiegen, auf ca. 17,15..

€2: ..Das einzige was sich vermutlich neben Füllstand & Windows Version/KB Updates sonst noch geändert hat,
ist dass der U.2 Adapter für die Solidigm D5-P5430 nun nicht mehr direkt auf dem mittleren Slot am Gigabyte X570S-UD sitzt, sondern am untersten verblieben ist..

(ich musste für den Test-Betrieb einer RX 6700 XT den Adapter umbauen/verschieben, die AMD Karte von Saphire hätte sonst nicht rein gepasst)

€3: die angezeigte CPU Auslastung ist wohl Momentaufnahme auf den Screenshots, bei W11 seh ich nun auch deutlich niedrigere Werte zwischendurch, schwankt aber immer noch, so zw. ~2,4% und ~12,7% ..



..hat sonst noch wer Direkt-Vergleiche vom exakt selben System zwischen W10 & W11 ? (vielleicht hat ja noch jemand gewechselt in letzter Zeit)
 
Zuletzt bearbeitet:
lynxx83 schrieb:
ist wohl Momentaufnahme auf den Screenshots
Auf welchen Screenshots? 🤔 Oder hast du etwa das wichtigste vergessen? Und bezüglich dem "anderen Slot" - hat sich die Anbindung geändert, vielleicht erst jetzt volle Lanes (was sagt Crystaldisk Info?) oder CPU->Chipsatz?
 
@massaker
Nein, die Screenshots habe ich nicht vergessen, sondern absichtlich erst gar keine mehr gepostet,
ich meinte damit vor allem zufällige posts der anderen User, das ist eine Weile her und war eher am Anfang dieses Themas hier... :

https://www.computerbase.de/forum/t...orage-1-20-mit-avocados.2153056/post-28426472

damals ging die CPU Auslastung bei der Kingston bei mir & Win10 mit Ryzen 5600 nie unter 10% runter, damit meine ich aber eben bloß die Anzeige direkt im Benchmark.


Nun seh ich aber auch bei mir immer mal niedrigere Werte, schwankt aber immer noch (W11 Solidgim/Kingston, neue screenshots) :
BulkLoadDemo 29.10.2023 08_02_29.jpgBulkLoadDemo 29.10.2023 08_02_56.jpg

was diese CPU Auslastung / Schwankungen betrifft, nach weiterer Überlegung/Beobachtung im Taskmanager zB (auch nicht grade am akkuratesten)
ist der vom Avocado-Test angezeigte "Snapshot" Wert einfach zu ungenau, die 'Spitzen' sehen beim Laden im Taskmanager zumindest alle ziemlich gleich "hoch/breit" aus...

PS: Nein, die Anbindung grundsätzlich hat sich nicht geändert, m.2_3 ist immer noch wie m.2_2 via pcie4x4 und den Chipsatz angebunden.
auf slot 1 (pcie4x4 über CPU) sitzt nach wie vor die Kingston, "begraben" unter m.2 MB Kühler, Noctua NH-D15 und der Arc GPU.

Hab sogar noch alte CDM/CDI Ergebnisse/Screenshots gefunden, auch die Benchmark-Ergebnisse mit CDM scheinen halbwegs gleich geblieben zu sein.

Ich glaub immer noch, dass entweder irgendein Hintergrund-Windows Prozess mit reingespielt hatten,
es an irgend einem Windows KB Update liegt,

aber am ehesten, dass es evtl am Füllstand der Solidigm lag (QLC!) , oder der Temperatur evtl. (damals war Hochsommer).

Werde es bei Gelegenheit versuchen nachzustellen, und die Solidigm bis knapp zum Platzen mit Daten füllen (80-90%), und direkt danach nochmal per paar Runden CDM aufheizen, und abschließend nochmal ne Runde Avocados spalten - so der Plan.

Wenns dann immer noch doppelt so viel GB/s sind, bleibt fast tatsächlich nur noch der Wechsel zu W11 bzw eines der KB Updates als mögliche Ursache über, imho (oder natürlich wie erwähnt der Arc Treiber selbst)

€2: ja zum Kuckuck, kA warum, aber der Test lief jetzt ein paar Minuten, bisschen Taskmanager beobachtet, dann manuell abgebrochen,
zwischendrin auf dem anderen Kingston Laufwerk ein zwei Runs gemacht, und wieder zurück zur Solidigm..

und plötzlich zack - wieder die alten, "halbierten" Werte, um die 8GB/s wie damals mit Win10 ^^
Dazwischen wurde nichts anderes an Daten kopiert etc, auch kein CDM gestartet..

Temperatur laut CDI mit 29°C sogar kühler als die eingepferchte Kingston mit 34°, die derweil im Idle ruhte..
Auch der "Hand" Test sagt, grade mal leicht lauhwarm das Solidigm Alu-Gehäuse..
 
Zuletzt bearbeitet:
System: Samsung 990 Pro 1TB, R9 5900X, RX 6800 XT, Gentoo Linux
Durchsatz in GB/s (Mittelwert aus den ersten 5 Durchgängen): 21,4

PCIe 4.0x4 direkt über die CPU
WINE 8.19, VKD3D-Proton 2.3 mit VKD3D_CONFIG=no_upload_hvv
Mesa 23.3.0-rc3, kernel 6.6.1
 
System: Crucial T700 1 TB (PCIe 4.0 x 4), R7 5800X3D, RTX 4060 Ti 16 GB, W11
Durchsatz in GB/s (Mittelwert aus den ersten 5 Durchgängen): 20,35
 
Zuletzt bearbeitet:
System: Samsung 970 Evo 1 TB, i5-13600K, RX 7900 XT, W11 23H2, PCI 4.0

Mittelwert der ersten 3 Durchgänge: 10.1
Screenshot 2023-11-14 190058.png
 
@MichaG / @Jan & interessierte CB Leser,

für einige von euch mag es vielleicht ebenfalls von Interesse sein,

ich selbst bin grade gestern eher zufällig drüber gestolpert / wusste davon noch nichts :


nachdem man die Sample Demo bereits im Rahmen der GDC 2023 zum Thema DirectStorage sehen konnte,

("Join us for a presentation about DirectStorage and how to integrate it to extract optimal load time and streaming performance. We will discuss why a new API is needed, changes required to code and asset pipelines, best practices, and pitfalls to avoid. A demonstration designed to highlight the load time, streaming performance, frame rate and player experience difference between DirectStorage and standard asset loading will be presented." :
)

..und während weitere Spiele* mit "DirectStorage" support (auf die eine oder andere Art) weiterhin auf sich warten lassen - es gibt ja quasi nur die "directstorage" Spiele forspoken, ratchet&clank sowie forza motorsport-

hat AMD also Anfang Dezember letzten Jahres via GPUOpen / github seine DirectStorage Sample Demo veröffentlicht:
https://gpuopen.com/our-brand-new-directstorage-sample-is-available-now/


Somit gibt's also wenigstens was Demos/Samples betrifft was neues auszuprobieren,
ich weiß noch nicht wie gut sich AMD's Sample zum "benchen" & vergleichen eignet,
ausprobiert hab ich sie auf jeden fall schon mal - zumindest optisch leider nicht so ansprechend wie die leckeren Avocados ;)

wer sich die demo nicht selber "bauen" möchte bzw die dazu nötigen tools installieren will, es gibt hier via youtube auf google drive eine "pre-built" Version des Samples, die hat dort jemand verlinkt (nicht AMD);
ansonsten habe ich noch keine tests/reviews geschweige denn sonstige Infos dazu gefunden außer die von AMD selbst, ist also entweder noch zu neu, zu uninteressant, oder google/duckduckgo & ich sind zu blöde zum suchen/finden :
 

Anhänge

  • DS_CPU KC3000.csv
    1,9 KB · Aufrufe: 28
  • DS_GPU KC3000.csv
    2,6 KB · Aufrufe: 25
  • DS_CPU D5-P5430 4TB @ pcie4 x2 lanes only.csv
    2,5 KB · Aufrufe: 25
  • DS_GPU D5-P5430 4TB @ pcie4 x2 lanes only.csv
    3,7 KB · Aufrufe: 24
  • DS_GPU D5-P5430 8TB.csv
    1,8 KB · Aufrufe: 23
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: MichaG, Haldi, Jan und eine weitere Person
GDrive Download Link: https://drive.google.com/file/d/1kyX0FxUQvS5h1ctJHjFFlZkhQWVOxmfJ/view

Darin findet man alle dateien, Starten muss man die 3 RUN.bat dateien:
RunDirectStorage.bat
RunDirectStorageCPUDecompression.bat
RunNoDirectStorage.bat

Die .csv Dateien werden erst erstellt wenn man den Benchmark mit ESC abbricht. Sie Liegen dann im /bin Ordner, allerdings hat der Vorgänger da bereits alte dateien drin. die am besten vorher löschen.

Hier meine Ergebnisse auf einer Adata SX8200pro
AS_SX8200Pro_1gb.png


1705671358033.png


Weiss nicht ob das an der nVidia GPU liegt. Aber DSOffCompress gibt keine werte für dataRate und mapSize.


BTW, wer auch immer den Kamera Pfad des "Auto" Benchmarks gemacht hat war unfähig....
Der Stopp IM feld Drin, anstatt darüber hinaus zu gehen. Somit wird der erste und letzte Bench nur halb so oft durchgeführt wie die 2 in der mitte. Andererseits lädt es so nie den gleichen Bench 2x direkt nacheinander -.-
 

Anhänge

  • DSOn_133501433719240895.csv
    1,4 KB · Aufrufe: 27
  • DSOnCPUDecompression_133501434565425480.csv
    1,3 KB · Aufrufe: 22
  • DSOffCompress_133501431208686095.csv
    3,7 KB · Aufrufe: 27
  • Gefällt mir
Reaktionen: MichaG
Uff, der Benchmark ist nicht gerade "user friendly" :D Für Entwickler vermutlich Pipifax. Wie kriegen wir da jetzt ne einheitliche Richtlinie für das Vorgehen rein? Ich sehe nun .csv mit zig Werten, aber welche davon nehmen?

Das Diagramm hast du dir selbst gebastelt oder gibt es da eine Funktion?

Edit: Ah, je länger man den Benchmark laufen lässt, desto mehr Ergebnisse stehen dann auch in der csv. Soweit so logisch.

Edit2: Offenbar sind die ersten Resultate immer viel schlechter als die späteren. Daher würde sich anbieten, diese rauszulassen und dann die späteren als Maßstab zu nehmen. Ideal wäre wieder ein Mittelwert aus mehrern Durchgängen, aber ich denke das ist zu viel verlangt.

DS-Bench-csv.png
 
Zuletzt bearbeitet:
Jup.... ist nen Krampf xD
Hab einfach Alphabetisch sortiert, Checkerbox rausgelöscht.
Manuell die Werte die über den Durchschnitt zu viel rausgeragt haben rausgelöscht und dann Mittelwert berechnet.
Dann das ganze in einem Graph der ganz leicht und überhaupt nicht kompliziert über 3 Tabs resultate aus einzelnen Feldern ausliest schön dargestellt ^^
 
  • Gefällt mir
Reaktionen: MichaG
Wenn wir das als Community-Benchmark machen wollen, müssen wir halt ne möglichst unkomplizierte Anleitung/Richtlinie basteln. Tendiere gerade dazu:

  • Run.bat 2 Minuten laufen lassen und mit ESC beenden
  • Entsprechende .csv im Bin-Ordner suchen (sortieren nach änderungdsatum) und öffnen
  • letztes Ergebnis bei "loadtime(ms)" nach abschnitt (BoomBox, SpaceShuttle...) eintragen
Das wäre halbwegs "easy". Dann noch dreimal das Ganze mit den drei Run.bats. Load-Time und Datenrate hängen ja voneinander ab, müsste man nicht beides abfragen. Vielleicht diesmal nur Load-Time?

Edit: ok bei "DS off" misst er keine Datenrate. Then Load-Time only it is. ^^
 
Zuletzt bearbeitet:
Joa.... wenn ich die Werte so angucke brauchst eigentlich fast kein Average über mehrere Runden...

Der letzte Wert ohne Kommastelle ist immer der Mittelwert. mit DS On werden die unterschiede noch kleiner.
BoomBoxCommandModuleSpaceShuttleX1
132.18​
1159.37​
1292.64​
431.47​
136.16​
1138.71​
1336.77​
423.22​
131.38​
1141.32​
1332.1​
423.85​
128.22​
1140.35​
1316.37​
426​
124.05​
1136.48​
1345.93​
134.11​
1140.1​
1328.94​
131​
1126.43​
1325​
1122.06​
1137.71​
1138​
 
  • Gefällt mir
Reaktionen: MichaG und Jan
Zurück
Oben