News G.Skill Trident Z5 & Z5 RGB: Low-Latency-Kit mit 64 GB DDR5-5600 CL28 vorgestellt

@Elverado
Die Latenz der DRAM Module macht nur einen Teil der Gesamtlatenz aus.
Content switching und Terminierung weisen bei DDR5 einen geringeren Delay auf (wobei das zum Teil an der Channel Konfiguration liegt).

Ein Teil der Terminierung ist auch vom ASIC in das Rammodul gewandert (und damit auch der Latenzanteil).
 
Atent12345 schrieb:
Content switching und Terminierung weisen bei DDR5 einen geringeren Delay auf
Quelle?
Was genau hat sich an der Terminierung im Vergleich zu DDR4 geändert? Das letzte was ich davon weiß, ist dass die seit DDR2 in den Chip gewandert ist.
Und die Lastverteilung? Dazu finde ich bei DDR5 auch nix (dass sich was geändert hätte). Selbst wenn, so ist es unwahrscheinlich, dass das im Vergleich zur Latenz der Chips eine genügend große Rolle spielt, um beachtbare Unterschiede auszumachen.

@Drewkev
Meinst du die Aufteilung in 2x32 bit Bus? Das ist ja schon in der Formel in der effektiven Frequenz berücksichtigt in Form des doppelten Prefetches. Dadurch erhalten wir ja eben bei immer noch 300-400 Mhz internem Speichertakt (-> DDR4 2400-3200) die doppelte effektive Frequenz für DDR5 (4800-6400) (bis dato. Wird ja definitiv mehr werden und auch bei DDR4 hatten wir ja schon OC-Module bis in die 5000er Bereiche, d.h. internen Takt jenseits der 500 Mhz).
Das aber nochmal einzurechnen wäre zuviel/doppelt.
https://en.wikipedia.org/wiki/DDR5_SDRAM

Echte Latenzvorteile bei DDR5 werden wir nicht jetzt - am Anfang - sehen. Das kommt in jedem Falle noch, dauert aber seine Zeit.
Für jetzt ist DDR5 mehr wegen der doppelten Speicherbandbreite interessant, z.B. für IGPUs etc. und eben Anwendungen, die das brauchen.
 
@Elverado
Es ist einfach Fakt, dass bspw. CL22 bei DDR5 im Endeffekt (bzw. in Spielen) nicht so langsam ist wie bei DDR4. Mehr habe ich nicht gesagt. Datendurchsatz ist jetzt schon bis zu doppelt so hoch bei gleicher/ähnlicher Latenz.

DDR5 arbeitet auf so vielen Ebenen so viel effizienter. Ausgereizt ist es dennoch nicht.

(2 statt 4 Banks pro Bank Group (zumindest bei 8Gb Chips), Same Bank Refresh, doppelte Burst Länge, 32-bit Sub-Channels, ich hab sicher was vergessen)
 
Zuletzt bearbeitet:
Drewkev schrieb:
Es ist einfach Fakt, dass bspw. CL22 bei DDR5 im Endeffekt (bzw. in Spielen) nicht so langsam ist wie bei DDR4.
Richtig&Falsch. Du nennst nämlich hierbei keine Taktrate. Wenn ich von Latenz rede, dann rede ich von der Latenz in ns, nicht von den CAS etc. Zahlen (die aber für die Berechnung natürlich benötigt werden - zusammen mit der effektiven Frequenz).
Also klar ist DDR5 CL22 @5600Mhz von der Latenz her besser, als DDR4 CL22 @2800 Mhz. Es ist aber genauso gut wie (bzw. halt nicht besser als) DDR4 CL11 @2800Mhz.

Drewkev schrieb:
2 statt 4 Banks pro Bank Group (zumindest bei 8Gb Chips), Same Bank Refresh, doppelte Burst Länge, 32-bit Sub-Channels,
Genau das wird bereits mit der Verdopplung des Prefetchfaktors in der Formel abgedeckt.
 
Elverado schrieb:
Du nennst nämlich hierbei keine Taktrate.
Ach komm. Natürlich meine ich nicht 1600MHz (3200MT/s) gegen 2400MHz (4800MT/s), sondern eher 1800MHz (3600MT/s), das dürfte der Sweetspot sein und 2800MHz (5600MT/s) ist in Games auf Augenhöhe wenn ich mich richtig erinnere.

Elverado schrieb:
Genau das wird bereits mit der Verdopplung des Prefetchfaktors in der Formel abgedeckt.
Du hast zwar alle vier Änderungen zitiert, aber ok.

Elverado schrieb:
Wenn ich von Latenz rede, dann rede ich von der Latenz in ns, nicht von den CAS etc. Zahlen (die aber für die Berechnung natürlich benötigt werden - zusammen mit der effektiven Frequenz).
Naja, warum auch. 3600 CL16 dürften ungefähr 9ns entsprechen, 5600 CL36 ungefähr 13ns. Die CAS Latenz ist zwar bei letzterem höher, aber in Benchmarks gleichauf mit 3600 CL16 bei bis zu doppeltem Datendurchsatz. Darauf habe ich mit meiner Aussage abgezielt.
 
Zuletzt bearbeitet:
Drewkev schrieb:
Du hast zwar alle vier Änderungen zitiert, aber ok.
Weil das (fast) alles in die gleiche Sparte reinspielt:
Also schön aufgedröselt:
Formeln:
Code:
effektiveFrequenz = PrefetchingFaktor x interne Taktfrequenz    Formel A
Speichertransferrate = effektiveFrequenz x Busbreite (in Byte!) Formel B
Latenz (in ns) = 2 x Latenzzahl / effektiveFrequenz             Formel C

1.
32-bit Sub-Channels, doppelte Burst Länge, 2 statt 4 Banks pro Bank Group
Die größe des Channels war bei DDR4 64bit. Jetzt (bei DDR5) gibt es aber zum einen eine Aufteilung in 2 Subchannels und zum anderen eine 'Halbierung' der Breite vgl. zum einen großen Channel vorher. Da wir aber jetzt 2 Subchannels haben, bleibt die Breite pro Modul gleich. Bis hierhin wäre der Prefetching Faktor immer noch der gleiche.
Da ist dann aber das Problem:
x86 CPUs erwarten eine minimale Zugriffsgröße von 64byte.
(die Zugriffsgröße ergib sich aus BurstLänge x BusBreite. Die Burstlänge bei DDR4 war 8, bei DDR5 dann 16 s. ff.)
Durch die Halbierung der Breite beider Channels (die am Ende auch einzeln angesteuert werden sollen - sonst verdoppelt sich unsere effektive Frequenz nämlich nicht), ist das (die 64 byte minimale Zugriffsgröße) aber nicht mehr gegeben. Daher wird die Burst-Length/BurstLänge verdoppelt.
(Daten werden in 'bursts' aka 'Schüben' geliefert).
Der Prozessor ist 'zufrieden', da er wieder 64 byte minimale Zugriffslänge hat, und wir müssen nix weiter an der Busbreite ändern.
Unser 32 bit breiter Bus kann also jetzt pro Burst die gleiche Menge an Daten hindurchliefern, wie ein 64 bit Bus.

Das alles bringt aber noch nichts wirklich, wenn man immer noch die gleiche Anzahl an Bank Groups dahinter (hinter dem Interface) stehen hat (Der Prozessor adressiert immer eine bzw. mehrere Bank Groups parallel, wenn er einen Speicherzugriff durchführt und lässt sich dann deren Inhalt (der enthaltenen RAM-Banks) geben. Bleibt die Anzahl der Bank Groups gleich, kann er auch nur diese Anzahl ansprechen. Da nützt uns unser schön aufgebohrtes Interface aber dann nix.) Daher muss&wird logischerweise die Anzahl der Bank Groups verdoppelt (Anmerkung: Anzahl der Banks pro Group bleibt gleich (4), nur die Anzahl der Bank Groups verdoppelt sich bei DDR5 von 4 auf 8, bzw. ja, es gab bei DDR4 anfangs noch die Option für 2 Banks pro BG, aber typisch waren letzthin 4 Banks pro BG).
Am Ende erhalten wir also (bezogen auf den Durchsatz) 2 volle Channels, wo vorher nur einer war.

Und das wird in der Berechnung der Latenz bzw. der effektiven Taktrate durch den verdoppelten Prefetching-Faktor abgedeckt.

2.
Same Bank Refresh
In gewisser Weise ist das ein Punkt, allerdings mit einen großem Aber. Denn:
Ja, innerhalb von DDR5 (also vgl. Refresh Same-Bank vs Refresh All-Bank) ergeben sich Performance-Vorteile von irgendwas zwischen 6-9% sowie eine Halbierung des Beitrags der durch den Refresh hinzukommenden(!) Latenz (Es handelt sich bei beiden Messdaten um kein Spiel/reale Anwendung oder so, sondern Herstellerinterne Benchmarks, die reine Geschwindigkeitsunterschiede feststellen!). Aber!: Diese Funktion wurde überhaupt erst notwendig, durch die Verdopplung der Bank Groups (mehr Bank Groups pro Refresh -> längere Refresh-Zeit). Im Vergleich zu DDR4 (mit der halben Anzahl an Bank Groups) dürfte sich das Ausnivellieren. Unterschiede (falls überhaupt vorhanden) bei realen Anwendungen&Spielen dürften so oder so im Bereich der Messungenauigkeit verschwinden.


Ich denke schlussendlich, dass man sehr wohl die ganz gewöhnliche Fromel (C) verwenden kann, um Latenzen/Latenzunterschiede auch (bis dato) über verschiedene Generationen von DDR Ram hinweg zu bestimmen.
Ich verstehe aber vielleicht woher das Denken kommt, dass DDR5 mehr Sachen anders macht, als es letzlich der Fall ist. Viele Techseiten nehmen halt das Pressematerial (aka Marketingmaterial), hinterfragen es kaum und posten das dann, ohne sich was bei zu denken.
Der Hersteller versucht natürlich alles als einzelne Merkmale hinzustellen, um eine möglichst lange Liste an Verbesserungen da stehen zu haben
Selbst hardwaretimes, die oftmals mehr als die gewöhnlichen Infos bieten, haben in ihren Artikeln zu DDR5 (jedenfalls die, in die ich jetzt mal kurz reingeschaut habe) viel von diesen Doppelnennungen & sogar faktisch falsche Informationen drin, die aus dem zusammenwerfen des Pressematerials von Ram-Herstellern zustande kommen.
(Dafür hatten sie (Hardwaretimes) mal echt gute Deep dives für GPU-Architekturen. Wo viele Seiten steif und fest behaupteten, dass RDNA2 ausschließlich Vektoreinheiten besitzt->onlyVectorBasedALUs, was so aber falsch ist - es gibt tatsächlich 2 skalare Einheiten pro ComputeUnit; Ist zwar deutlich weniger, als bei Nvidia, aber ist in jedem Falle vorhanden -, hatte Hardwaretimes das mal korrekt dargestellt (ich meine jedenfalls, dass die das gewesen wären))

Drewkev schrieb:
Die CAS Latenz ist zwar bei letzterem höher, aber in Benchmarks gleichauf mit 3600 CL16 bei bis zu doppeltem Datendurchsatz. Darauf habe ich mit meiner Aussage abgezielt.
Was dann halt schlussendlich Spiele, Anwendungen & Benchmarks bevorzugen (doppelte Speicherbandbreite (DDR5)/leicht niedrigere Latenz (DDR4)), ist vom Programm abhängig und teils sehr unterschiedlich.
Selbst bei Spielen, wo das zwar i.A. die Latenz ist, kommt es aber dennoch drauf an.
Auch im Gaming Test zu Alderlake hier auf CB bevorzugt ~1/3-1/2 der Spiele den DDR4 (hängen also noch stärker an der Latenz). Der andere Teil zieht auch einen Nutzen aus dem Plus an Speicherbandbreite und präferiert daher DDR5 oder hat gar keine Präferenz.
Das ist ja das schöne: Je nachdem, was man braucht, kann man aktuell entweder das eine, oder das andere wählen. Und in ein paar Quartalen bis Jahren wird DDR5 auch bei der Latenz komplett überholen.
 
Drewkev schrieb:
Ein 5400 CL36 Kit (keine x16 Chips) ist kaum langsamer als ein 3200 CL16 Kit.
Dagegen hatte ich nie etwas eingewendet. Dem stimme ich zu.
Drewkev schrieb:
Somit ist die Diskussion für mich beendet.
In Ordnung, verbleiben wir so:)
 
Drewkev schrieb:
Oder hatten wir aneinander vorbei geredet?
Möglicherweise. Mir ging es primär darum, dass die Formel zur Berechnung der Latenz korrekt und durchaus noch maßgebliche Relevanz zur Latenzberechnung (ns) hat (inwiefern da Programme/Spiele drauf anspringen und wie der doppelte Durchsatz da anschlägt ist ja ein anderer Punkt). Hatte das bei dir so verstanden, dass DDR5 noch 'mysteriöse andere Verbesserungen' neben der Channelaufteilung (und den damit einhergehenden notwendigen Anpassungen) bietet und die Formel daher nichtig wird.
Ich sehe da aber meist auch nur dann die technische Seite (ist das, was mich zumeist eher interessiert), aber vielleicht gibt es tatsächlich Leute, die daraus wirklich die Performance in ihrem Programm/Spiel unmittelbar ableiten wollen (Und dabei dann nicht die Eigenheiten/Präferenzen des Programms/Spiels bzw. den doppelten Durchsatz zu berücksichtigen usw.). Oder alleine daran festmachen wollen, welcher Speicher besser ist.

Zugegebenermaßen weiß man jetzt natürlich nicht, mit welcher Intention der Ursprungposter (warchild?) diese Umrechnung machte. An sich stimmt sie (grob) schon, eine Aussage über die reale Leistung gibt die reine ns Zahl allerdings nicht allgemeingültig an. Das muss/müsste natürlich für jede Anwendung ausgemessen werden.
 
Also ich hab jetzt keine Digitaltechnik studiert, aber alleine die Halbierung der Banks innerhalb von Bank Groups (aber nur bei 8Gb/1GB Chips) sorgt dafür, dass deine Daten mit einer viel höheren Wahrscheinlichkeit auf mehrere Bank Groups verteilt ist. Dazu kommen die Sub Channels, die zwar eher einen höheren Datendurchsatz ermöglichen, aber ebenfalls einen parallelen Zugriff ermöglichen, wenn ich das richtig verstanden habe. Es wird also nicht mehr auf die eine Bank Group von auf einem Rank zugegriffen und danach auf die andere, sondern auf beide (2 Gruppen a 4 Banks) gleichzeitig. Die Latenz ist bei unterschiedlichen Bank Groups nämlich halb so lang wie bei Banks in der selben Bank Group. Das ist auch der Grund, warum Single Rank genau so viele Bank Groups hat wie DDR4 Dual Rank und man deshalb keinen spürbaren Unterschied mehr zu Dual Rank feststellen wird und warum man x16 Chips (die gab es bei DDR4 meines Wissens gar nicht) tunlichst vermeiden sollte, da hier nur 4 Chips pro Rank verbaut sind. Das ist zwar bei bspw. 2x32GB nicht so schlimm, aber das macht genannte Verbesserung (Verdopplung der Bank Groups) wieder zu Nichte.

Elverado schrieb:
Hatte das bei dir so verstanden, dass DDR5 noch 'mysteriöse andere Verbesserungen' neben der Channelaufteilung (und den damit einhergehenden notwendigen Anpassungen) bietet und die Formel daher nichtig wird.
Vielleicht habe ich mich hier falsch ausgedrückt.

Gemeint war, dass
"mysteriöse andere Verbesserungen"
wie Same Bank Refresh zur Verbesserung der Latenz beitragen, da hier nicht mehr alle Banks aufeinmal refreshed werden und somit der IMC nicht mehr warten muss.


Das alles sind Gründe, warum DDR5 teilweiße jetzt schon schneller ist als DDR4 und zeigt das Potenzial von DDR5.
 
@Drewkev
Das Ziel ist es am Ende zwei quasi vollwertige Channel zu erhalten statt einem.
Die Subchannel kommen also nicht 'dazu', sondern sind eine Notwendigkeit, ohne die die Bank Group Aufteilung witzlos wäre (und umgekehrt).
Hab ein Schaubild gefunden, dass es vielleicht klarer macht:
https://www.igorslab.de/en/ddr5-dee...ry-standard-and-examples-from-the-practice/2/
Steht eigentlich alles in #46 von mir. Hätte man auch da nachlesen können^^
(und da habe ich auch beschrieben wieso REFsb keine nennenswerten Vorteile ggü. DDR4 bringt, sondern vorwiegend nur was ausgleicht)

Drewkev schrieb:
DDR5 teilweiße jetzt schon schneller ist als DDR4 und zeigt das Potenzial von DDR5.
Genau, je nach Anwendung ist DDR5 jetzt schon schneller, in ein paar Quartalen bis Jahren dann überall.


In diesem Sinne, nichts für ungut, aber ich glaube es wurde bereits alles gesagt. Wenn wir jetzt einfach ständig wiederholen, was wir bereits gesagt/geschrieben haben, drehen wir uns nur im Kreis und die Infos zu den ganzen Sachen stehen schließlich auch im Netz.
:)

Edit: wenn ich (sowohl in #46 als auch hier) von 'vollen/vollwertigen Channels' rede, meine ich Interface mit Banks&BG und allem drum und dran. Passender wäre wohl eher von einer Art 'virtuellem vollwertigen Modul' oder so zu reden (wobei da vllt. auch noch das ein oder andere fehlen würde).'Channel' jedenfalls würde sich ja streng genommen nur auf die Übertragung (aka Kanal) beziehen und nicht noch auf die Speicherbestückung usw., die ich aber dort mit einschließen wollte.
 
Zuletzt bearbeitet:
Ich habe den Gskil Tridend Z5 2x 16GB DDR5-6000 CL40.
Ein Parr mal habe ich das XMP-Profil geladen, aber dann komme ich nichtmal bis zum Windows mit.
Dann Gibts schon einen Bluescreen, mit 4800mhz läuft alles stabil.

Ich bin einfach zu doof zum übertakten, darum lasse ich es.
 
Zurück
Oben