Ryzen + ECC

the_nobs

Commander
Registriert
März 2009
Beiträge
2.297
Hallo

habe jetzt a bisserl herumgesucht, aber noch keine Definitve aussage gefunden

Gibts schon AM4 Mainboards die ECC unterstützen? (funktionsfähig, nicht nur steckerkompatibel)
Gibts schon Erfahrungsberichte?
(also brauch ich dazu speziellen RAM der in einer Vollmondnacht von Jungfrauen gefertigt wurde, oder so ähnliches :evillol: ) oder tut das einfach?
 
Falls es funktioniert, reicht stinknormales unbuffered ECC DDR4, gleiches RAM wie die Xeon E3. Übertakter RAM ist hier sowieso nicht, JEDEC Norm only.

Die CPUs haben an sich Support und wird auch nicht explizit abgeschaltet wie bei i5/i7, wird aber beim Binning nicht getestet, d.h. es kann defekt sein, genauso wie ein Kern defekt sein kann damit die CPU dann als 6Kerner statt 8Kernen verkauft wird.

Die Mainboards müssen ECC allerdings via UEFI zugänglich machen bzw. anschalten. Wie schon in der Vergangenheit ist Asrock hier Vorreiter, d.h. wenn es geht, dann auf Asrock Boards.
 
Hab mir grad mal als Beispiel die Spezifikationen vom Fatal1ty AB350 Gaming K4 angeschaut - dort wird ECC Support ausdrücklich aufgeführt. Der Speichercontroller müsste ja eh in der CPU sein, Ryzen unterstützt ECC, und dieses Board auch, also sollte es doch eigentlich dann auch funktionieren.
 
Wenn es klappte bitte ich um Rückmeldung. Würde auch gerne auf ECC wechseln.
 
oldmanhunting schrieb:
Eventl. hilft Dir ja dieser Artikel weiter wegen Ryzen und ECC RAM: ...

Super, genau so etwas habe ich gesucht

Für alle die es interessiert:
Technisch sollte es gehen, aber so richtig tut noch die Unterstützung im OS nicht (weder Linux noch Windows)!
da werden vermutlich noch einige Updates nötig sein bis das endgültig funktioniert.
 
Es muss auch von Board unterstützt werden und da sieht es auch sehr unterschiedliche und teils sehr schlecht aus. Generell laufen Unbuffered (UDIMM) ECC RAM überall wo die normalen RAMs auch laufen, die ECC haben eben nur einen Chip mehr, die Technik ist ja schon identisch und leider schreiben daher inzwischen immer mehr Board Hersteller auch ECC in die Speicherspezifikation rein, nur steht dann eben zuweilen erst im Handbuch, dass dies dann im None-ECC Modus läuft. Wenn nichts dasteht, weiß man aber immer noch nicht sicher, dass die ECC Funktion auch unterstützt wird. Bei einigen Boards hängt es wohl auch von der BIOS Version ab und Menupunkte wie RAM Scrubbing die es bei Bestückung mit ECC RAM im älteren BIOS gab, fehlen im neuen wieder.

AMD hat ausgesagt, dass ECC im Prinzip geht aber nicht validiert ist. Die Naples werden nach bisherigem Wissensstand aus 4 der genau gleichen Dies bestehen die in den jetzt schon verkauften RYZEN 7 stecken, ECC müsste also vorhanden sein und wenn es da einen Bug gibt, hat AMD mit dem Zeitplan für Naples wohl ein echtes Problem. Dann hätten aber wohl auch die Board Hersteller ein Problem, wenn sie nun ECC RAM Unterstützung versprechen, Sammelklagen können in den USA schnell teuer werden und schon von daher dürfte sich keiner aus dem Fenster lehnen wollen und allzu offen über die ECC RAM Unterstützung informieren. Es bleibt also letztlich ein Risiko ob die ECC Funktion wirklich gegeben ist und ob Tools den Status und ggf. aufgetretene Fehler korrekt anzeigen. Ich würde erwarten das mit dem Erscheinen von Naples mehr Klarheit herrscht.
Ergänzung ()

oldmanhunting schrieb:
Eventl. hilft Dir ja dieser Artikel weiter wegen Ryzen und ECC RAM: ECC Memory & AMD's Ryzen - A Deep Dive
Eigentlich will ich nicht der Reparaturbetrieb des Internets sein, da würde ich auch nicht hinterher kommen bei dem ganzen Unsinn der da verzapft wird, aber auf zwei Stellen möchte ich doch eingehen:
Soft und Hard Errors sind nicht Single- oder Multibit Fehler, sondern Soft Errors sind im funktionierendem RAM spontan, meist durch Strahlung, auftretende Bitfehler. Hard Errors sind Fehler in der Hardware, wenn also ein Bit bei bestimmten Bedingungen wie etwa dem Wert der Nachbarbits dann immer einen Fehler aufweist. Letztere können Tools wie Memtest86 in den allermeisten Fälle finden, deshalb machen sie ja auch so umfangreiche Tests mit allem möglichen Bitkombinationen. Um Soft Errors zu finden ist die Zeit zwischen dem Schreiben und erneuten Auslesen bei diesen Tests zu kurz, es müsste schon massive Stahlung vorliegen um gerade in der kurzen Zeit das Kippen eines Bits zu provozieren.

"Two-bit errors cannot be corrected by ECC memory." ist so pauschal falsch, vorher wurde ja sogar noch aufgelistet was die Ausgabe von wmic memphysical get memoryerrorcorrection bedeutet: "2 (unknown), 4 (parity), 5 (single-bit ECC), or 6 (multi-bit ECC)" Es gibt auch ECC RAM Systeme die mehr als nur Singlebit Fehler korrigieren können wie z.B. Chipkill, welches aber dann z.B. bei Intel nur von den großen Xeon E5/7 und nicht von den kleinen E3 unterstützt wird.

Im übrigen würde mich im Test noch die Ausgabe von cat /sys/module/edac_core/parameters/edac_mc_panic_on_ue interessieren, denn darüber wird die Reaktion auf unkorrigierbare RAM Fehler eingestellt bzw. ausgelesen.
 
Zuletzt bearbeitet:
the_nobs schrieb:
Für alle die es interessiert:
Technisch sollte es gehen, aber so richtig tut noch die Unterstützung im OS nicht (weder Linux noch Windows)!
da werden vermutlich noch einige Updates nötig sein bis das endgültig funktioniert.
Zumindest unter Linux funktioniert die ECC-Unterstützung genau so wie es sein soll.
Dass der Autor meint, bei einem unkorrigierbaren Fehler müsse sofort das System angehalten werden, basiert auf einem Missverständnis seinerseits.
 
Zurück
Oben