2700X Prime95/Windows Abstürze

ascer

Captain
Registriert
Juni 2008
Beiträge
3.703
Huhu,

ich habe ein interessantes Problem mit meinem PC.

Bisher lief alles problemlos, d.h. Streaming, Spiele, Browsen usw.
In Prime95 allerdings (SmallFFTs) hält er höchstens mal eine Stunde durch, i.d.R. stürzt er schon nach wenigen Minuten ab. Spannend dabei ist, dass man keine Fehlermeldung in Prime95 sieht. Der Monitor wird plötzlich einfach schwarz und nichts reagiert mehr. Selbst Reset- und Power-Button nicht. Ich muss das Netzteil abschalten und mehrere Sekunden warten, bis ich wieder anschalte (sonst geht der PC einfach nicht wieder an).

Hardware (neu):
ASUS Prime X470 Pro
AMD Ryzen 7 2700X
G.Skill Trident Z 32GB, DDR4-2800, CL14


Hardware (alt):
Gainward GeForce GTX 1080 Phoenix GS
Seasonic Platinum Series 660W

Das interessante an der Geschichte ist nun, dass ich Windows eigentlich nur zum Spielen usw. nutze. Die meiste Zeit bin ich unter Linux unterwegs. Genau der gleiche Tests, Prime95 SmallFFTs, läuft bisher 1h unter Linux ohne Probleme. Unter Linux nutze ich z.B. ROS/TensorFlow für Robotik/AI Zeug, d.h. ich laste CPU, GPU und RAM mit Simulationen deutlich mehr aus, als das ein gewöhnliches Spiel o.Ä. tut.

Auch andere Dinge unter Linux, z.B. GCC in einer Schleife kompilieren (um auch 100% usage als simulierten Stresstest für Kompilierungen zu haben) lief bisher 8h mit 16 Threads fehlerfrei.

Noch spannender ist, dass ich diese komischen Blackscreens (wenn auch lange nicht so häufig) schon mit meiner alten Hardware unter Windows hatte (i5 2500K). Dort lief aber Prime95 ziemlich stabil, war eher zufällig mal 1x pro Woche oder so. Zumindest konnte ich kein Muster feststellen, trat auch beim Spielen usw. mal auf. Mit der neuen Hardware habe ich Abstürze bis jetzt nur unter Prime95 beobachten können, dort dafür aber eben ziemlich schnell.

Windows 10 habe ich schon komplett neu installiert (also nicht reparieren oder Dergleichen, sondern aktuelle iso geladen, auf USB-Stick gepackt und die Windows-SSD komplett platt gemacht).

Wie kann denn Linux stabil laufen, Windows aber so rumzicken? Trotz Neuinstallation?

Ich hatte auch schon an Netzteil und Grafikkarte gedacht, aber unter Prime95 tut die GPU ja gar nichts. Unter Linux hingegen, wenn ich eine AI Simulation laufen lasse, ist die 1080 teilweise Stunden auf 90-100%. Ohne Probleme. Gleiches für die CPU (d.h. Belastung vom Netzteil unter Linux deutlich höher und länger als unter Windows).

Wenn also die GPU oder das Netzteil da unter Windows einknicken, müssten die unter Linux ja erst recht für Fehler sorgen.

Irgendeine Idee?
 
ASUS Prime X470-Pro
G.SKILL > 32Gb > vier Module a 8Gb ?

BIOS Version ist welche ?
 
Zuletzt bearbeitet:
CPU und / oder RAM übertaktet?
 
2x16GB G.Skill Trident Z sind das. Timings und Voltage gemäß G.Skill eingestellt, d.h. 14-14-14-35 @ 1.35V bei 2800 MHz.

Neuestes BIOS (4011).

CPU läuft alles auf Auto. Unter Linux läuft die übrigens auch mit -0.05V Offset stabil. Wegen Windows hab ich aktuell aber alles bei der CPU wieder auf Auto/Default gesetzt.

Lasse jetzt gerade Mal memtest laufen.
 
RAM-Module sind in welchen RAM-Bänken ?

In A2 und B2 sollten sie eingesetzt sein - ein Modul in B2 -

2x16GB G.Skill Trident Z sind das. > Hier zunächst 2666Mhz testen
 
Jup, A2 und B2.

Hanne schrieb:
2x16GB G.Skill Trident Z sind das. > Hier zunächst 2666Mhz testen

Probier ich nach Memtest mal aus. Ist Windows bei sowas empfindlich(er)?

Das witzige ist ja wie gesagt das Linux problemlos läuft...bei meinem alten i5 2500k hatte ich allerdings auch OC RAM, das werde ich mal weiter verfolgen.
 
Zuletzt bearbeitet:
RAM-Module herausnehmen und in B2 + A2 wieder korrekt einsetzen - es reicht nicht unbedingt, dass die seitlichen Klammern eingerastet sind - mit 2666Mhz sollten die G.SKILL - Module problemlos funktionieren -

DDR3 sind hier nicht vergleichbar -
 
Zuletzt bearbeitet:
Ich hatte das Problem mit meinem R7 1700 auch mal, ist auch ein bisschen komisch wie ich das Problem gehoben habe, bei mir lag es an der art wie ich im Bios übertaktet habe. Dort gibts ja DID und FID oder wie das heißt, hab ich gerade nicht im Kopf, dort habe ich vorher die Werte 8 und 144 waren es glaube eingeben um auf 3,6GHz zu kommen, Prime95 angeschmissen, direkt schwarzer bildschirm oder nach 5minuten.

Dann hab ich irgend wann mal im bios irgendwo einfach 3600 eingegeben, hat auch funktioniert, wieder Prime95 an, und siehe da, komplett stabil.

Noch eine komische sache, im Bios eingestellt geht max 3,6GHz stabil, egal wie hoch die Spannung, in Ryzen Master mit der Selben Spannung sogar 3,7GHz warum ist das so?

Vcore bei Prime95 immer mit 1344K testen, und wenn du die Temperatur Testen willst, 8K

8K = Entlarvt unzureichende Kühlung
448K = Entlarvt falsch gesetzte CPU-Input-Spannung
512/576K = "" Chache Uncore und Ringbus Spannung
800K = Entlarvt falsche RAM Spannung oder Timings
1344K = Entlarvt falsche Kernspannung
 
Ein ähnliches Problem habe ich auch gerade. Ich habe Prime95 Blend über Nacht laufen lassen. Am nächsten Morgen läuft das System im Leerlauf wie nach einem Neustart. Die Ereignisanzeige spuckt folgendes aus: Kernel-Power, Ereignis-ID 41, Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde. Das Ganze geschieht etwa eine Stunde nach Start von Prime.

Meine Komponenten sind sehr ähnlich zu deinen:
Asus Prime X370-Pro BIOS 4011
AMD Ryzen 7 2700X
16GB Crucial Ballisitix Elite DDR4-3466 (bisher ohne Erfolg auf 3133 heruntergegangen)

Bis auf den Speicher lief alles auf Standardeinstellungen. Eventuell gibt es Bei dieser BIOS-Version Probleme mit dem Speicher.
 
Hanne schrieb:
mit 2666Mhz sollten die G.SKILL - Module problemlos funktionieren

Ich hab sie jetzt mal auf AUTO gelassen, dann stellt das BIOS 2.166 MHz ein, und dort tritt der Fehler auch auf.


WHAT THE FUCK!

Aktuell läuft die Kiste seit 1h 30min Prime95 stable ohne Absturz. Ich will es nicht beschreien, aber scheint gefixed zu sein.

Alles, was ich jetzt nochmal geändert habe, ist "AURA" abzustellen im BIOS.

Mir kam es gleich sehr seltsam vor, dass Linux stabil (auch Prime) läuft, Windows aber abstürzt. Und das es keine Fehlermeldung gibt -> Bildschirm einfach schwarz, selbst Power-Button reagiert nicht mehr...das lässt ja darauf schließen, dass direkt das Mainboard freezed und gar nichts mehr macht, nicht aber Prime (Fehler dort) oder Windows (bluescreen) selbst.

Nach einiger Google-Suche bin ich auf etwas interessantes gestoßen, was einige ASUS und wohl auch ein paar ASRock Nutzer berichten.

AURA ändert die LEDs auf dem Mainboard nicht einfach irgendwie, sondern per default anhand der CPU-Temperatur. Seit einiger Zeit verwendet ASUS (und anscheinend wohl auch ASRock) neue Sensoren und beim Auslesen der Temperaturen vertragen die keine parallelen Zugriffe, d.h. AURA greift auf die Temps zu, dann HWiNFO unter Windows usw. -> Crash sobald sie zufällig gleichzeitig zugreifen, was eben recht schnell passiert.

Es würde auch erklären, warum Linux stabil läuft: ohne Kernel-Fix kann Linux selbst mit aktuellem Kernel 4.16 die Temperatursensoren von Ryzen 2000 / X470 nicht auslesen. Unter Linux kann ich also gar nicht auf die Sensoren zugreifen und dort lief dann ja alles stundenlang stabil. Eben auch Prime95.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: brookse
EDIT: Prime95 lief jetzt 2 Stunden ohne jegliche Probleme. Danach habe ich nochmal MemTest laufen lassen, ebenfalls keine Probleme. Jetzt habe ich den RAM wieder auf DDR4 2800 mit manuellen 14-14-14-35 Timings bei 1.35V usw. und nochmal Memtest laufen lassen. Wieder ohne Probleme.

Aktuell läuft Prime95 jetzt unter Windows mit den neuen 2800er CL14 Timings. Bis jetzt 1 Std. 30 Min. ohne Probleme.

Das Problem scheint in der Tat gefixed und es ist wohl in der Tat der Temperatursensor auf dem Mainboard, der einfach komplett das Mainboard freezed wenn parallel auf ihn zugegriffen wird. AURA abzuschalten und unter Windows dann nur ein Programm das Sensordaten ausliest, wie etwa HWiNFO, laufen zu lassen, hilft.

Sehr interessantes Problem, Derartiges hatte ich auch noch nie. Ohne Reddit & Co. wäre ich darauf auch glaube ich nicht gekommen^^
 
Auch wenn dein Problem gelöst ist, kann ich die Ursache nicht bestätigen. Greife mit demselben Board sehr oft gleichzeitig mit Afterburner, HWinfo und CPU-Z auf den Sensor zu (gehe zumindest davon aus, dass bei drei laufenden Programmen, gleichzeitige Zugriffe passieren sollten). Bisher deswegen noch nie ein Freeze gehabt.

Aura haben ich allerdings grundsätzlich aus. Das Geflacker bringt bei geschlossenem Case sowieso nichts.
 
Hast du auch BIOS 4011?

Probier Mal bitte mit Aura an.
 
Sers,

hab den Thread mal verfolg und leider das gleiche Problem, jedoch mit dem ASUS ROG Strix x470-F. Dachte bei mir erst es liegt an der CAM Software der NZXT Kraken 52, als ich diese abgeschaltet bzw. deinstalliert hatte, war zumindest mal für einige Zeit ruhe. Leider hatte ich trotzdem immer mal wieder einen schwarzen Bildschirm und der PC lies sich nur über den Stromschalter "neustarten". Bin dann vom 4011 Bios eine Version runter und es war merklich besser. Hatte aber eben wieder einen schwarzen Bildschirm, hab nun aber auch mal Aura komplett deaktiviert, mal sehen ob es besser wird.

Leider kann man die Kraken ja ohne die Software überhaupt nicht steuern.
 
Soulblighter schrieb:
gleiche Problem, jedoch mit dem ASUS ROG Strix x470-F

Ja, es sind wohl mehrere Boards betroffen und auch nicht nur ASUS. Zumindest sieht es so aus, als wäre es eben irgendwas mit den Temperatursensoren und die werden anscheinend von ASUS und ASRock auf mehreren Boards verbaut.


Soulblighter schrieb:
nun aber auch mal Aura komplett deaktiviert,

Das wäre sehr interessant, wenn du jetzt mal ohen AURA testest. Am besten ganz ohne HWiNFO & Co. einfach nur Prime laufen lassen.

Bei mir kam es zwischenzeitlich noch 1x zu einem Absturz mit HWiNFO und CPU-Z. Davor und danach allerdings nicht. 6h+ Prime95 stable und auch diverse Spiele und Streaming jetzt getestet. Alles problemlos, solange eben nichts lief was irgendwie die Temps auslesen würde.
 
Bei mir ist das teilweise schon direkt nach dem Start passiert. HWiNFO hab ich schon gar nicht mehr installiert, dumm bei mir ist eben, ich brauch die Kraken Software weil diese auf meiner Grafikkarte sitzt und ich hab noch dazu Corsair Link, weil die 115i Pro auf meiner CPU sitzt. Sind schon 2 Programme die die Werte eben auslesen.

Wie gesagt ich hatte nun eigentlich das ganze Wochenende über keine Probleme, keine Abstürze etc, nur eben einen und seitdem Ruhe. Werde es auf jeden Fall die Tage weiter beobachten, ist ehrlich gesagt auch sau nervig das ganze. Dachte erst mein Board sei defekt, zumal die CAM Software wohl e nicht so der Bringer ist wenn man so im Inet nachschaut.
 
@ascer
Bin noch auf 4008. Kann natürlich daran liegen.
 
@Soulblighter: Ich kenne jetzt die Kraken-Software nicht, aber die GPU-Sensoren dürften davon unbetroffen sein. Soweit ich Google'n konnte, geht es darum, dass das BIOS sich verabschiedet (deshalb auch direkt schwarzer Bildschirm und keinerlei Reaktion mehr), wenn die CPU-Sensoren parallel bzw. einfach in zu kurzen Intervallen und vor allem von verschiedenen Prozessen gepollt werden.

@Phear: Das wäre lustig, wenn z.B. AURA o.Ä. einfach anders/häufiger die Daten abruft in 4008 als in 4011. Wie gesagt, magst du mal mit AURA an oder gar 4011 testen? Ich werde dann demnächst vielleicht auch erstmal testweise wieder "zurückflashen".

Ich hab auch mal ein Ticket beim ASUS-Support erstellt. Solltest du, @Soulblighter, auch mal tun. Wenn die genug Tickets kriegen wird sich hoffentlich jemand der Thematik annehmen.


EDIT: Wenn wir es auf bestimmte BIOS-Revisionen, AURA o.Ä. einigermaßen eingrenzen können, wäre eventuell auch ein Sammelthread auf CB hier schon eine Idee?!
 
Die Cam Software liest alles aus, CPU zumindest Temp., Last, Clock Speed und Lüftergeschwindigkeit. Wie gesagt kann natürlich auch echt an der Software selbst liegen.

https://support.camwebapp.com/forum.../12883536-pc-hard-freezing-using-cam-software

Das hier hatte ich zumindest dazu gefunden. Also ich lass nun erst mal Aura aus und bleibe auf der Bios Version 4008 bisher klappt das eigentlich ganz gut. Ansonsten müsste ich mal versuchen auf die Kraken und die Corsair Software zu verzichten, dann hätte ich erstmal kein Programm mehr welches auf die Sensoren zugreifen würde.

Das mit dem Ticket werde ich mal in Angriff nehmen bzw. im Hardwareluxx Forum wäre auch ein Asus-Hersteller Support, diese könnte man ebenfalls mal auf den Thread aufmerksam machen.

Hast du eigentlich Reddit Post wo du das gelesen hattest?
 
Ich finde gerade tatsächlich den Reddit-Post nicht wieder (der hatte so eine schöne Zusammenfassung), aber der hatte unter anderem folgende Links (die hab ich natürlich gespeichert...):


Overclock.net:
My experience with the Asus PRIME X370-Pro

At that point I knew the AI suite is giving crap...uninstalled it and ever since I didn't have random black screens.

Vor und nach dem Post gehen die Leute dort noch genauer drauf ein: HWiNFO und anderes parallel laufen lassen mit dem AI Zeug von ASUS, auch z.B. im BIOS, führt zu blackscreens.


ASUS Forum:
ROG STRIX B350-F GAMING issues

No its not a coincidence: If you have BOTH the AI Suite AND Hwinfo loaded at the same time you will get black screens!!! I have verified this and since I used either of the two (not at the same time) the black screens have stopped!


Tom's Hardware:
Please Help! New Ryzen build issue.

OK guys need some help here. I just upgraded to a AMD Ryzen 5 2600 X with a ASUS x470 prime MB. The problem that I am having is randomly the PC will black screen. The monitors go black and the PC is hard locked to where the only way I can get it to reset is to cycle the power supply switch.

OK I think you are using two monitoring software like Corsair link with HWinfo or similar. Run only single monitoring software in background and this will solve your issue. AISuite is also a monitoring software. But you can run any GPU oc software like Afterburner+ a hwinfo to monitor CPU usage etc. Try it and report.

This series of boards can not handle two or more program using sensors to report these data. So if you use HWmonitor then you can not use any other sw which collects similar info from mobo. Like the Aura has a smart lighting feature which changes with change of cpu temp: if you have activated this + using hwinfo to check other things you will get random freeze.
 
Zurück
Oben