Bluescreens und ähnliche Abstürze, meist bei wenig CPU Aktivität

JJ812

Cadet 1st Year
Registriert
Feb. 2024
Beiträge
9
Aktuelle Hardware:
  • Prozessor (CPU): AMD Ryzen 7 PRO 4750G with Radeon Graphics, 3593 MHz, 8 Kern(e), 16 logische(r) Prozessor(en)
  • Arbeitsspeicher (RAM): 2x16GB Crucial Pro DDR4 3200MHz; Intel XMP 2.0 - CP2K16G4DFRA32A
  • Mainboard: ASUSTeK COMPUTER INC. PRIME A520M-K
  • Netzteil: 500 Watt; 200~260V@47~63Hz Aktiv PFC; Mod.-Nr.: 57361/CSL20072; https://www.csl-computer.com/500-watt-csl-1.html
  • Grafikkarte: Prozessorintern: AMD Radeon Graphics Processor (0x1636), Advanced Micro Devices, Inc.-kompatibel, Extern: NVIDIA GeForce GTX 980
  • Gehäuse: Normales CSL Gehäuse
  • SSD: Samsung SSD 850 PRO 256GB & Intenso SSD SATAIII

2. Beschreibe dein Problem:

Hallo liebe CB-Mitglieder,
ich fange am Besten ganz von vorne an. Im April 2022 habe ich einen Aufrüst-PC von CSL erworben, da bei meinem alten Computer der CPU kaputt gegangen ist (teilweise eigenverschuldet 😅). Habe dementsprechend alle alte Hardware bis auf Mainboard und CPU übernommen. Nun ist es so, dass seit einiger Zeit (sicher schon seit einem Jahr, kann leider kein Datum nennen) mein Computer sehr oft abstürzt. Meistens landet er entweder kurz nach dem Hochfahren, oder aber z. B beim schauen von Videos o. Ä. (also insgesamt eher bei niedrigem Anspruch) im Bluescreen of death. Seit nicht allzulanger Zeit passiert es allerdings auch, dass sich der PC von selbst neustartet, ohne Fehlermeldung, oder einfach einfriert, woraufhin ich ihn manuell neustarten muss. Das interessante ist vielleicht, dass dies erst ein einziges mal beim Spielen von Videospielen vorgekommen ist, im Gegensatz dazu normalerweise mindestens 5 mal am Tag bei geringer Systemauslastung, wobei es an manchen Tagen auch gar nicht vorkommt.

Folgende Bluescreen-Stopcodes konnte ich bisher notieren:

IRQL_NOT_LESS_OR_EQUAL (Am häufigsten)
DRIVER_IRQL_NOT_LESS_OR_EQUAL (amdppm.sys)
KMODE_EXCPETION_NOT_HANDLED
PAGE_FAULT_IN_NONPAGED_AREA
SYSTEM_SERVICE_EXCEPTION
KERNEL_SECURITY_CHECK_FAILURE
CLOCK_WATCHDOG_TIMEOUT
DPC_WATCHDOG_VIOLATION
ATTEMPTED_EXECUTE_OF_NOEXECUTE_MEMORY
DRIVER_OVERRAN_STACK_BUFFER

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?

Vorab: Das größte Problem, auf welches ich beim ermitteln der Ursache getroffen bin, ist, dass man den Absturz nicht provozieren kann. Das heißt ich kann keine bestimmte Aktion ausführen, bei der ich weiß, dass das System normalerweise abstürzen würde. Somit hat das Testen bisher lange gedauert, da ich sozusagen auf einen Absturz "hoffen" muss um etwas auszuschließen.

Angefangen habe ich, indem ich alle Treiber, sowohl von Windows, NVIDIA, ASUS und AMD aktualisiert habe und dies immer noch tue - keine bemerkbare Veränderung.

Als nächstes habe ich den speziellen Fall von DRIVER_IRQL_NOT_LESS_OR_EQUAL mit Fehlerquelle:amdppm.sys, der noch nicht lange auftritt, während die anderen stopcodes schon immer vorkamen, gelöst, indem ich den Startwert des Treibers in der Registry von 3 auf 4 gestellt habe - ich weiß zwar, dass sowas meistens keine endgültige Lösung ist, allerdings kann ich immerhin diesen Stopcode damit verhindern, denke aber allein die Menge an anderen Codes zeigt, dass das Problem nicht hier liegen sollte (?).

Aktuell probiere ich nun also, das Problem einzugrenzen, indem ich Hardware teste.
Meinen Arbeitsspeicher habe ich bereits vollständig ausgetauscht, hatte sowieso neue geholt - keine Veränderung
Meine Festplatte, die vorher eine ältere HDD war, habe ich durch eine neue SSD ausgetauscht - keine Veränderung
Ich habe erst nacheinander die jeweils andere und dann gleichzeitig beide Grafikkarten (Interne von AMD-Prozessor und GTX 980) im Gerätemanager deaktiviert um zu sehen ob eine von beiden ein Problem verursacht - keine Veränderung

Windows wurde auch bereits neu aufgesetzt - keine Veränderung

Zum Schluss habe ich dann noch die BIOS-Einstellungen auf Standard zurückgesetzt (Musste CSM wieder aktivieren, da das System sonst kein Boot-Device findet), da solche Probleme soweit ich weiß oftmals von Prozessoreinstellungen stammen können. Habe da zwar nie dran rumgeschraubt, aber man weiß ja nie - keine Veränderung

Zusätzlich dazu auch probiert die Prozessorenergieleistung bei den Energieeinstellungen auf 99% statt 100% zu stellen, hatte mal gehört einigen half das - bei mir leider nicht

Prime95 Torture Test hatte ich mindestens 30 Minuten auch gemacht, aber bei 100%iger CPU-Auslastung schien der Computer stabil zu sein.

Fazit: Für mich kommt nur noch Hardwareprobleme am Prozessor, am Mainboard oder am Netzteil (Habe leider kaum Ahnung von Letzterem) infrage, oder aber ein Softwareproblem, was ich mir bei der Anzahl der Probleme allerdings nicht mehr wirklich vorstellen kann.

Kleiner Hinweis: Falls irgendwas an Informationen fehlt, bitte gerne nachfragen, ich kenne mich zwar ansich mit Computern nicht schlecht aus, aber nicht in dieser Tiefe 😬

Minidump Files für ein paar Beispiele der Abstürze sind im Anhang, leider etwas durcheinander. Beim Reinschauen mit WinDbg konnte ich nicht wirklich was herausfinden, vielleicht wird der ein oder andere hier schlau daraus.

Vielen Dank im Voraus und viele Grüße,
JJ

PS: Allein beim Schreiben dieses Beitrags, hatte ich drei Bluescreens und einen automatischen Neustart 😣
 

Anhänge

  • Minidump_JJ.zip
    4,1 MB · Aufrufe: 36
Zuletzt bearbeitet:
CPU stressen wenn die Kiste bei nix tun abschmiert ist kontraproduktiv. @JJ812

Fang mit dem Memtest an.
Ich denke auch an C-State Einstellungen im Bios.

Deine Windowsinstallation ist eine MBR Installation, deswegen musstest Du CSM wieder aktivieren.
 
  • Gefällt mir
Reaktionen: TheHille und MadDog
Dem Text kann man entnehmen, dass du schon einiges probiert hast. Das Wichtigste ist allerdings nicht erwähnt: Neuinstallation von Windows?
Ansonsten würde ich auch auf RAM tippen oder, was leider ab und an vorkommt CPU. Pins verbogen? Könnte viel erklären, denn auch da könnte es falsche Voltage-Werte theoretisch geben, die gerade die Abstürze im Idlenerklären könnten.
 
Ich tippe mal grob auf Netzteil .. so fing es bei mir auch mal an, kurz bevor mein Netzteil gestorben ist.
 
  • Gefällt mir
Reaktionen: Restart001
ram prüfen mit memtest86 v10
Zu 99% kommen die Fehler daher. bei amd ist der ram oft der Grund für solches verhalten.
irql ist meist ram oder Oc des imc (xmp)
Lösung wäre anderen ram kaufen auch ram kann defekt gehen hatte das zuletzt wo ich 4 x8 gb tauschen musste gegen ne 2 x16gb kit Ein Riegel war defekt. kann sein das der letzte agesa code den gegrillt hat also agesa v2 1.2.0.b Stabile ist der 1.2.0.7
mein verdacht ist das die ram spannung zu hoch wurde und den ram Riegel mitgenommen hat das ist mit xmp auf 1,375 auf 1,39v gegangen derzeit 1,385v mit dem letzten agesa. Standard ist 1,35v
Der Grund warum nun amd will garantieren das ddr4 3200 läuft bei allen chips von zen+ bis zen3 isn Kompromiss
Die ryzen 4xxxg laufen ab agesa 1.2.0.5 (2021) installieren würde ich den agesa 1.2.0.6 an (2022)
 
Endurance schrieb:
Neuinstallation von Windows?
Hatte ich vergessen zu erwähnen, ist auch schon geschehen, Windows komplett neu aufgesetzt vor einigen Monaten...
Ergänzung ()

Nickel schrieb:
Erst mal Memtest86, einen kompletten Durchlauf versuchen

BFF schrieb:
Fang mit dem Memtest an.

syfsyn schrieb:
ram prüfen mit memtest86 v10
Zu 99% kommen die Fehler daher. bei amd ist der ram oft der Grund für solches verhalten.
Memtest läuft aktuell, bisher kein Fehler.
RAM würde mich aber auch sehr wundern, wie gesagt ist gerade seit einem Monat neu ausgetauscht und sitzt auch richtig drin etc.
Ergänzung ()

Endurance schrieb:
Was leider ab und an vorkommt CPU. Pins verbogen? Könnte viel erklären, denn auch da könnte es falsche Voltage-Werte theoretisch geben, die gerade die Abstürze im Idlenerklären könnten.
Wie kann ich das am Besten überprüfen? Von außen sieht alles normal aus, aber bin bei dem Thema auch nicht so gut informiert
TheHille schrieb:
Da muss ich mich mal einlesen, noch nie davon gehört 😅
Ergänzung ()

Da einige jetzt aufs Netzteil tippen... Wie würdet ihr mir empfehlen das zu überprüfen, bzw. was gibt es beim Netzteil zu beachten?
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Restart001
Memtest86 ist durch, Ergebnis zeigt keine Fehler soweit.
(Entschuldigung für das verschwommene Bild, sollte aber alles erkennbar sein)

MemtestResult.jpeg


Global C-State habe ich jetzt im BIOS deaktivieren können, melde mich nochmal, wenn ich sagen kann ob eine Veränderung aufgetreten ist 👍
 
Schon mal gut.
Womöglich dann Software/Treiber/Tools Problem.
Windows Neuinstallation ohne unnötigen Treiber/Tools/Antivirenpro., ...
um Software Probleme ausschließen zu können.
Je nachdem das später machen.
 
Ich hatte sowas ähnliches auch mal. Da war das Problem das mein Netzteil zwar genug power in sachen Ausgangsleistungs-Total hatte aber halt nicht auf bestimmten Leitungen (in dem falle die 12V leitungen zur grafikkarte).

Das ganze war so auf kante genäht das es bei statischen belastungen zwar funktioniert hat aber bei Lastwechseln die kiste einfach ausgegangen ist. Wahrscheinlich weil die puffercaps zu klein waren.

Neues Netzteil und das ding lief bestens für weitere Jahre.

Das netzteil was du da hast ist so ziemlich das billigste teil was man finden kann. Leiter ist ein netzteil wechsel auch mit maximal arbeit verbunden. Die ganze Verkabelung muss halt neu gemacht werden.

Die theorie testen kann man indem du die grafikkarte ausbaust und mal bissel damit rumdödelst und gucken ob er dann immer noch die selben fehler zeigt. Irgend ein uralt spiel auf der internen Grafikkarte spielen oder sowas.
 
RizzoSpacerat schrieb:
Die theorie testen kann man indem du die grafikkarte ausbaust und mal bissel damit rumdödelst und gucken ob er dann immer noch die selben fehler zeigt. Irgend ein uralt spiel auf der internen Grafikkarte spielen oder sowas.
Hatte ja schon die externe Grafikkarte deaktiviert und den Rechner nur auf der internen laufen lassen, welche im Prozessor verbaut ist - ohne Erfolg.
Ist das nicht ungefähr das selbe bzw. auch ein Weg um die Leitungen zur Grafikkarte als Fehlerquelle auszuschließen?
Ergänzung ()

JJ812 schrieb:
Global C-State habe ich jetzt im BIOS deaktivieren können, melde mich nochmal, wenn ich sagen kann ob eine Veränderung aufgetreten ist 👍
Lief seitdem stabiler, hatte jetzt allerdings einen Bluescreen und einen Neustart seit gestern Mittag...
Habe Beiträge mit nahezu identischen Problemen und Fehlercodes gefunden, bei vielen half es dem Prozessor mehr Spannung zukommen zu lassen, hab jetzt im BIOS die "VDDCR CPU Voltage" (Falls mir das jemand genauer erklären kann, sehr gerne) von Auto auf Offset-Mode gestellt und den Offset auf den kleinstmöglichen Additionswert gestellt.

Ich weiß, Übertakten ist normalerweise eher kontraproduktiv, aber da es vielen geholfen hat werde ich dies erstmal versuchen... Ansonsten ist das Netzteil dran, melde mich wieder wenn ich was neues weiß!
 
Zuletzt bearbeitet:
JJ812 schrieb:
Ist das nicht ungefähr das selbe bzw. auch ein Weg um die Leitungen zur Grafikkarte als Fehlerquelle auszuschließen?
Ergänzung ()

Ich vertrau der firmware nicht. Ne Grafikkarte ausbauen ist mit das einfachste was man machen kann. 1 schraube und die Stromkabel ab. Du weißt nicht was die grafikakrte im deaktiviertem zustand macht. Ob die vielleicht nicht doch regelmäßig kurz aufwacht und transienten auf den Stromleitungen verursacht.

Wenn das auch nix bringt wäre mein nächster Versuch mal so ne Linux Live CD zu nehmen, davon zu booten und gucken ob der da auch abraucht. Bissel browsen und youtube gucken geht damit auch. Wenn es damit auch passiert ist die wahrscheinlichkeit das die Hardware respektive die firmware (aka bios) das problem ist).
 
RizzoSpacerat schrieb:
Die theorie testen kann man indem du die grafikkarte ausbaust
Grafikkarte war jetzt ne Weile ganz draußen, vorhin trotzdem abgestürzt...

Minidump im Anhang
Ergänzung ()

Also da ich auch nach dreifachem schrittweisem erhöhen der CPU-Spannung noch immer gelegentlich Bluescreens hatte, hab ich diese nun wieder auf "Auto" gestellt.
Global C-States zu deaktiveren scheint das System stabiler gemacht zu haben, zumindest ist die Frequenz der Abstürze deutlich kleiner geworden.
Da sie allerdings trotzdem noch auftreten, wäre meine Vermutung nun das Netzteil oder nach wie vor Hardwareprobleme an Mainboard/CPU... Netzteil austauschen wäre dann wohl der nächste Schritt?
 

Anhänge

  • 022224-8562-01.zip
    120 KB · Aufrufe: 26
amd hat seit am3 (2009) bei den mainboards chipsätzen eine Schutzfunktion das bei überhitzten vrm die cpu drastisch drosselt.
Abstürze gibt es damit nicht aber deutliche perf Einbrüche
Deine Probleme zeigen deutlich auf ram hin dabei muss der ram nicht mal defekt sein. Es reicht wenn das mainboard nicht zu 100% kompatibel ist mit den ram latenzen obwohl das eher Sache des agesa ist.
Generell Rate ich von den a520 a320 chipsätzen ab da diese explizit für die athlon 3000 300g 200g reihe gedacht sind (dual quad core cpu) maximal würde ich da nen 65w ryzen 3 von 3000g bis 5000g einsetzen
Mit einen top blower als Kühlung

Hatte mal den Fall das ein 5600g mit nen b550 Brett ein gskill ripjaws v ram permanent Probleme machte am ende lag es am ram die sk hynx chips waren nicht mit dem mainbaord kompatibel dagegen in meine Älteren x99 Brett (msi) laufen diese ohne irgendwelche Fehler. Memtest86 hat auch keine Fehler gebracht.
ram ist zickig da hilft wirklich nur kompa listen durchgehen und den neuesten agesa aufspielen.
Das hat sich mit amd expo ab am5 erledigt da amd endlich ein OC prüfverfahren einführt und somit kompatiblem ram beim kauf erkannt werden kann obwohl wie intel xmp das eine Empfehlung ist und dennoch je nach cpu Güte mal der expo Takt nicht erreicht werden kann das ist reines glück.
Ab ddr5 ist der ramtakt quasi egal als gamer. Daher eher jedec Norm oder expo mit ddr5 5200 ja die gibt es
Bei am4 rate ich zum blick ins manual kompa listen vom mainboard. Wie gesagt gskill bietet das an oder veraltete auf der mainboard webpage als pdf. Viele dieser ramkits gibt es oft nicht mehr was einen zwingt gskill aufzurufen da andere Hersteller keine geprüfte ramkits haben da ist es pures glück das es läuft.

Sicher ist nur eins jedec läuft auf intel Systemen immer bei amd, mal ja, mal nein0. Xmp läuft auf intel Systemen sicher.
Einzig gskill prüft ob amd Systeme mit den ramkits laufen.

Es kann auch sein das der Festplattenspeicher schwebende Sektoren hat.
Das prüft man mit crystal disk info oder mit dem program seatools, das ist von seagate und prüft ob HDD Probleme machen das basiert auf smart und einen Testlauf das daten ließt und Sektoren prüft (nicht für ssd geeignet)
Bei Ssd wird es kompliziert da muss man sich auf crystal disk info verlassen bzw auf Herstellertools
 
syfsyn schrieb:
Bei am4 rate ich zum blick ins manual kompa listen vom mainboard.
Reicht der Fakt, dass ich in der Kompatibilitätsliste meinen RAM nicht finde, als Beweis dafür, dass die beiden nicht richtig kompatibel sind?


RAM1.jpg


RAM2.jpg


Wobei es mich wundern würde, wenn CSL in meinem Computer RAM einbaut, der nicht kompatibel mit dem Mainboard ist, das Problem hatte ich ja schon bevor ich meinen RAM ausgetauscht habe...
 
Das ist dem System Integrator ziemlich egal der sieht ddr4 erforderlich nimmt ddr4 3200 offizielle Angabe amd und fertig.
Normalerweise funktionieren ja ramkits aber es kann vorkommen das ein board zickig reagiert.
 
00 nt!KeBugCheckEx
01 nt!guard_icall_bugcheck
02 amdppm!AcpiCStateIdleExecute
03 nt!PpmIdleExecuteTransition
04 nt!PoIdle
05 nt!KiIdleLoop

0x139_0_LEGACY_GS_VIOLATION_amdppm!AcpiCStateIdleExecute


Die Tage hatte schon mal jemand gemeint an die C1 Einstellungen im BIOS zu spielen.

Auch ein BIOS Update solltest du mal probieren, deins ist von 2020:

BiosVersion = 1401
BiosReleaseDate = 12/04/2020
SystemManufacturer = CSL-Computer GmbH & Co. KG
BaseBoardManufacturer = ASUSTeK COMPUTER INC.
BaseBoardProduct = PRIME A520M-K


Das neuste BIOS hat Version 3405 vom 2024/01/08.
 
Zurück
Oben