7900xtx: Crash und Reset nach Treiber-Installation im Edge

Pummeluff

Lt. Commander
Registriert
März 2021
Beiträge
1.480
Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)

1. Nenne uns bitte deine aktuelle Hardware:

2. Beschreibe dein Problem. Je genauer und besser du dein Problem beschreibst, desto besser kann dir geholfen werden (zusätzliche Bilder könnten z. B. hilfreich sein):
Anfang letzten Jahres hab ich meinem Sohn einen Gaming-Rechner zusammengebastelt.

Installiert wurde im Dualboot Arch Linux (zum Zocken und als normales System) und Windows 11 (Fortnite).

Windows
Windows hab ich relativ nackig gehalten. Installierte Drittherstellersoftware:
  • Adrenalin-Treiber
  • Armoury Crate (hab ich dann wieder runtergeschmissen).
  • Fortnite

Windows-Updates wurden immer fleißig eingespielt.

Nach einiger Zeit bin ich dann auf dieses Problem gestoßen.

Dazu kam das Problem, wenn ich den Edge oder den iCUE-Installer gestartet hatte, fror nach kurzer Zeit der Bildschirm ein. Dann erschien dieses Bild:
IMG20250611212456.jpg

Kurz danach folgt der Reset, und der Rechner rebootet.

Interessanterweise lief Fortnite auf 120 Hz bei 4K vollkommen stabil.

Arch-Linux
Hier zockte mein Kleiner Minecraft. Unter Linux gab's generell nie Probleme. Der Grafik-Treiber ist im Kernel drin. Linux lief absolut stabil.

3. Welche Schritte hast du bereits unternommen/versucht, um das Problem zu lösen und was hat es gebracht?
Vor ein paar Tagen kam ein neues Fortnite-Update raus. Fortnite meckerte, dass nicht mehr genügend Festplattenspeicher vorhanden sei. Um das Problem mit dem Freeze + Reset zu lösen, hab ich dann gleich mal eine Neuinstallation von Windows vorgenommen.

1. Installationsversuch:
  • Basisinstallation klappt. Recher läuft vollkommen stabil. Es ist noch nichts Sonstiges installiert. Edge läuft problemlos.
  • Schmeiß ich die Windows-Updates an, schaltet Windows bei "irgendeinem" Update mal die Auflösung ein paar Mal um. Es sind nur noch 2 Modi vorhanden. Der erste ist vollkommen kaputt. Der 2. ist dann 864x486. Nach dem Reboot hab ich wieder 4K-Auflösung
  • Die AMD-Treiber versucht das Windows-Update vergeblich zu installieren. Fehlermeldung: Download nicht möglich.
  • Nach dem Start von Edge und etwas Umhersurfen, bekomm ich wieder den o.g. Freeze und den Reset.

2. Installationsversuch:
  • Basisinstallation klappt. Recher läuft vollkommen stabil. Es ist noch nichts Sonstiges installiert. Edge läuft problemlos.
  • Ich installiere den Adrenalin-Treiber über den Installer von der AMD-Seite. Die Windows-Updates hab ich deaktiviert, da die sonst die Installation des Adrenalin-Treiber blockieren. Zumindest meckert der Installer.
  • Nach Reboot, Start von Edge und etwas Umhersurfen, bekomm ich wieder den o.g. Freeze und den Reset.

Windows hat mir natürlich auch die Arch-Installation zerschossen. Im UEFI-Menü wird mir die Linux-Platte als Windows-Bootplatte angezeigt. Das muss ich morgen erst mal reparieren.

Ich hab einen ähnlichen Rechner (Ryzen 7950x + Powercolor Hellhound 7900xtx). Der läuft absolut stabil mit dem 65W-Profil. Ich zock darauf auch Spiele mit halbwegigen Grafikkartenanforderungen in 4k, u.a. Witcher 3, Doom Eternal usw. Allerdings hab ich auf meinem Rechner kein Windows installiert.

Was mich an der ganzen Geschichte stutzig macht:
  • Unter Linux läuft die Graka generell stabil.
  • Unter Windows läuft Fortnite stabil (120Hz, 4K)
  • Bei Edge und iCUE schmiert der Rechner nach kurzer Zeit ab.

Was werd ich in den nächsten Tagen mal testen:
  • Grafikkarte tauschen: Meine 7900xtx in den Rechner meines Sohnes und seine Graka in meinen Rechner

Mit der Gewährleistung könnte es problematisch werden. Ich hatte die Karte am 04.02.2024 bei Mindfactory gekauft.

Wenn's kein Hardwareschaden der Graka sein sollte, woran kann es dann liegen?
 
Habe jetzt mal ein wenig "quer" gelesen, auch in deinem anderen Thread. Schein ja was mit dem Armoury Crate zu tun zu haben. Ich habe zumindest bei meinem Asus board die Option im Bios dieses Armoury Create komplett zu deaktivieren. Ich habe es bei mir noch aktiviert gelassen, habe selbst in Windows davon aber nichts installiert oder sonst wie irgendwie "bewusst" davon gebrauch gemacht.

Ich sehe das aber so, wie einige in deinem anderen Thread schon geschrieben haben. Alles komplett nackig machen und neu installieren. Und dann im Idealfall vorher diese Option im Bios nutzen.

Ich habe bei einer Clean install oder generell einer Neuinstallation eines AMD Grafiktreibers noch nie ein Thema mit einer fehlenden oder fehlerhaften vc_runtime gehabt.

Das sind für mich typisch solche Fehler, wo du noch lange suchen kannst, aber am ende wahrscheinlich ehh alles neuinstallierst und damit am ende "sicherer" und zeit sparender gefahren wärst, wenn du es gleich gemacht hättest.
 
Ich hab jetzt schon mit Neuinstallation angefangen.

Im OCCT hab ich den VRAM-Test durchlaufen lassen. Jetzt teste ich gerade über OCCT den RAM, gestern hab ich das schon mal mit Memtest86 laufen lassen. Bisher sind keine Fehler zu sehen.
 
Hatte heute mal etwas Zeit zum Testen. Die KI hat mir einige Tipps ausgespuckt. Davon hab ich Folgendes gemacht:
  • Update Motherboard-BIOS
  • Im BIOS das Overclocking-Profil von 6000 Mhz auf Auto umgestellt.
  • Das Eco-Profil von 65 TDP auf Defaultwert (Auto) umgestellt.
  • OCCT: VRAM-Prüfung
  • Trixx: BIOS der Graka von Primär auf Sekundär geändert.
  • DDU: Im abgesicherten Modus (man ist der mittlerweile versteckt) den Grakatreiber komplett deinstalliert und anschließend neu installiert.
Hat bisher alles nichts gebracht. Start des Edge lässt das System nach ca. 10 Sekunden abschmieren.

Morgen oder am Wochenende werd ich mal die Graka zwischen den beiden Rechner tauschen.
 
Hi,

Hast du schon mal den Event Viewer nach Auffälligkeiten durchforstet? Nicht selten hat mir dieser in der Vergangenheit unerwarteterweise geholfen, Probleme mit dem OS und anderer Software zu lösen.

Auserdem noch hierzu eine Frage:
Pummeluff schrieb:
Ich hab jetzt schon mit Neuinstallation angefangen.
Bedeutet das, Windoof ist schon neu installiert, aber die Probleme treten immer noch auf?


Viele Grüße
 
Domml schrieb:
Bedeutet das, Windoof ist schon neu installiert, aber die Probleme treten immer noch auf?
Ja, hatte Windows mind. 5x installiert.

Update: Es läuft wieder ohne Fehler
Ich hab dann die Grafikkarten getauscht.

Meine Graka (Powercolor 7900xtx Hellhound) hab ich in den Rechner meines Sohnes eingebaut. Edge lief damit problemlos. Der Rechner stürzte nicht mehr ab. Schlussfolgerung: Graka muss einen Treffer weghaben.

Aber: Ich hab dann die Sapphire 7900xtx in meinen Rechner eingebaut. Ein Test unter Windows war da natürlich nicht möglich, da ich kein Windows hab. Getestet hab ich die Graka da unter Linux mit:
  • Ollama + Deepseek 32b: Damit wird der VRAM mit 24GB gefüllt. Überwachung mit amdgpu_top
  • Half-Live RTX Demo
  • Cyberpunk 2077 - Benchmark mit RTX
  • Soma: Zock ich gerade. Hab ich einige Stunden gespielt.
Die Grafikkarte lief absolut zuverlässig und stabil über mehrere Stunden hinweg.

Am nächsten Tag hab ich dann wieder die Grafikkarten getauscht. Und jetzt lief die auch im anderen Rechner, ohne das Edge das System zum Absturz brachte.

Jetzt steht ich etwas ratlos da. Ich hab keine Erklärung, warum vor dem Ausbau die Graka diese Macken hatte und warum die nach dem Wiedereinbau auf einmal keine Probleme mehr machte. Am System, wie es jetzt läuft, hab ich nichts geändert gegenüber der Konfiguration vor den Tests.

Domml schrieb:
Hast du schon mal den Event Viewer nach Auffälligkeiten durchforstet?
Ja, hatte ich. Da stand nur drin, dass das System unerwartet heruntergefahren wurde.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Domml
Zu früh gefreut. Das Problem tritt wieder auf. Und diesmal sogar unter Linux. Und diesmal hab ich sogar ein paar Fehlermeldungen:

Code:
Jun 15 15:22:45 fox kernel: amdgpu 0000:03:00.0: amdgpu: SMU: I'm not done with your previous command: SMN_C2PMSG_66:0x00000029 SMN_C2PMSG_82:0x00000000
Jun 15 15:22:45 fox kernel: amdgpu 0000:03:00.0: amdgpu: Failed to disable gfxoff!
Jun 15 15:22:47 fox kernel: snd_hda_intel 0000:03:00.1: Refused to change power state from D0 to D3hot
Jun 15 15:22:50 fox kernel: amdgpu 0000:03:00.0: amdgpu: Dumping IP State
Jun 15 15:22:50 fox kernel: amdgpu 0000:03:00.0: amdgpu: SMU: I'm not done with your previous command: SMN_C2PMSG_66:0x00000029 SMN_C2PMSG_82:0x00000000
Jun 15 15:22:50 fox kernel: amdgpu 0000:03:00.0: amdgpu: Failed to set workload mask 0x00000001
Jun 15 15:22:50 fox kernel: amdgpu 0000:03:00.0: amdgpu: (-62) failed to disable fullscreen 3D power profile mode
Jun 15 15:22:56 fox kernel: amdgpu 0000:03:00.0: amdgpu: SMU: I'm not done with your previous command: SMN_C2PMSG_66:0x00000029 SMN_C2PMSG_82:0x00000000
Jun 15 15:22:56 fox kernel: amdgpu 0000:03:00.0: amdgpu: Failed to disable gfxoff!
Jun 15 15:23:01 fox kernel: amdgpu 0000:03:00.0: amdgpu: SMU: I'm not done with your previous command: SMN_C2PMSG_66:0x00000029 SMN_C2PMSG_82:0x00000000
Jun 15 15:23:01 fox kernel: amdgpu 0000:03:00.0: amdgpu: Failed to disable gfxoff!
Jun 15 15:23:05 fox kernel: amdgpu 0000:03:00.0: [drm] *ERROR* dc_dmub_srv_log_diagnostic_data: DMCUB error - collecting diagnostic data
Jun 15 15:23:07 fox kernel: amdgpu 0000:03:00.0: amdgpu: SMU: I'm not done with your previous command: SMN_C2PMSG_66:0x00000029 SMN_C2PMSG_82:0x00000000
Jun 15 15:23:07 fox kernel: amdgpu 0000:03:00.0: amdgpu: Failed to disable gfxoff!
Jun 15 15:23:07 fox kernel: amdgpu 0000:03:00.0: amdgpu: SMU: response:0xFFFFFFFF for index:36 param:0x00000001 message:SetWorkloadMask?
Jun 15 15:23:07 fox kernel: amdgpu 0000:03:00.0: amdgpu: Failed to set workload mask 0x00000001
Jun 15 15:23:07 fox kernel: amdgpu 0000:03:00.0: amdgpu: failed to set default power profile mode
Jun 15 15:23:07 fox kernel: amdgpu 0000:03:00.0: amdgpu: SMU: response:0xFFFFFFFF for index:41 param:0x00000000 message:DisallowGfxOff?
Jun 15 15:23:07 fox kernel: amdgpu 0000:03:00.0: amdgpu: Failed to disable gfxoff!
Jun 15 15:23:08 fox kernel: snd_hda_intel 0000:03:00.1: Unable to change power state from D0 to D0, device inaccessible
Jun 15 15:23:09 fox kernel: clocksource: Long readout interval, skipping watchdog check: cs_nsec: 1101026551 wd_nsec: 1101030019
Jun 15 15:23:11 fox kernel: amdgpu 0000:03:00.0: amdgpu: MES failed to respond to msg=MISC (WAIT_REG_MEM)
Jun 15 15:23:11 fox kernel: [drm:amdgpu_mes_reg_write_reg_wait [amdgpu]] *ERROR* failed to reg_write_reg_wait
Jun 15 15:23:13 fox kernel: amdgpu 0000:03:00.0: amdgpu: MES failed to respond to msg=MISC (WAIT_REG_MEM)
Jun 15 15:23:13 fox kernel: [drm:amdgpu_mes_reg_write_reg_wait [amdgpu]] *ERROR* failed to reg_write_reg_wait
Die Fehlermeldungen (1, 2, 3) lassen dann durchaus darauf schließen, dass wohl gerade die Sapphire Nitro+ 7900 xtx irgendwelche Probleme im Low-Power-Bereich hat. Eventuell probier ich mich mal an einem BIOS-Update.

Hab auch schon nach den Abstürzen sowohl unter Windows als auch unter Linux mit dem Gedanken gespielt, bei Mindfactory die Gewährleistung in Anspruch zu nehmen. Ob die allerdings nach der Insolvenz so kooperativ sind, wage ich zu bezweifeln. Außerdem lief die Karte in meinem doch ziemlich baugleichen Rechner absolut problemlos. Im Falls eines Hardwaredefekts könnte durchaus noch das Netzteil oder das Motherboard eine Ursache sein.

Fehlersuche am PC ist blöd, wenn man die Ursache nicht eindeutig bestimmen kann.

Update
Hab grad mal die Google-Bildersuche angeschmissen. Interessant dabei ist, dass der Monitor ebenfalls ein Samsung Odyssey ist. Den hätte ich jetzt überhaupt nicht als Kandidat mit einbezogen.

Gibt noch mehr Leute, die Dunkeln stochern.
 
Zuletzt bearbeitet:
In der Fehlermeldung kommt mir etwas ganz seltsam vor:
Bash:
snd_hda_intel 0000:03:00.1: Refused to change power state from D0 to D3hot

Wo kommt der HD Audio Chip "Intel" her? Das Board hat nur einen Realtek ALC1220 und die Soundkarte von der Grafikkarte (AMD).

Es sieht so aus als ob das Powermanagement des Systems generell verbuggt ist und blockiert. Eventuell könnte man den Treiber snd_hda_intel auch testweise blacklisten, um zu schauen, ob der irgendetwas blockiert.

Update: Es wäre auch interessant, was ein "fox kernel" ist. Das sieht nicht wie ein Standardkernel aus.
 
Zuletzt bearbeitet:
rollmoped schrieb:
Wo kommt der HD Audio Chip "Intel" her? Das Board hat nur einen Realtek ALC1220
snd-hda-intel ist der generische Audiotreiber, der die AL97-Chips untersützt.

rollmoped schrieb:
Es wäre auch interessant, was ein "fox kernel" ist. Das sieht nicht wie ein Standardkernel aus.
fox ist der Rechnername. Kernel ist der Standardkernel von Arch-Linux.
 
  • Gefällt mir
Reaktionen: rollmoped
OK. Dann wären einige Ungereimtheiten aufgeklärt.

Du könntest schauen, ob du die Karte stabil bekommst, wenn du im Radeon Treiber alle Power States heruntertaktest, also zum Beispiel überall 10-20% mit dem Takt heruntergehst. Falls die Karte dann stabil läuft, ist sie einfach defekt (bzw. dann wäre klar, was defekt ist).
 
Zuletzt bearbeitet:
Zurück
Oben