Mein Graka-Modding- und Reparaturblog

06.02.23: R7 260X Baustelle
IMG_0528.JPG


Bisher gemacht:
  • PCI-Express Stromstecker fehlte komplett, wieder einen eingelötet
  • Shunt-Widerstände ersetzt (rechts unter dem Stecker)
  • Kondensator ersetzt (erstmal von der Rückseite)
  • MEM Mosfet ersetzt (unter dem Stromstecker)
  • Ein lowside GPU VRM Mosfet der untersten Phase war kurzgeschlossen, ersetzt
IMG_0528_2.jpg


Ich habe die Mosfets von der Phase rechts unter dem Stromstecker ausgelötet und der Short besteht immer noch. Ich dachte erst, das wäre GPU PLL, und die Mem Phase wäre links über den GPU Phasen, aber es scheint genau andersrum zu sein.
Ich hab rechts nämlich mal vorsichtig Spannung injiziert, und das einzige was auch nur annähernd warm wird, sind die Ram Chips. Bei 1V 4A werden aber komischweise alle gleichzeitig warm (die oberen beiden noch mehr als die beiden rechts). Periphere Bauteile verursachen den Kurzschluss also nicht, es sind schon die Chips selber.
Jetzt hätte ich gedacht, dass nur der eine Chip heiß wird, der den Kurzschluss hat. Es können ja nicht alle gleichzeitig ein Problem haben. Sowieso hätte ich gedacht, dass es am ehesten noch der Chip unter dem Stecker ist, und ich da aus Versehen ein-zwei Lötkugeln unter dem Mem gebrückt habe, als ich die Mosfets runtergenommen hab.

Also Kurzfassung: Short auf Mem Phase auch mit entfernten Mosfets, mit Spannung drauf werden alle gleichzeitig warm. Diagnose? Falls ihr ne Idee habt, gerne.
 
  • Gefällt mir
Reaktionen: Banger
@Masterchief79 das wäre doch was für dich:
Ein schnell auswechselbarer Chip
 
Cooler Blog :)
 
  • Gefällt mir
Reaktionen: Masterchief79
@andi_sco Besten Dank für das Feature! :D
@Demon_666 Danke auch da :)
Haldi schrieb:
Das mit den externen VRM boards für GPU's im Extreme OC ist nicht mehr so häufig oder?
Liegt das daran das die von Haus aus bereits so extrem über Dimensioniert sind?
Oder gibt's da inzwischen Extra hergestellte Boards die man 1x kauft und dann für jeden Versuch verwendet?

Gute Frage, beides tatsächlich. Früher hatten die Chips mit entsprechenden Kühlmethoden jede Menge Headroom, was knapp bemessene VRMs schnell ans Limit gebracht hat. Heutzutage sind VRMs großzügiger, und die Chips haben weniger Spielraum.
Außerdem gab es mal das EVGA E-Power Board in verschiedenen Iterationen: https://de.evga.com/articles/01140/evga-epower-v/
Das ist natürlich einfacher und angenehmer, als halbe Grafikkarten irgendwo aufzulöten. :D Viele Rekorde von älteren Grakas sind damit entstanden, und nicht unbedingt mit selbstgebastelen Zombies. Hatte ich im Studium damals aber nicht die Kohle für, und jetzt ist es anscheinend discontinued.

Blog-Update 13.02.: Sparkle GTX460 und (doch wieder) Neuanschaffungen

Ich habe aus dem letzten eBay Konvolut eine GTX460 1GB, die einen Kurzschluss auf der 3,3V Rail hatte und wo jede Menge SMD-Bauteile fehlten. Den Kurzschluss habe ich mittels Labornetzteil mittlerweile gefunden. Ich hab leider keine Wärmebildkamera, sondern muss halt per Hand gucken, was warm wird.
20230209_234552.jpg


Die Karte lief kurz, 3D Mark Vantage ist dann mit Bildfehlern abgestürzt. Schnell einen Mats Memtest gemacht und folgendes Ergebnis:

20230210_134949.jpg

Diese Meldung hatte ich bisher noch nicht. Scheint ein Memory-Segmentierungsfehler zu sein.
Dann nochmal den Durchgangswiderstand am Mem VRM gemessen - 12 Ohm. Das sollten eigentlich um die 70-90 Ohm sein.
Ich weiß noch nicht ganz genau worans liegt, aber diverse Kondensatoren, die ich auf der Rückseite der GPU ersetzt habe, hängen direkt an dieser Mem Rail dran. Da ich zu der Karte keine Schematics habe, liegt die Vermutung nahe, dass ich einen Kondensator mit falschem Wert erwischt habe. Wenn ich das raushabe, bin ich aber guter Dinge, dass ich dieses Ding wieder zum Laufen kriege - wäre nen cooles Erfolgserlebnis.
Ich hab auch eine POV GTX460 TGT, die hat dasselbe PCB. Ich könnte die fraglichen Bauteile also auch einfach da auslöten, messen und wieder einlöten. Hatte nur gehofft, mir das bei der funktionierenden Karte sparen zu können.

Und ich habs doch wieder nicht sein lassen können, und ein paar Neuzugänge ersteigert. Werde hier natürlich ausführlich berichten, wenn ich die Karten habe - das Paket war ein bisschen teurer, alles ungetestet, und es sind auch ein paar neuere Kärtchen dabei ;) Langsam Skills ausbauen und steigern!
 

Anhänge

  • 20230210_134945.jpg
    20230210_134945.jpg
    1,5 MB · Aufrufe: 127
  • Gefällt mir
Reaktionen: calippo, Banger, Haldi und 3 andere
Glückwunsch zum Startseiten Post.
Cooler Thread, liest sich nach einem echt zeitintensiven Hobby :D

Solltest du Interesse an einer MSI GTX 770 2GB, Referenzdesign haben (VRAM defekt bzw mit Artefakten und Abstürzen bei 3D Last) sag bescheid.
 
  • Gefällt mir
Reaktionen: Masterchief79
Danke dir! Memory kriege ich mittlerweile ganz gut repariert, aber bevor ich das bei neueren Karten (oder für andere User) mache, brauche ich noch ein bisschen Übung und Equipment.

Immerhin heute eine 8800GTS mit Speicherfehlern repariert bekommen, aber solche alten Karten sind auch noch mal was anderes...

16.02. GTX460 Fail und 8800GTS Win

Die Sparkle GTX460, von der ich oben berichtet habe, ist leider nicht mehr zu retten. Korrigiert mich, wenn ich falsch liege, aber: Der Widerstand auf der Memory Rail ist viel zu niedrig. Ich habe wieder mein Labornetzteil mit 1V/2A auf die Spule gehangen und es wird nur die GPU warm. Speicherchips sind eiskalt. Heißt für mich: Der IMC in der GPU hat's hinter sich, und die Karte braucht eine neue GPU.
Aktuell würde ich sagen, der initiale Short auf der 3,3V Rail hat damit was zu tun, aber da fehlt mir die Erfahrung und das Fachwissen. Meine Reparaturarbeiten sollten damit jedenfalls nichts zu tun haben, ich hab nur ein paar Kondensatoren ersetzt.

Heute auch zwei große Pakete mit neuem Spielzeug bekommen. Mehr Details in der Zukunft, aber: Der größte Win bisher war eine MSI 8800GTS mit Speicherfehlern.

Also, Bestandsaufnahme: Keine Kurzschlüsse, die Karte gibt ein Bild aus, aber mit Streifen und mein Testlinux crasht beim Starten.
Außerdem ist das Ding mit irgendeinem Öl zugeschmockt, so was widerliches hab ich lange nicht gesehen. Wirkt so, als hätte irgendwer vor 10 Jahren Sonnenblumenöl als WLP verwendet (woher ich weiß, wie das riechen würde, fragt ihr bitte nicht :D)

20230215_183108.jpg


20230215_183120.jpg




Mit der 8800GTS als zweite Karte kann ich den Memtest durchführen, solange das Bildsignal durch meine good old HD4350 kommt. Test schlägt fehl - leider kriegt man bei so einer alten Karte auch nicht raus, welcher Ramchip genau Fehler macht.
Kühler gegen ein passendes Sparkle Custom Design getauscht, der andere ist sofort im Müll gelandet.
20230215_210902.jpg


Kühler im Detail, die Lüfter waren damals defekt, aber Sparkle hat eine integrierte Lüftersteuerung eingebaut. Der Temperatursensor ist einfach in der GPU Baseplate eingeklebt.

20230215_220300.jpg

20230215_220326.jpg


Frontplate gabs damals auch schon.
Auf dem nächsten Pic habe ich die ersten vier Ramchips schon reflowed, also auf ~225°C angewärmt und das Lötzinn flüssig werden lassen. Das hat wunderbar geklappt, die Streifen im Bild sind gonzo! Meistens sind gebrochene Lötstellen unter dem Ram an sowas Schuld, die Chips an sich sind okay.
Es hätte auch noch einer der sechs anderen Ramchips (oder gar Lötstellen unter der GPU) sein können, aber in dem Fall habe ich wohl einfach mal Glück gehabt.

20230215_220908.jpg


Die Karte läuft jetzt einwandfrei und ist eine der guten A3-Karten, die sich deutlich besser übertakten lassen. Ab Werk sind schon 576/850 statt 513/800 eingestellt.
Lustigerweise wird der untere Teil des Heatspreaders gar nicht von dem Kühler bedeckt, was man damals anscheinend einfach in Kauf genommen hat.

Screenshots von den Tests und weiter Bilder morgen, jetzt ist Schlafenszeit. :n8:
 
  • Gefällt mir
Reaktionen: Demon_666 und Banger
01.03. Das Hardware-Labor ist umgezogen

Nach einer langen Woche ist der Umzug in die neue Bleibe vollbracht und die ersten Hardware-Kisten sind schon ausgepackt. Das ist ungefähr die Hälfte...

001.jpg


Ich bin sogar schon zum reparieren einiger weiterer Karten gekommen, dafür sind noch keine Lampen an den Decken... Prioritäten :D
  • 3x 8800GTS 320/640 (2x Speicherfehler durch fehlende Kondensatoren, 1x Mem Reflow)
  • XFX 8600GTS (Mem Reflow)
  • XFX HD7770 (neun PCI-E Kondensatoren ersetzt, teilweise fehlende Pads)
Hier noch ein paar Pics von der 8600 GTS - XFX hat da einfach 1,5V default reingeballert, kein Wunder, dass die so heiß wird (84°C unter Last mit neuer WLP und sauberem Kühler). Und der saß vollkommen zu, als ich die Karte bekommen habe :freak:

20230228_201328.jpg
20230228_201036.jpg

06 default.JPG


Geht jetzt aber jetzt wieder wie am ersten Tag.
 
  • Gefällt mir
Reaktionen: andi_sco, Sion3, Banger und eine weitere Person
Banger schrieb:
Sieht fast aus wie meine damalige 8600GT von XFX.
Jo wie gesagt, die XFX-Karten aus der Ära sind alle sehr ähnlich aufgebaut. Eine 8800GT unterscheidet sich da auch nicht groß. Macht einen immer nostalgisch ;)

andi_sco schrieb:
Deckenfluter für die Ecke?
In dem Raum gibts ne Lampe, aber das ist auch nur der Heizraum, da bleibt die Werkstatt langfristig zum Glück nicht :D

06.03. 8600 GTS Bench-Update
Die 8600GTS macht OC-technisch ne richtig gute Figur nach der Reparatur. Die höhere Default-Spannung von 1,5V (Nvidia: 1,35V) hilft da enorm. Mit dem Kühler einer 9800 GTX sind mal eben Taktraten von 972/2050/1300MHz möglich (original 675/1400/1000). Das sind ungefähr 35% Mehrleistung unter Luft.
Ein dezenter Voltmod ist schon drauf, aber der bringt bei der Karte kaum was, weil der Controller bei mehr als +150mV automatisch abschaltet. Und das ist durch Überschwinger beim Lastwechsel schnell erreicht - daher kann ich aktuell nicht mehr als 1,55V geben. Beim Speicher hat die Erhöhung von 2,05V auf 2,165V aber ca. 100MHz mehr gebracht.

20230306_165308.jpg


20230306_174405.jpg

052.JPG


Was heißt das? ENTWEDER baue ich jetzt meine Kokü drauf und benche die Karte so wie sie ist, ohne die GPU-Voltage weiter anheben zu können. Das dürfte für Top 10 Ergebnisse reichen - ich bin jetzt mit dem Luftkühler auf HWBot schon in den Top 20-30 je nach Benchmark, und das bei jeweils 150-200 Scores in der Datenbank. Ehrlich gesagt komplett lächerlich, wie einfach das mit dieser Karte war. :D

ODER: Wir haben unseren Zombie-Kandidaten für das GTS250 ePower Board aus dem Eingangspost gefunden! :D In der Theorie kann ich damit dann frei über die Spannung verfügen, brauche mich nicht weiter mit den Schutzmechanismen des 8600er VRMs auseinandersetzen und muss keine Angst haben, dass sich das gar verabschiedet. Zudem müsste die Spannnung deutlich stabiler stehen, wenn 8 Phasen takten, statt der originalen 2.

Wir gehen natürlich für Option 2 und basteln dieses ePower Board da drauf!

20230306_174326.jpg


Hier schon mal die Messwerte mit dem originalen XFX VRM und Voltmod +75mV:
  • 1,55V Idle an den Spulen
  • 1,51V Idle Rückseite der GPU
  • Schwankend zwischen 1,47-1,49V Last Rückseite GPU (20 mV Ripple)
Ich bin mal gespannt, wie schwierig sich das gestaltet. Mögliche Stolpersteine, die ich sehe:
  • Der 8600 GTS VRM Controller (ISL 6568) hat einen PGOOD (Power Good) Pin, der den anderen Komponenten auf dem Board signalisiert, dass die GPU Spannung vorhanden ist und innerhalb der gesetzten Parameter ist. Im Datenblatt steht dazu:
PGOOD During normal operation PGOOD indicates whether the output voltage is within specified overvoltage and undervoltage limits. If the output voltage exceeds these limits or a reset event occurs (such as an overcurrent event), PGOOD is pulled low. PGOOD is always low prior to the end of soft-start.
  • Wenn ich die Spulen auslöte und dort mein ePower Board anklemme, muss ich diesen Pin wahrscheinlich manuell auf High legen - werde da noch nicht ganz schlau draus und muss nochmal genau messen und studieren. Diese Logik ohne Tutorial zu beeinflussen ist neu für mich.
  • Das Auslöten und die Kabelführung wird etwas ätzend, weil die XFX-Karte da nicht gerade viel Platz bietet.
20230306_174343_2.jpg


  • Dann hat auch das GTS250 ePower Board vielleicht Schutzmechanismen, die ich noch nicht gefunden habe. Ist ja auch nur eine zersägte Graka. Andererseits habe ich die "Schwesterkarte" schon unter Kokü gequält, ohne dass mir was aufgefallen wäre.

Ich halt euch auf dem Laufenden! :daumen:
 
  • Gefällt mir
Reaktionen: Banger und andi_sco
Masterchief79 schrieb:
Ok👍🏼

Sage mal, könnte ich dir mal eine Zotac GeForce 9600 GT schicken?

Ein Widerstand hat sich gelöst (liegt bei) und es gibt Pixelbrei als Bild
 
Klar, gucke ich mir an 👍
Bildfehler auch schon vor dem fehlenden Bauteil gehabt?

Edit: Dieses PCB?
Davon hätte ich sogar noch ne Spenderkarte :D
db3055a9a2adc7ac8f63c2cafeffa86f-1200x900.jpg
 
19.03. 8600GTS Zombie läuft (wieder)

Hier nochmal der Rundown zu dem Projekt und was sich in der Zwischenzeit getan hat.
Ziel: Spulen (unten in rot) auslöten und die + Seite meines Power Boards damit verbinden. Massepunkte gibt es üblicherweise genügend, aber halt nur zwei Lötpunkte hierfür. Außerdem sollten die Kabel möglichst kurz sein, um den Spannungsabfall möglichst klein zu halten.

20230306_174343_2.jpg



Spulen runter, ging leichter als erwartet. Vorher noch einmal mit dem Oszi nachgemessen, welche Seite denn eigentlich mit der GPU, und welche mit dem originalen VRM verbunden ist - sind die inneren beiden Lötpunkte.

20230307_195506.jpg



Die Karte hat eine große, obenliegende "Power Plane", die die Spannungswandler mit der GPU verbindet. Auf der ganzen Ebene liegen ~1,4V für die GPU an. Ich habe einfach die Lötmaske abgekratzt und mir noch ein paar Lötpunkte geschaffen, was theoretisch wiederum geringeren Spannungsabfall bedeutet (außerdem sind die näher an der GPU).

20230307_200902.jpg


Ich konnte das Power Board leider nur um 90° gedreht auflöten, was ziemlich unpraktisch ist, zum Beispiel für die Kühlermontage. Funktioniert aber genauso.

20230319_164207.jpg


Am 07.03. hatte ich den Zombie zum ersten Mal am Laufen. Mit dem "Power Good" Pin des GPU IC musste ich mich (zunächst) nicht rumschlagen, alles lief direkt. Der Controller hat nicht gemerkt, dass seine Spulen fehlten.
Nach ein paar Tests hatte ich einen ungesund-elektronischen Geruch in der Nase und hab schnell zum Netzteil gegriffen. Beim erneuten Booten gab die Karte kein Bild mehr aus und komischerweise hatte der vRam keine Spannung mehr.

Kurzer Exkurs zur "Startup Sequence" vom VRM: Erstmal müssen die Versorgungsspannungen an den richtigen Punkten anliegen, also 12V am Slot und ggf. am Stecker, 3,3V am Slot und ggf. 5V, die sich die Karte selber macht. Dann prüft der GPU IC auf korrekte Parameter (Über-/Unterspannung, -/temperatur) und meldet über seinen PWRGOOD Pin das Okay an den Memory-Controller und die GPU. (Wird auf jede Karte etwas anders gehandhabt, aber so grob).

Hier ist mal ein beispielhaftes Diagramm aus dem Datenblatt einer HD5770. Links kommt das PWRGOOD Signal rein (VDDC = GPU), rechts geht das Enable Signal für VDDCI (Memory) und MVDDQ (glaube GPU PLL) raus.


1679245818444.png



Ich weiß nicht genau was passiert ist, aber ich habe am PWRGD Pin nachgemessen und der hatte keine Spannung anliegen, dementsprechend hatte auch der Memory-Controller kein grünes Licht.

20230307_193528_2.jpg

Ich hab einfach 3,3V vom Slot genommen und mit einem sehr dünnen Draht auf den PWRGOOD Pin des Controllers gelötet (ein dünner Draht ist auch ne Sicherung). Und Erfolg! Jetzt hat der Memory wieder Spannung.


Für den Kühler habe ich einfach einen alten 775 Tower Kühler genommen, der gerade noch so draufpasst. Funktioniert mit 55° Last ganz gut, auch wenns ein bisschen Tüftelei brauchte.

20230319_164151.jpg

20230319_182545.jpg
20230319_182614.jpg



Hier nochmal ein Bild vom Testen, hier lief das Dingen gerade mit 875/1900/1275 im 3D Mark 05.

20230319_172921.jpg



Ja, und was hat das ganze jetzt eigentlich gebracht? Hier noch mal die Messwerte mit dem originalen VRM:
  • 1,55V Idle an den Spulen
  • 1,51V Idle Rückseite der GPU
  • Schwankend zwischen 1,47-1,49V Last Rückseite GPU (20 mV Ripple)
Und jetzt mit GTS 250 Power Board:
  • 1,43V Idle an den Spulen
  • 1,425V Idle Rückseite der GPU
  • ca. 20mV Ripple
Es hat anscheinend richtig was gebracht, das Power Board direkt auf die Power Plane zu löten, denn zwischen VRM und GPU ist quasi kein Voltage Drop mehr. Beim Ripple bin ich mir unsicher, ich kanns jetzt dank der Backplate für den Kühler nicht mehr messen.
Das andere ist die freie Einstellbarkeit. Freu mich aufs weitere testen!
 

Anhänge

  • 20230319_164207.jpg
    20230319_164207.jpg
    311,2 KB · Aufrufe: 85
  • Gefällt mir
Reaktionen: andi_sco, Banger und WiP3R
Wäre stilecht, mal Crysis 1 auf getretenen und untoten Karten zu testen. Muss ja spürbar bessere Leistung geben und dann mit dem OC durchaus das höheranginge Modell mit Stock-Takt Paroli bieten. :D
 
  • Gefällt mir
Reaktionen: andi_sco
Jo, könnte ich eigentlich auch mal testen. Sofern die Karte noch lebt, wenn ich mit allen Benchmarks durch bin. :D Paar Vergleiche zur Leistung im 3D Mark 03:
  • 8600GTS@stock: ~22000 Punkte
  • 8600GTS@OC mit Zombie: ~31000 Punkte (Weltrekord sind 33750)
  • 8800 GTS 320MB@stock: ~38000 Punkte
Ich habe zwischen Power Board und 8600er noch ein paar weitere Kabel eingelötet, hauptsächlich Masse. Dadurch gibt es jetzt 5 Plus und 5 Minus-Kabel, was den Voltage Drop weiter verringert hat und für Leistungsaufnahme von 300-400W locker reichen sollte. Das erreiche ich damit sowieso nicht.
20230322_094211.jpg


Anschließend wurde die Karte mit Power Board und Kokü (relativ) erfolgreich durch die erste Bench-Session geprügelt. Dadurch ist auch der 31k Score entstanden, was Platz 7 auf HWBot ist. Ich konnte sogar noch höhere Taktraten fahren und hab das Limit des Chips noch gar nicht erreicht gehabt, UND die Spannung lag gerade mal bei 1,5V unter Last. 1080MHz GPU und 2280MHz Shader liefen problemlos, und andere Kollegen geben mit chilled H2O oder Kokü auch gerne mal 1,8-1,9V. Das Ding scheint also noch Potenzial zu haben!

image_id_2888334.jpeg


Ich hab allerdings noch ein Haar in der Suppe gefunden, und zwar: Nach ca. 1 Stunde benchen fiel die GPU Spannung auf 0,3-0,5V ab. Nach ein bisschen Ursachenforschung habe ich dann rausgefunden, dass dieser Chip auf dem Power Board sehr heiß wird (up6281). Muss ich mal gucken, ob ich das mit Austausch eines korrodierten Bauteils auf der Rückseite, bessere Kühlung des ICs oder Austausch des ICs behoben bekomme.

20230322_094032.jpg
20230322_094047.jpg


Die Spawas selber scheint die Leistungsaufnahme wiederum nicht im geringsten zu interessieren. Die werden bei Volllast bei 1,5V+ und 50% OC vielleicht handwarm.
 
  • Gefällt mir
Reaktionen: Banger
Zurück
Oben