PC bootet nicht mit Nvidia Tesla GPU

atrt123

Newbie
Registriert
Nov. 2022
Beiträge
5
Ich habe mir letztens eine gebrauchte, aber funktionsfähige Nvidia Tesla K20 5GB gekauft. Ich habe die Karte von einem vertrauenswürdigen Händler gekauft, schnell und gut verpackt ohne Beschädigung erhalten, doch als ich die Karte testen wollte, fingen die Probleme an.

Das Problem: Keiner meiner PCs bootet mit der Grafikkarte.

Randnotiz: Ich weiß, dass es sich bei allem um alte Hardware handelt, die EOL ist. Es kann sein, dass die Probleme daher kommen. Aber "auf alten Pferden lernt man reiten" und wenn man was braucht oder kaputt macht, bekommt man das einfach für einen guten Preis.

Die PCs:

PC #1:
  • CPU: Intel Core 2 Duo E8200
  • GPU: iGPU or AMD HIS HD5770
  • RAM: 2GB DDR2
  • MB: generisches Intel Mainboard
  • HDD: 250GB Samsung 2,5"
  • PSU: generisches FSP 350W
  • BS: Ubuntu 22.04 LTS
PC #2:
  • CPU: AMD Phenom x2 555
  • GPU: AMD HIS HD5770
  • RAM: 12GB DDR3 (2 Samsung Sticks and 2 Kingston Sticks)
  • MB: Gigabyte GA-MA770-UD3
  • HDD: 250GB Samsung 2,5"
  • PSU: Bequiet System Power S6 450W
  • BS: Ubuntu 22.04 LTS
  • -> dieses System hat keine iGPU oder on-board Grafik, davon bin ich mir bewusst
Der 'troublemaker': NVIDIA Tesla K20 5GB, TDP 225W, benötigt einen 8-pin PCIE und 6-pin PCIE Stromversorgung

Die Probleme:

Zuerst habe ich die Nvidia Tesla in den PC #2 installiert, weil es sich um mein Haupt-Experiment-PC handelt, welcher noch am Neuesten ist.

Ich habe mir online die offizielle Nvidia Anleitung durchgelesen. Laut der Handreichung zieht die Grafikkarte 225W. Sie benötigt einen 8-pin PCIE oder einen 6-pin PCIE oder, sofern das Netzteil 175W produzieren kann, nur einen 8-pin PCIE.
Also habe ich den 8-pin PCIE angeschlossen und einen 2x Molex zu 6-pin PCIE-Adapter verwendet, da das Netzteil von Bequiet keinen weiteren 6-pin hat. Angeschlossen, eingesteckt und den PC gestartet, doch der PC ist nicht gestartet.
Logischerweise gab es kein Bild (da es keine GPU gibt, macht Sinn), meine Tastatur leuchtete nicht und ich konnte mich über SSH nicht bei dem Rechner anmelden (Ja, SSH war bei beiden PCs angeschaltet, einstellt, dass bei Start der Service gestartet wird und es hat vorher funktioniert). Das Mainboard hat über den Summer keine Warntöne ausgegeben, alle Lüfter haben sich normal gedreht, die HDD hat keine komischen Geräusche gemacht und lief normal. Es gab keine Geräusche, Rauch oder Geruch von verschmorter Elektronik aus dem (etwas verstaubten) Netzteil, also ist das Netzteil nicht flöten gegangen. Außerdem war der PC, die GPU oder Kabel übermäßig heiß. Zudem ist der PCIE-Slot nicht kaputt, d.h. wackelig oder verstaubt.
Gut, dann braucht die Grafikkarte eben zusätzliche Treiber, damit der PC bootet, also neue GPU, die alte HD5770 rein und ab geht's. Bis auf den Punkt, wo der PC nicht mehr booten wollte. Die HD5770 war da schon vorinstalliert und hat funktioniert.


Also habe ich versucht...

  • ... ohne eine GPU zu booten.
  • ... ohne eine HDD zu booten.
  • ... ohne RAM zu booten (Piepton - also funktioniert der Summer :) ).
  • ... mit anderen RAM-Konfigurationen zu booten.
  • ... die CMOS-Batterie zu entfernen, um das BIOS zurückzusetzen, falls irgendwelche Misskonfigurationen und Änderungen entstanden sind.
Trotzdem wollte der PC immer noch nicht booten und er erkannte die Tastatur nicht. Was ich bemerkt habe, war dass der GPU-Lüfter der HD5770 immer leicht hoch- und wieder runterregelt, aber sonst nicht ungewöhnliches. Die GPU braucht den 6-pin PCIE des Netzteils.

Dann bin ich in den Keller gegangen und habe meinen zweiten Test-P geholt (PC #1).

Zuerst habe ich die HDD überprüft, da die schonmal Probleme gemacht hat und eventuell bei dem Ausbau schlussendlich kaputt gegangen ist (keine Ahnung, war nur eine Vermutung). Also angeschlossen und gebootet - ohne Problem und alles hat funktioniert. Ich habe die neues Updates für Ubuntu und die packages geholt und installiert sowie die registry geupdatet. Ausgebaut, in PC #2 eingebaut und trotzdem hat der PC nicht funktioniert - mit oder ohne HD5770, keine Lebenszeichen. Ich habe nochmal einige Schritte von oben wiederholt, aber es hat nichts gebracht.

Vielleicht brauche ich ja die neuesten Treiber von Nvidia, damit der PC richtig funktioniert. Ich habe den Installer heruntergeladen und versucht zu installieren, was aber gescheitert ist, da der Installer keine kompatible Grafikkarte gefunden hat. Also, dann installiere ich die GPU jetzt in PC #1, da ich jetzt auch ein Bild habe, um mögliche Fehlermeldungen zu sehen.

Es ist logisch, dass das 350W Netzteil von PC #1 die Grafikkarte nicht mit genügend Strom versorgen kann, also habe ich den anderen PC auseinandergebaut, das Netzteil an die GPU angeschlossen und sie in PC#1 installiert. Ich musste dafür die den 24-pin main power Stecker kurzschließen, damit das Netzteil "startet" und das hat auch funktioniert. Danach habe ich den PC #1 gestartet, aber trotzdem kein Bild oder Warnton bekommen und die Maus & Tastatur wurden nicht erkannt.
Ich habe dann noch ein drittes LC-Power LC-6550 1.3 550W Netzteil geholt und mit der Nvidia Tesla getestet. Trotzdem hat noch nichts funktioniert. Ich habe mir dann die Tesla mal näher angeguckt und eine 2-pin Anschluss gefunden, welcher in keiner Anleitung beschrieben wird. Ich denke, dass es sich dabei um einen 2-pin Stecker für einen Lüfter handelt, der die GPU kühlen soll, da diese nur einen großen passiven Kühlblock hat. Den hat sie, weil es sich um eine Server-/Data Center GPU handelt, welche durch den Luftstrom im Servergehäuse und Serverschrank durch die vorbeiziehende Luft gekühlt wird. Es kann ja sein, dass die GPU einen Lüfter benötigt, aber nicht erkennt, weshalb sie nicht startet und den Systemstart der beiden PCs verhindert. Hat aber mit 2 verschiedenen Lüftern nicht funktioniert.

Jetzt brauche ich eure Hilfe! Vielleicht ist ja ein noch größerer Bastler oder Data Center Mitarbeiter hier im Forum, der mir helfen kann, weil auf Reddit wurde ich auch nicht schlauer (und keiner hat mir geantwortet :( )
Was habe ich falsch gemacht? Iist das Bequiet Netzteil kaputt? Soll ja bei den älteren Bequiet Netzteilen im neuen als auch im gebrauchten Zustand häufiger vorkommen, dass da eine Phase kaputt geht. Das Netzteil habe ich inzwischen entstaubt, das hat aber nichts gebracht. Hat das Netzteil zu wenig Leistung? Wenn ja, warum funktionieren dann 2 Netzteile nicht? Ist er 2x Molex zu 6-pin-Adapter Schuld? Hat der vielleicht die Molex-Phase des Netzteils überlastet? Der Adapter an sich funktioniert (getestet mit der HD5770). Was muss ich tun, damit irgendein PC mit der Nvidia Tesla funktioniert?

Ich bin für heute erstmal fertig. Wie bekomme ich 1. wieder hin, dass PC #2 wieder bootet und 2. dass irgendein PC mit der Nvidia Tesla K20 bootet.

Ich würde mich sehr freuen, wenn mir jemand weiterhelfen kann, da mir das Problem echt auf den Sa.. KEKS geht. Hoffentlich findet sich jemand, der wenigstens den sehr langen Beitrag liest.
 
atrt123 schrieb:
PSU: generisches FSP 350W
atrt123 schrieb:
PSU: Bequiet System Power S6 450W

vs

atrt123 schrieb:
NVIDIA Tesla K20 5GB, TDP 225W

kann nicht gut gehen

atrt123 schrieb:
LC-Power LC-6550 1.3 550W

bei dem kannste auch gleich das generische FSP 350W nehmen, das ist da besser.

atrt123 schrieb:
Ist er 2x Molex zu 6-pin-Adapter Schuld?

Das macht man nicht! diese Adapter sollten verboten werden, da die brandgefährlich im wörtlichen Sinne sind.
Molex ist nicht für eine PCIe Versorgung einer Leistungsfähigen GPU ausgelegt!
Außerdem nie Adapter einsetzen! nur nativer Support ist sicher.
 
  • Gefällt mir
Reaktionen: E1M1:Hangar
atrt123 schrieb:
Ich habe mir dann die Tesla mal näher angeguckt und eine 2-pin Anschluss gefunden, welcher in keiner Anleitung beschrieben wird. Ich denke, dass es sich dabei um einen 2-pin Stecker für einen Lüfter handelt, der die GPU kühlen soll, da diese nur einen großen passiven Kühlblock hat. Den hat sie, weil es sich um eine Server-/Data Center GPU handelt, welche durch den Luftstrom im Servergehäuse und Serverschrank durch die vorbeiziehende Luft gekühlt wird. Es kann ja sein, dass die GPU einen Lüfter benötigt, aber nicht erkennt, weshalb sie nicht startet und den Systemstart der beiden PCs verhindert. Hat aber mit 2 verschiedenen Lüftern nicht funktioniert.
Ich hatte selbst die K20 einige Jahre in einem Ubuntu setup, aber mit Intel iGPU.
Du hast leider die K20 server version, die hat keinen Lüfter, weil sie wie du schon sagst, im server rack durch einen Luftstrom gekühlt wird. Der ist absolut zwingend, die Tesla Karte kann niemals passiv betrieben werden! Sobald die auch nur ein bisschen Leistung zieht, würde sie überhitzen.
Ich weiss nicht, wie das bei dieser recht alten Karte mit Stromsparmodi/Überhitzungsschutz war (grade bei der Server version), aber könnte sein dass sie beim Booten direkt schon überhitzt und deswegen nichts macht. Hoffentlich hat sie keinen Schaden genommen bisher.
Ohne einen Eigenbau für für eine richtig gute Belüftung der Karte wirst du sie leider nicht verwenden können. Im Desktop PC macht nur die normale K20 mit aktiver Kühlung Sinn, die Server version ist quasi unmöglich zu betreiben.
Der Stecker scheint für Monitoring/Laststeuerung im Server zu sein, also kein Lüfteranschluss.
 
  • Gefällt mir
Reaktionen: atrt123
@The Insane
The Insane schrieb:
Du hast leider die K20 server version, die hat keinen Lüfter, weil sie wie du schon sagst, im server rack durch einen Luftstrom gekühlt wird. Der ist absolut zwingend, die Tesla Karte kann niemals passiv betrieben werden! Sobald die auch nur ein bisschen Leistung zieht, würde sie überhitzen.

Zum Kühlen hatte ich direkt am Anfang schon einen Lüfter professionell mit Kabelbindern am HDD-Tray befestigt. Da ist auch kein großer Abstand zur Graka, weil das Ding auch in dem sehr großen Cooltek-Gehäuse fast keinen Platz hat. Lüfter hatte ich vorher schon auf 90% laufen lassen gehabt. Ist keine permanente Lösung, das ist klar, aber zum Testen war das auf jeden Fall erstmal okay, der kleine Noctua-Lüfter hat ordentlich geblasen (80mm). Die Grafikkarte war nach den kurzen Versuchen auch nicht warm und sollte laut Anleitung im Idle auch nicht viel Strom ziehen. Man sollte aber lieber vorsichtig sein.

Ich denke mal nicht, dass die Karte überhitzt und deswegen nicht lädt, sondern wie es @Sebbi umfassend erklärt hat, sind die Netzteile zu schwach.
Da frag ich gleich mal, was für ein Netzteil da passend bzw. "zu empfehlen" ist. Ich wäre in die Richtung 700W+ gegangen und hätte das "Thermaltake Smart 730W SP-730P ATX" im Auge gehabt, weil ich das von Jemandem fast neu bekommen kann. Da habe ich 4x 6+2-pin zum Rumspielen und da sollte die Graka nicht meckern sollen, ansonsten kommt die weg. :pcangry:
 
atrt123 schrieb:
und hätte das "Thermaltake Smart 730W SP-730P ATX" im Auge gehabt
hmm... vom alter her "passt" das zu der vorhandenen hardware, kaufen oder empfehlen würde ich das aber absolut nicht.

wenn es möglichst günstig sein muss z.b. ein Xilence Performance A+ III 650W, wobei für die hardware auch 550W völlig ausreichend wären. oder sollen beide karten gleichzeitig betrieben werden?

bzw: budget?
 
atrt123 schrieb:
Thermaltake Smart 730W SP-730P ATX

das teil ist von 2012, sprich die Technik da drinne ist veraltet und ggf nicht mehr neu. Außerdem damals 730 W für rund 60 € ...... da weiß man auch um die Qualität.

hol dir lieber ein ortentlichen aktuelles Seasonic oder Bequiet mit Gold oder besser im 600 W Bereich, damit bist du besser beraten.
 
Sebbi schrieb:
hol dir lieber ein ortentlichen aktuelles Seasonic oder Bequiet mit Gold oder besser im 600 W Bereich, damit bist du besser beraten.
Bei einem Bastel-PC sehe ich das nicht das neueste Netzteil zu kaufen, nur damit ich das in einen Test- und Experimentier-PC packe. Zudem das Netzteil dann teurerer ist als der gesamte PC plus Graka ist. Sicherlich hat Qualität seinen Preis, aber man muss auch mal den Verwendungszweck im Auge behalten.
Zumal ich für den Preis von der Tesla plus Netzteil ich mir viel bessere Perfomance ohne Schnick-Schnack in der Form von einer Nvidia Quadro holen kann.
Ergänzung ()

AssassinWarlord schrieb:
Brauchen Tesla Karten nicht auch ein Zertifiziertes Mainboard? Zumindest weis ich das bei Tesla ab Pascal generation, das diese nur in wenigen Servern funktionieren. Auf Consumer-Hardware laufen die garnicht erst...
Das stimmt, die neuen Pascal, Volta und Turing-Architekturen benötigen zertifizierte Motherboards. Die haben noch weitere Änderungen eingeführt, wie z.B. den PCIE Stromanschluss mit EPS-Anschluss zu ersetzten, welcher normalerweise nicht kompatibel mit dem Vorgänger PCIE ist. Dadurch haben sich auch einige Leute ihre Teslas gebraten.
Bei den alten Tesla ist mir das nicht bekannt, dass die Probleme mit Consumer-Hardware haben, zumal die Teslas für eine kurze Zeit im "Trend" als vermeintliche Gaming-Grafikkarte waren, was totaler Quatsch ist, da sie nicht für DirectX Anwendung weder noch für Gaming optimiert sind.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: AssassinWarlord
atrt123 schrieb:
Sicherlich hat Qualität seinen Preis, aber man muss auch mal den Verwendungszweck im Auge behalten.

Da man das NT ggf auch später für was anderes verwenden ;)
 
Ich wollte den Test-PC aber auch laufen und gerne erstmal zusammen lassen 😉.
Zudem ich mir auch ein neues Netzteil für meinen Haupt-PC kaufen muss, weil die 1050ti langsam nicht mehr ganz so performant ist. Und da in dem guten Medion-PC nur 250W Netzteile eingebaut wurden, muss ich leider upgraden. Geht dann in Richtung 3060 Super oder ti, obwohl es mir bei den Ausgaben schon wieder grault :o.
 
atrt123 schrieb:
obwohl es mir bei den Ausgaben schon wieder grault

immer dran denken, "wer billig kauft, kauft öfters" ;)
 
Habe die GPU mit einem Bequiet SystemPower 630W in beide PCs eingebaut. Immer noch kein Signal oder erfolgreichen Boot, trotz neuem Netzteil und Kühlung. Geht also wieder zurück.
Ergänzung ()

Korrektur: Die GPU geht zurück, nicht das NT. 😅
 
Zuletzt bearbeitet:
Zurück
Oben