News Defekte Grafikkarten: Amazons New World zwingt RTX 3090 von EVGA in die Knie

@xexex : Dann lies mal die Aussage "nach einigen Minuten Zimmer dann sehr aufgeheizt" erneut und denke mal logisch nach. Lebt er in einer 1 m² Abstellkammer?
 
Die XC ist nicht betroffen. :)
 
  • Gefällt mir
Reaktionen: BrollyLSSJ, Cool Master und Nero1
@Amiga500
Nur EVGA hat bei der FTW3 die durchschmorrende Lüftersteuerung.

Zu den Abschaltungen schreibt Igor bzgl. der Spannungsüberwachung der anderen Karten:

Man kann also nur vermuten, dass hier ab ca. 1000 bis 2000 FPS (also bereits unterhalb 1 ms) bei identischer Renderlast schon Ungenauigkeiten entstehen könnten, die letztendlich gewisse Spikes schon nicht mehr mit erfassen oder man am Ende von einer zu geringen Gesamtlast ausgeht.

Mit anderen Worten die Karte bekommt zu wenig Saft da sie nicht mitbekommt das sie mehr benötigt oder sie zieht deutlich mehr Saft als erlaubt und das Netzteil schaltet ab.
 
Ich hab echt gute Erfahrung mit dem Support von EVGA. Allerdings finde ich es diesmal komisch das nichts offizielles kommuniziert wird. Gegebenenfalls reicht ein Firmware oder BIOS Update um das Problem zu lösen. Deshalb würde ich es recht gut finden wenn die sich selber mal dazu äußern können.
 
  • Gefällt mir
Reaktionen: Cyberbernd
@der_sascha85

Ich denke die sitzen da aktuell 24/7 dran. Wenn es ein FW-Fix gibt muss das erst alles evaluiert werden ob es geht. Wenn ja wird da denke ich in 1-2 Wochen ein Statement kommen wenn nicht wird es wohl tot geschwiegen und nur die RMAs erfüllt, wenn eine rein kommt.
 
  • Gefällt mir
Reaktionen: der_sascha85
Ich versteh den Zusammenhang einfach immer noch nicht. Und die Informationslage ist zerstückelter als alles andere.

https://www.igorslab.de/evga-geforc...rch-designfehler-die-grafikkarte-amok-laeuft/

In dem Artikel finde ich einfach keine Erklärung, was da nun "reproduziert" wurde und was genau EVGA da nun fehlkonstruiert hat. Ich schätze Igor und seine Arbeit ja sehr (regelmäßige Lektüre ist da Standard), aber dieser Artikel ist schwammiger wie er kaum sein könnte. Zudem ist der Abschnitt mit der Kritik an den Medien die ja "vermeintliche Fakten erzeugen die in der Realität nie existiert haben" meiner Meinung nach vollständig fehlplatziert, da eben konkrete Fakten zur Ursache und Wirkung halt nach wie vor fehlen und dadurch Spekulation nur weiter genährt wird.

Ok, der Kanal #1 (FAN1) wird in manchen Games sinnloserweise angesteuert und es werden absurd hohe U/min ausgelesen (200.000 und mehr). Dann ist die Rede von "Häufigkeit dieser technischen Aussetzern an der Karte" - wie sehen diese aus? Wie äußern die sich, abgesehen von den Lüftern?
Offenbar wird immerhin dieses Problem nicht von etwaigen OC-Switches oder manuelle Lüfterkurven beeinflusst.

Es gibt dann wohl eine Notabschaltung durch das Netzteil (?), was sich durch aufheulende Lüfter ankündigt. Das Problem ist zudem nicht auf New World beschränkt, sondern kommt auch bei anderen Spielen vor. Und was hat das mit der Lüftersteuerung zu tun? Vielleicht gar nichts, denn hier ist plötzlich die Rede von Sicherungen auf dem PCB die auslösen könnten weil "Spikes" nicht erkannt werden und die Leistungsaufnahme viel zu hoch wird. Das wiederum hätte dann nicht unmittelbar etwas mit dem Lüftercontroller zu tun.

Aber ich bin nicht der einzige, dem das ganze mit der Berichterstattung nicht so gefällt ("wir haben einen Volltreffer" - ja, und was kam da jetzt bei rum?)
 
Cool Master schrieb:
Was genau verstehst du nicht?
Zusammenhang zwischen Totaldefekt der Karte und dem Versagen der Lüftersteuerung.

Nichts genaues weiß man halt nicht, wirklich bekannt ist da ja nichts. Hilfreich wäre ja schon, wenn die Faktenlage von @FormatC insofern genauer beleuchtet wird und wirkliche Fakten benannt werden anstatt nur schwammig von "Volltreffern" oder verschiedenen "Theorien" zu schreiben und das ganze auf mehrere Artikel zu verteilen...

So stiftet das ganze eh nur zusätzliche Verwirrung. :(
 
@Taron

Ich habe es mir so erklärt, dass das BIOS bzw. die FW der Karte das Signal brauch um die Karte zu starten. Wenn die FW 0 RPM sieht ist das für sie ok, da es ein Wasserkühler sein kann der auf der Karte ist und man zur Not drosseln kann wenn es zu warm wird. Beim fehlen eines Signals würde ich sagen, dass die Karte schlicht nicht startet weil sie in einem Schutzmodus rein geht. Nach dem Motto ich habe überhaupt kein Signal daher ist da etwas Faul.

Glaube Igor hat auch das Problem, dass er die Kontakte nicht einfach zitieren kann und da wohl etwas verschwiegen sei muss um deren Identität zu schützen.
 
  • Gefällt mir
Reaktionen: Cyberbernd
Cool Master schrieb:
Glaube Igor hat auch das Problem, dass er die Kontakte nicht einfach zitieren kann und da wohl etwas verschwiegen sei muss um deren Identität zu schützen.
Vermute ich auch, aber das könnte und sollte durchaus kommuniziert werden, um eben Verwirrung und Spekulationen zu verhindern. Hätte ja auch sonst jeder Verständnis für...

Deine Theorie scheint mir durchaus plausibel, wobei ich mich frage, wie genau das Schadensbild nun bei dem New World-Problem aussieht. Wenn da irgendwelche Bauteile der Spannungsversorgung zerstört werden (Spulen, MOSFET) ist ein Zusammenwirken der defekten Lüftersteuerung eher unwahrscheinlich. Wenn keine Bauteile oder nur der Lüftercontroller beschädigt sind, ist ein reines Problem mit zu hoher Leistungsaufnahme auch wenig wahrscheinlich...
Zudem scheint ja - den neueren Infos nach - nur ein Lüfter diese Anomalien aufzuweisen, sodass wenigstens ein Teil der Kühlleistung da zu sein scheint?
 
Nur mal zur Info:
Die Info mit der durchgebrannten MCU stammt direkt aus dem R&D des EVGA-Auftragsfertigers. Sie ist wirklich valide (ich habe auch Bilder und Messungen gesehen), nur kann ich unseren virtuellen Entwickler-Stammtisch und die jeweiligen Freunde samt Quellen nicht outen, das geht nun mal nicht. Und es gehört auch nicht in eine News. Forum, naja. Da kann man auch mal plaudern. :D

Solange ich selbst noch an den Details dran bin, will ich auch keine Spekulationen oder misverständliche Fragemente veröffentlichen, das ist eine Frage der Verantwortung. Zwei Dinge aber mal vorab. Die Lüftersteuerung auf den iCX 3 Platinen ist getrennt. da gibts den Lüfter über der GPU, wo unglücklicherweise in der MCU die nervengestörten Sensoren auf der Platine und die Werte aus der GPU (Primary Fan) zusammengwürfelt werden. Der Rest der Lüfter wird wie gewohnt von NV's Secondary Fan direkt über die GPU gesteuert (was völlig ausgereicht hätte).

Die Speisung der MCU ist tricky und gleichzeitig stupide, genauso wie das ganze verquaste Platinendesign mit dem missratenen Balancing der Versorgung aus den einzelnen Rails und dem unnötigen iCX 3 Müll. NVIDIA kann das native mittlerweile zehnmal besser. Wer das designt hat, gehört verprügelt. Hier hat das mal wieder das Marketing über die Ingenieure gesiegt, leider.

Der Abflug der MCU basiert wohl aus einer Schieflage des speisenden Rails. Die angzeigten Phantasiewerte beim Lüfter sind kein falsch ausgelesenes Tachosignal, sondern liegen als sinnlose Zufallszahlen in den Registern der abdriftenden MCU. Aber das ist bisher nicht komplett validiert. Zu EVGA könnte man noch Vieles schreiben und auch mal über die "Erweiterte RMA", die alles andere als kundenfreundlich ist. :D
 
  • Gefällt mir
Reaktionen: Deathangel008, BloodReaver87, Cyberbernd und 3 andere
New World ist einer der wenigen Games, die meine "Asus RTX 2070 ROG STRIX OC" auf Höchst-Temperaturen bringt, die ich vorher so nie hatte. Zum ersten Mal hatte ich nach Stundenlangen zocken ~85 Grad GPU Temperatur und ~95 Grad Hot Spot GPU Temperatur (Temperaturen mit Software "HWInfo64" gemessen. Und das bei einer RTX 2070 mit einer der besten Kühler. Gespielt wurde in 1920x1200 mit Framebegrenzung von 60 Fps auf Höchste Einstellungen.
Das Game reizt die Grafikkarte auf jeden Fall sehr gut aus.
 
FormatC schrieb:
...nur kann ich unseren virtuellen Entwickler-Stammtisch und die jeweiligen Freunde samt Quellen nicht outen, das geht nun mal nicht. Und es gehört auch nicht in eine News. Forum, naja. Da kann man auch mal plaudern. :D
Das ist auch richtig so.
Was viele (auch ich) nicht verstehen, ist eben, wie eine spinnende Lüftersteuerung überhaupt zu einem Ausfall der Karte führen kann. Bei einem Totalausfall der Steuerung würde die Karte überhitzen, allerdings müsste auch dann eine Sicherung anspringen die mit der Lüftersteuerung nichts zu tun hat.

Interessant wäre auch was bei null Drehzahl (Wakü) wirklich passiert da die Lüftersteuerung dann grundsätzlich 0 rpm meldet.
 
Nichts. :)

Die Karte meldet kein Power Good ans Motherboard, ergo startet nichts. Nicht die Lüftersteuerung spinnt (da geht die Karte ja trotzdem noch), sondern eine verkohlte Komponente sorgt dafür, dass die Sicherheitsmechanismen greifen. Einfach und sauber gelöst :)
 
FormatC schrieb:
Im Klartext - mit Wakü ist man von diesem Problem also verschont?

Der Rest ist dann schon eine gute Erklärung (auch wenn ich gerne den ganzen Vorgang hätte was aber deine Kontakte wohl outen würde) da mir in der bisherigen die Kausalkette fehlte - danke.
 
Danke @FormatC langsam wird es klarer.

Also sorgt der Defekt eines Bauteils für ein fehlendes oder fehlerhaftes Power Good Signal wodurch die Karte nicht mehr startet und für den Kunden dann natürlich "kaputt" erscheint. Erscheint stimmig und würde ich auch so als Erklärung akzeptieren.

Wobei ich mich immer noch frage, wieso das Thema mit der spinnenden Lüftersteuerung dann so stark in den Fokus gerückt wurde, wenn es irgendwas anderes an der Karte ist was damit nichts zu tun hat.
 
FormatC schrieb:
genauso wie das ganze verquaste Platinendesign mit dem missratenen Balancing der Versorgung aus den einzelnen Rails

Hierzu hät ich gern mal ein Video. Schon oft darüber gelesen aber nicht verstanden :D... Man man man EVGA hat echt abgebaut - leider :(

Kein Vergleich zur GTX 1080ti FTW3 Zeit
 
BloodReaver87 schrieb:
Man man man EVGA hat echt abgebaut - leider :(

Ich verweise einmal auf meine RMA Erfahrung:

https://www.computerbase.de/forum/t...a-rma-gtx-1080-mit-10-jahre-garantie.2034320/

Fehler passieren und ich würde das nun nicht zu heiß kochen. Die Frage ist wie mit den Fehlern umgegangen wird und so wie ich es bis jetzt höre werden die Karten ohne Probleme sofort getauscht. Meiner Meinung nach kommt es darauf an wie der Hersteller mit Problemen umgeht nicht ob es Probleme gibt.
 
  • Gefällt mir
Reaktionen: BloodReaver87 und der_sascha85
Ja, der Vorabtausch ist OK - bringt nur nicht viel wenn der Ersatz das gleiche Problem hat.
Hoffentlich ist das zumindest per Bios zu fixen und bedarf keines neuen Layouts.
 
  • Gefällt mir
Reaktionen: der_sascha85
Zurück
Oben