Hardware Unboxed

conker_ts

Ensign
Registriert
Dez. 2011
Beiträge
163
Hallo zusammen,
ich habe über die Suche nicht so viele Ergebnisse/Erwähnungen von diesem Video gesehen, von daher poste ich die Videos hier und würde allgemein eure Meinung dazu hören.
Bin mit dem ersten Video fertig, und fange jetzt mit dem zweiten an.

Imho sind's sehr interessante Erkenntnisse, evtl wäre auch cool, wenn CB sich das genauer anschauen könnte und es so bestätigen kann.
Dass aktuelle Graka Treiber totaler Bloat sind, das glaube ich sofort. Umso mehr Lob an AMD, dass sie immerhin etwas weniger bloated Treiber produzieren ;)

Und scheint als würde Hardware Unboxed wieder "die falsche" "editorial direction" einschlagen, har har. 😁

@Mods, sry, habe vergessen, den Titel noch präziser zu schreiben, wenn man den irgendwie noch ändern könnte, wäre das gut ...
 
Zuletzt bearbeitet:
Es ist jetzt bekannt das dieses Verhalten vom der Art den Schedulers abhängt. Nvidia hat Software Scheduler welche bei DX11 Games Vorteile haben, AMD eine Hardware Scheduler welcher ihnen jetzt bei DX12 in die Hände spielt.
 
  • Gefällt mir
Reaktionen: C:\Defuse_Kit
Ich bin da der Meinung es ist egal welcher Scheduler wem in die Hände spielt, ich bin gespannt wie RDNA2 am Desktop performed wenn die RT Optimierungen und Next-Gen Games auf der Konsole an Fahrt gewinnen. Das ist für AMD Win-Win.

Mal abgesehen von den Speicherlimitierungen bei Nvidia. Hätte mir sehr gerne eine 3060, 3060Ti oder 3070 gekauft. Aber alle nicht kaufbar. Erstere zwar genug Speicher, aber zu langsam. Beide anderen zu wenig Speicher auf Dauer. Und zu den Mondpreisen gleich gar nicht.

Das ist doch viel entscheidender, oder nicht?

Wobei die DX Version mit CPU Limit natürlich immer dann eine Rolle spielt, wenn man eine starke GPU mit einer sehr schwachen CPU koppelt. Klar. Sonst spielt das doch eh nie rein.
 
Volle Zustimmung derzeitige nvdia ampere Grafikkarten haben ein größere cpu limit bei kleineren Auflösungen als 1440p
Wenn man eine überhaupt bekommt.

Das liegt Primär am geänderten sm Aufbau
Wo noch turing (rtx2000) die shader komplett mit allen ausführungseinheiten gezählt hat.
aus bsp rtx2060s 2176 werden in theoretisch ampere rtx3060s dann 4352 was aber nur bedingt stimmt..
Den die formel für tflops pro Sekunde geht so
shader mal 2 mal takt in ghz/1000=Teraflops pro Sekunde
Im falle von rtx2060s sind das 2176*2*1,85=8tf
Im falle der realen rtx3060 sind das 3584/2*2*1,3*1,85/1000=8,6tf
Das sind nur 8% mehr Leistung vs der vorgänger gen.
Und das zu fast gleichen preisen real. uvp ist nur um 20% gesunken
An sich ein rundes produkt.
Sofern man eine bekommt.

Amd dagegen ist ind er der shader Leistung auf level von pascal (gtx10xx)
Hier ein vergleich dazu pascal quasi Flaggschiff hatte 3584 shader und etwa 13,9tf
AMD RX6000 Serie hat 2 chips einen mit 80cu 5120 shader und einen mit 40cu 2560 shader
Allerdings Takten diese gpu erheblich höher als alles was bisher gab.
Eine rx6700xt komm auf level einer gtx1080ti bei geringeren oder gleicher cpu overhead.
2560*2*2,6=13,3tf
Der Gegner dieser gpu von nvidia ist die rtx3060ti mit krummen 38sm
4864/2*2*1,85/1000=8,9tf

Das klingt als ob die rtx3060ti langsamer wäre wäre da nicht die ipc vom shader zu shader je gpu gen.
Historie

angefangen 2006 mit tesla g80 (8800gtx 768mb)
100%=1,3fps pro shader 128shader 8shader pro sm=16sm 0,6ghz
dann mit fermi 2010
-50% =0,87fps pro shader 480 shader 32 shader pro sm=15sm +278% 0,8ghz
dann mit kepler 2013 wieder die Architektur geändert
-50% zu fermi=0,24fps pro shader 2304shader 128 shader pro sm=12sm +516% 0,7ghz
dann zu pascal was wieder die shader geändert wurden aber am takt ordentlich gesteigert .
wieder -10% zu kepler =0,2fps pro shader 3584shader 128 shader per sm=28sm +1377% 1,9ghz
dann zur änderung mit turing
+5% zu pascal=0,22fps pro shader 4352 shader 64shader pro sm =68sm +1733% 1,85ghz
und jetzt finale mit ampere
-50% vs turing = 0,12fps pro shader 10496 128 shader pro sm =72sm +2517% 1,9ghz

mal eine Steigerung von 26 Fach dem des originalen tesla chip aber die ipc sankt beständig
dagegen mal amd historie
vliw architektur 2009 mit der HD4xxx
HD4870 =100% diese ist um 42% schneller als die g80 Familie.
Genormt auf nvidia100/0,58=172fps 0,28ps pro shader 1,7ghz 800 Shader =80cu 10 shader pro cu
dann wirds einfach weil gcn sehr lange identisch blieb und lediglich takt und effizienz gesteigert wurde.
HD7970 =329% auf nvidia gerechnet 567fps 0,28fps püro shader 2048 shader 64shader pro cu 32cu 1ghz
R9 fury 2015 =509% in nvidia =877fps, 0,24fps je shader 3584shaer 64shader pro cu=56cu 1ghz
RX6900xt 2020 =1673% in nvidia=2885fps 0,27fps je shader 5120shader 2,1ghz 80cu 64 shader pro cu.
somnit sind 0,12 vs 0,27fps pro shader und amd ipc liegt vorne wäre da nicht die spezielle sm Aufbau von 128 fp32 die nur zur hälfte exklusiv sind
Derzeit per treiber lassen sich zeitlich 30% der alternativen fp32 int32 Operationen nutzen.
Das kann sich nach mehreren treiber Anpassungen erhöhen auf max 50%, das aber hängt primär vom pcie bus OS wddm Modell und vram Takt ab.

Rein rechnerisch liegt amd mit 2,2 fach bessere ipc vs nvidia
Rechnet man das als original ab sind nur noch +12% bessere IPC

Durch die immer größer werden chips vom Aufbau her wird es immer schwerer diese auszulasten.
Zum glück gibt es seit gut 2 Jahren endlich wieder Bewegung an der ipc von cpu's
zen2 (rx3000) und intels skylake (core i 6th gen-10gen) sind quasi ipc technisch gleichauf
zen3 legt nochmal gut 25% drauf (rx5000)
intels rebrandet icelake =cove Architektur rocket lake 2021 +8% 14nm (core i 11th gen letzte dieser art)
zen4 unbekannt sollte aber auch so etwa 30% sein 5nm ~2022
intels alder lake legt etwa +20% drauf vs skylake mix 10nm und 14nm neue cpu arch diesmal echten cove.

von 2011 bis 2019 gab es nur ipc Steigerung von 20%
Mal zum vergleich
dazu kommt das intel smt Sicherheit Löcher für performance Einbrüche in I/O sorgen und die Leistung etwas sankt
corei 2th gen -20%
corei 3rd gen -15%
corei 4rd gen - 15%
core i 6th gen -10%
corei 10gen -5%

Werte immer als Singlecore Leistung zu sehen multicore hängt das von kern Anzahl und takt ab.
SMT aus sind zusätzlich minus -25%-35% Gesamtleistung.

Amd ist von den sidechannel Attacken quasi immun.

Ich hätte 2016 nicht gedacht das cpu ipc nochmal um gut 25% ansteigt aktuell und in zukubnft bis zu 30%
Das entspannt etwas die gpu da das cpu limit quasi mit den kommenden cpu aufgehoben wird
Allerdings steigt auch die Auflösung an wo eine cpu nicht mehr limitiert aktuell sind das 1440p
darunter bekommt man quasi keine gpu ausgelastet und wird in zukunft auch nicht besser

Zukunft gpu
nvidia lovelace rtx4000 Serie 5nm samsung ~2023 + etwas um die 50% effizienter +-25% Steigerung der Leistng ist abängig von der shadermenge sowie Takt
amd rdna 3 (rx7000) 2022 +50% Effizienz +40% Leistung
das aber hängt vom chiptakt ab vermutlich 6nm tsmc könnte aber schon 5nm sein.

bedenkt man die Leistung aktuell und die aktuellen Konsolen sehe ich derzeit keine gute zeit für ein gpu upgrade
GPu quasi brauchbar sofern erhältlich aber zu stromhungrig
Und preislich ist derzeit nix zu machen.

CPu allerdings könnte der wechselzeitpunkt nicht besser sein..
2022 mit zen4 und dem ddr5 Speicher kann ich nicht wirklich empfehlen.
Intels alder lake (2021) wird man sehen müssen ob ddr4 möglich ist.
Der imc kann es

Bleibt die eine frage offen brauche ich die Leistung?

Was games betrifft sage ich jaein da noch die alten Konsolen von 2013 unterstützt werden.
Was aber stark abnehmen wird.
Die Zukunft gehört dx12 ultimate und DXR und genau da haben die aktuellen gpu gen noch nicht wirklich die Leistung die man bräuchte.
Daher sind auch Auflösungsskallierungen wie vrs und upsampling Thema, auch wegen den Konsolen.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: conker_ts
Zurück
Oben