Wie relevant ist die Anzahl der Shader Prozessoren?

I

itzev_45

Gast
Hallo, ich stehe immer noch zwischen dem Kauf einer 3060Ti und einer RX6700XT. Ich habe gesehen dass die 3060Ti 4864 Shader Prozessoren hat und die RX6700XT 2560. Wie relevant sind die und für was sind die zuständig?

Und noch eine Frage für alle Besitzer einer 12GB XFX Radeon RX 6700 XT SWFT309 GAMING (Retail), wie sind bei euch die Temperaturen?
 
Die Anzahl ist nur interessant, wenn du die Leistung innerhalb der selben GPU-Architektur vergleichen willst. Zwischen einer 3060Ti und einer RX6700XT hat das keinerlei Relevanz, schau dir lieber Benchmarks an.
 
  • Gefällt mir
Reaktionen: florian., PHuV, HisN und 6 andere
itzev357 schrieb:
Und noch eine Frage für alle Besitzer einer 12GB XFX Radeon RX 6700 XT SWFT309 GAMING (Retail), wie sind bei euch die Temperaturen?
ich lasse den luefter erst bei 75 Grad an gehen.

itzev357 schrieb:
Wie relevant sind die und für was sind die zuständig?
https://en.wikipedia.org/wiki/Shader

itzev357 schrieb:
3060Ti 4864 Shader Prozessoren hat und die RX6700XT 2560.
nicht vergleichbar. Jeder Hersteller und jede generation implementiert das anders in Hardware


Tipp: Spielname + Name einer Grafikkarte + benchmark

Dann kannst du vergleichen
 
  • Gefällt mir
Reaktionen: PHuV, ghecko und itzev_45
itzev357 schrieb:
Wie relevant sind die
Sehr relevant. Aber da du hier SP von AMD mit Nvidia vergleichen willst: Macht keinen Sinn. Sind völlig unterschiedliche Architekturen.
 
  • Gefällt mir
Reaktionen: PHuV, madmax2010 und itzev_45
Mein Thema

So nvidia hat bei ampere ein wenig geflunkert bei den shader angaben
Als Grundlage dient hier das GA100 Dokument
Ein sm hat darin 64 int32 64 fp32 32fp64 4 tensor cores 1 rt core 1 sfu
Während beim ga102 dokument völliger Blödsinn drin steht
mit 64 fp32/int32 64fp32 4tensor 1rt core 1sfu

zuerst mal, zwar ist es möglich das fp32 auch int32 berechnen können aber entweder oder sprich der Treiber muss bei int32 die 64 fp32 shader per software deaktivieren
Das geht wie man es sich denken kann nicht.
Darum greift hier das problem was man mit turing hatte.
Zwar hatte nvidia diese Technik enthalten aber der chip hat sicherlich die 32 fp64 drinnen kein unternehmen designt mit gleichen Namen 2 Architekturen.
Folglich ist die Beschreibung beim ga102 Dokument falsch

So wie ist es den real nun das ga102 Dokument hatte im sm Bild mal drunter stehen gehabt 24fp64 sind nicht dargestellt.
Daraus ergibt sich 64fp32+24fp64 die in fp32 rechnen =88fp32 operationen pro Takt mal 2
Und glaubt es oder nicht das kommt genau hin.
Das habe ich anhand 5 Generationen von dgpu seit tesla 2006 bewiesen
namentlich
tesla 2009
9800gtx+ Überraschenderweise läuft die noch Formel shader mal 3 mal Takt ~580gflops
fermi 2010
gtx460 Formel shader 224 *2*Takt 1,7ghz + 4 sfu Anzahl *4*Takt 1,7ghz= 951gflops
kepler 2013
gtx760 Formel 1152shader *2*Takt + 224 sfu*4*Takt 1,15ghz=3519 gflops (muss ich noch genauer prüfen da nicht klar ist ab wann nvidia die sfu für fp32 deaktiviert hatte) Eventuell kann es sein das der multi bei sfu bei 2 ist dann reduziert sich das auf 3164gflops.
Das geht aus dem Dokument nicht klar hervor.
pascal 2016
gtx1060 Formel 1280*2*Takt+16*10*2*1,92=5525gflops
ampere 2021
rtx3060 Formel 88*28*2*1,85ghz=9115gflops /wenn kein cpu limit Aufkommt

Gänzlich werde ich dies beweisen mit der turing arch (gtx1650 als vergleich) und wenn ich meine alte gtx760 wiederbekomme.
Gleiches gilt für vega 7 fp32 multiplikator was derzeit zwischen 0,55-0,7 ist
Dies ist stark Treiber abhängig
Theoretisch müsste die gpu auf level der gtx460 bis gtx470 sein mit etwa 0,88tf-1,1tf
Ein cpu limit schließe ich mitn zen2 chip aus (luciene laptop).

Nächster Plan ist ad104 akä rtx4060ti hoffentlich 52sm 2,4ghz ~23,9tf 200w tbp

und ja die Shaderangabe bei ampere ist irreführend da die int32 definitiv kein fp32 ausführen.
Dafür hat die gpu am ende zu wenig mehr Leistung vs der gtx1060 bei meinem Test ergeben von 47 spielen erreichte diese bei 95% gpu load 1080p rtx3060 etwa 127fps vs 75fps gtx1060
laut tf müsste es aber min +167% sein 13,2tf vs 4,9tf
Ergebnis ist aber +69%
Hab grad bemerkt warum meine test deutlich weniger ergaben als meine vorherige Annahme von 4915gflops der gtx1060
Die sfu sind vorhanden und aktiv = 5525gfops addiert dann passen die +69% vs rtx3060 wie a auf Eimer

turing wird nochn genauen Test erfordern da nicht klar ist woher die Leistung kommen soll
An die 26% Rückstand zu der gtx1060 ist kaum zu glauben.
Mathematisch müsste diese bei etwa 40% langsamer sein oder die gtx1060 +60% schneller.
 
  • Gefällt mir
Reaktionen: itzev_45
Das sind ganz einfach die Anzahl der Recheneinheiten auf der GPU, die maßgeblich für die theoretische Rechenleistung und auch für die Spieleperformance verantwortlich sind.

Kennt man die Rechenleistung EINER Recheneinheit, kann damit einfach mit einer Multiplikation der Anzahl der Shader-Prozessoren die theoretische Rechenleistung der kompletten GPU ermittelt werden. Da sich die Rechenleistungen einzelner Shader-Prozessoren je nach Architetkur / Hersteller stark unterscheiden, ist ein 1:1-Vergleich häufig sinnlos. Derzeit hat z. B. AMD die bessere Leistung je Shader-Prozessor.
 
  • Gefällt mir
Reaktionen: itzev_45
Zurück
Oben