Woher kommen die Geschwindigkeitszuwächse bei der GT 6800

Wiegel

Ensign
Registriert
Aug. 2004
Beiträge
164
Ich bin heute durch Zufall auf etwas gestossen, auf das ich so schnell keine Antwort finde.
Mich würde interessieren, warum bei Gainward die FX 5950 U im Vergleich zu der GT 6800 eigentlich überall bessere Werte vorweisen kann (nur RAMDAC unterscheidet sich erheblich) und trotzdem in den Benchmarks um einiges schlechter abschneidet. Liegt es nur am Chip?
Oder unterscheiden sich die Technologien so extrem? Oder hab ich einfach nur die falschen Werte? (fetter Text -> FX 5950 U hat bessere Werte; unterstrichen -> GT 6800 liegt in den Werten vorne)

Product Specifications

Processor nVIDIA GeFORCE FX 5950 Ultra
Enginne Clock 475 MHz
Frame Buffer 256 MB
Memory Type 2.0 ns DDR.
Memory Width 256 bit
Bandwidth 28.8 GB/sec
RAMDAC 400 MHz
Maximum Resolution @ 85 Hz 2048 x 1536
AGP 8X
Rendering Pipelines 8
Texels/Clock 16
Triangle Setup YES
Transfer $ Lighting YES
MPEG2 Accelleration YES


Model Gainward PowerPack!
Ultra/2100
TV-DVI
Engine Name nVidia GeForce 6800
Engine Clock Frequency 325MHz
Memory Specifications 128MB 2.8ns DDR
Memory Frequency 700MHz
Memory Width 256-bit
Memory Bandwidth 22.4GB/s
RAMDAC Frequency 2 x 400MHz
Bus Speed AGP 2X/4X/8X
Cooling Fan


Technology

· 256-bit Graphics Core
· CineFX™ 3.0
· UltraShadow II
· Intellisample III
· DirectX 9.0x Support
· OpenGL 1.5 Support
· 12-pipe GPU
· 64bit Texturefiltering
· 64bit Textureblending
 
Die Gainward is aber keine GT! Das is "nur" ne normale 6800nu! Und der Geschwindigkeitsvorteil kommt zu 90% vom Chip da der ja 12Pipes hat und die 6800nu in Shader Sachen sehr viel besser is und die Restlichen 10% würd ich mal nem besseren Layout zuschreiben!

btw: Eine richtige GT hat 16Pipes, 2,0ns GDDR3 Ram und einen Takt von 350/1000!

//Edit by Green Mamba
Es ist nicht nötig den ganzen Kram zu zitieren. ;)


kk sry :p
 
Zuletzt bearbeitet:
Wenn du so willst hat die GeForce 6800 und 6800 GT einen höheren Chiptakt, hätte die 6800 und die 6800 GT auch 8 Pixelpiplines wie die 5950 Ultra, hätten sie folgende Taktraten.

GeForce 5950 Ultra = 475/950 MHz
GeForce 6800 = 488/700 MHz
GeForce 6800 GT = 700/1000 MHz

Am Speicher braucht man nicht umzurechnen, da alle Karten ein 256 Bit breites Speicherinterface haben.
 
Die RAMDACs dürften bei beiden Chips gleich sein ;). Sind sowieso nur die Bilderzeuger, von daher haben die auf die Performance keinen Einfluß...

Wie du schon angemerkt hast, hat die 6800 gegenüber der 59xx schon ca. 50% mehr Pipelines. Das kannst du erstmal 1 zu 1 in Taktrate umrechnen, womit die beiden Karten dann gleich auf wären.

Zudem sind die einzelnen Pipes der 59xx einfach beschrieben sehr begrenzt und können insbesondere Operationen mit komplexen FP-Zahlen (24Bit und höher) nur kombiniert ausführen. Im ungünstigsten Fall kann zB nur eine Vertexoperation pro Takt ausgeführt werden anstatt der angegebenen 3! Überhaupt verhält sich die NV3x-Architektur bei parallen Operationen (INT und FPs gleichzeitig) sehr zickig. Da diese insbesondere in D3D vorkommen, fallen die NV3x hier weit hinter ihre theoretische Renderleistung zurück...

Die NV4x ist da wesentlich flexibler und operiert im Schnitt dichter an ihrer theoretischen Leistung. Hinzu kommen dann noch kleine Sachen wie winkelabhängiges AF, was einiges an Bandbreite einspart. Auch das 4xAA wird jetzt als Multisampling mit gedrehtem Raster ausgeführt und ist schneller als die (immer noch wählbaren) Supersamplings...

Für den Normalverbraucher reicht aber ein Blick auf einschlägige Benchmarks! ;)
 
eine 6800 hat 300% pipelines gegen über ner 59x0 :rolleyes:
eine 6800gt gar 400%.

zum einen hat nvidia mit dem nv40 wesentlich effektivere pipes eingeführt, zum anderen enthält der chip diesmal sogar die anzahl an pipes, die das marketing verspricht.
2 tmus/takt bei multi-texturing sind vielleicht schön und gut, deshalb entspricht diese pipe allerdings nicht gleich 2 mit einer tmu/takt.
 
Alles klar, danke für die Info, schönes Wochenende ;)
 
(c) schrieb:
Wie du schon angemerkt hast, hat die 6800 gegenüber der 59xx schon ca. 50% mehr Pipelines. Das kannst du erstmal 1 zu 1 in Taktrate umrechnen, womit die beiden Karten dann gleich auf wären.
Eigentlicht hat die 6800 aber dreimal soviele Pipelines (aber nur doppelt soviele ROPs).

Jeder "große" nV3x (also nV30, 35 und 38) kann pro Takt nur 4 colorierte Pixel wegschreiben, dazu kommt noch die Z-/Stencil-Optimierung der ROPs, womit acht Werte pro Takt, die allerdings keine Farbe haben dürfen, möglich sind.

(c) schrieb:
Zudem sind die einzelnen Pipes der 59xx einfach beschrieben sehr begrenzt und können insbesondere Operationen mit komplexen FP-Zahlen (24Bit und höher) nur kombiniert ausführen. Im ungünstigsten Fall kann zB nur eine Vertexoperation pro Takt ausgeführt werden anstatt der angegebenen 3! Überhaupt verhält sich die NV3x-Architektur bei parallen Operationen (INT und FPs gleichzeitig) sehr zickig. Da diese insbesondere in D3D vorkommen, fallen die NV3x hier weit hinter ihre theoretische Renderleistung zurück...
Sie können auch diverse Operationen mit FP16 nur kombiniert ausführen, aber für FP32 stehen nochmal ein MAD und ein MUL (IIRC) weniger zur Verfügung. Dazu kommt der sehr begrenzte Temp-Speicher.
Gemischten Code (FX/FP) können sie hingegen ziemlich flott abarbeiten, da hier auch die Register Combiner (die nur für Pixel-Shader bis 1.3 zugelassen sind und daher ohne das, was gern als Cheat beschrieben wird, nicht zur Berechnung von 2.0-Shader-ähnlichen Effekten genutzt werden dürften.)
Unter OpenGL sind die Berechnungen dagegen "dichter" am Chip, weil der Treiber dort aufgrund der herstellerspezifischen Extensionen nicht nur "DX-Spec" nehmen kann, sondern ziemlich genau das, was dem Chip am besten liegt. Meist ist OpenGL auf nV3x aus diesem Grunde auch deutlich schneller im Vergleich zu ähnlichen DX-Code.

Vertex-Operationen sind eigentlich gar nichtmal so ein Problem, die Bremse liegt vielmehr im Pixelshader.

(c) schrieb:
Die NV4x ist da wesentlich flexibler und operiert im Schnitt dichter an ihrer theoretischen Leistung. Hinzu kommen dann noch kleine Sachen wie winkelabhängiges AF, was einiges an Bandbreite einspart. Auch das 4xAA wird jetzt als Multisampling mit gedrehtem Raster ausgeführt und ist schneller als die (immer noch wählbaren) Supersamplings...
Ack, bis auf das winkelabhängige AF. Es spart zwar auch minimal Bandbreite, das Hauptaugenmerk liegt aber auf eingesparten Füllrate und (wenn es denn wirklich fest in der Hardware verankert ist, worüber ich noch so meine Zweifel habe) Transistorcount im Chip, wodurch im Gegenzug dann wieder eine höhere Taktrate möglich ist.
 
Zurück
Oben