Woher kommen die Geschwindigkeitszuwächse bei der GT 6800

Wiegel · 22. Oktober 2004

Ich bin heute durch Zufall auf etwas gestossen, auf das ich so schnell keine Antwort finde.
Mich würde interessieren, warum bei Gainward die FX 5950 U im Vergleich zu der GT 6800 eigentlich überall bessere Werte vorweisen kann (nur RAMDAC unterscheidet sich erheblich) und trotzdem in den Benchmarks um einiges schlechter abschneidet. Liegt es nur am Chip?
Oder unterscheiden sich die Technologien so extrem? Oder hab ich einfach nur die falschen Werte? (fetter Text -> FX 5950 U hat bessere Werte; unterstrichen -> GT 6800 liegt in den Werten vorne)

Product Specifications

Processor nVIDIA GeFORCE FX 5950 Ultra
Enginne Clock 475 MHz
Frame Buffer 256 MB
Memory Type 2.0 ns DDR.
Memory Width 256 bit
Bandwidth 28.8 GB/sec
RAMDAC 400 MHz
Maximum Resolution @ 85 Hz 2048 x 1536
AGP 8X
Rendering Pipelines 8
Texels/Clock 16
Triangle Setup YES
Transfer $ Lighting YES
MPEG2 Accelleration YES

Model Gainward PowerPack!
Ultra/2100
TV-DVI
Engine Name nVidia GeForce 6800
Engine Clock Frequency 325MHz
Memory Specifications 128MB 2.8ns DDR
Memory Frequency 700MHz
Memory Width 256-bit
Memory Bandwidth 22.4GB/s
RAMDAC Frequency 2 x 400MHz
Bus Speed AGP 2X/4X/8X
Cooling Fan

Technology

· 256-bit Graphics Core
· CineFX™ 3.0
· UltraShadow II
· Intellisample III
· DirectX 9.0x Support
· OpenGL 1.5 Support
· 12-pipe GPU
· 64bit Texturefiltering
· 64bit Textureblending

Hinnibal · 22. Oktober 2004

Die Gainward is aber keine GT! Das is "nur" ne normale 6800nu! Und der Geschwindigkeitsvorteil kommt zu 90% vom Chip da der ja 12Pipes hat und die 6800nu in Shader Sachen sehr viel besser is und die Restlichen 10% würd ich mal nem besseren Layout zuschreiben!

btw: Eine richtige GT hat 16Pipes, 2,0ns GDDR3 Ram und einen Takt von 350/1000!

//Edit by Green Mamba
Es ist nicht nötig den ganzen Kram zu zitieren.

kk sry

KonKorT · 22. Oktober 2004

Wenn du so willst hat die GeForce 6800 und 6800 GT einen höheren Chiptakt, hätte die 6800 und die 6800 GT auch 8 Pixelpiplines wie die 5950 Ultra, hätten sie folgende Taktraten.

GeForce 5950 Ultra = 475/950 MHz
GeForce 6800 = 488/700 MHz
GeForce 6800 GT = 700/1000 MHz

Am Speicher braucht man nicht umzurechnen, da alle Karten ein 256 Bit breites Speicherinterface haben.

LeChris · 22. Oktober 2004

Die RAMDACs dürften bei beiden Chips gleich sein

. Sind sowieso nur die Bilderzeuger, von daher haben die auf die Performance keinen Einfluß...

Wie du schon angemerkt hast, hat die 6800 gegenüber der 59xx schon ca. 50% mehr Pipelines. Das kannst du erstmal 1 zu 1 in Taktrate umrechnen, womit die beiden Karten dann gleich auf wären.

Zudem sind die einzelnen Pipes der 59xx einfach beschrieben sehr begrenzt und können insbesondere Operationen mit komplexen FP-Zahlen (24Bit und höher) nur kombiniert ausführen. Im ungünstigsten Fall kann zB nur eine Vertexoperation pro Takt ausgeführt werden anstatt der angegebenen 3! Überhaupt verhält sich die NV3x-Architektur bei parallen Operationen (INT und FPs gleichzeitig) sehr zickig. Da diese insbesondere in D3D vorkommen, fallen die NV3x hier weit hinter ihre theoretische Renderleistung zurück...

Die NV4x ist da wesentlich flexibler und operiert im Schnitt dichter an ihrer theoretischen Leistung. Hinzu kommen dann noch kleine Sachen wie winkelabhängiges AF, was einiges an Bandbreite einspart. Auch das 4xAA wird jetzt als Multisampling mit gedrehtem Raster ausgeführt und ist schneller als die (immer noch wählbaren) Supersamplings...

Für den Normalverbraucher reicht aber ein Blick auf einschlägige Benchmarks!

riDDi · 22. Oktober 2004

eine 6800 hat 300% pipelines gegen über ner 59x0

eine 6800gt gar 400%.

zum einen hat nvidia mit dem nv40 wesentlich effektivere pipes eingeführt, zum anderen enthält der chip diesmal sogar die anzahl an pipes, die das marketing verspricht.
2 tmus/takt bei multi-texturing sind vielleicht schön und gut, deshalb entspricht diese pipe allerdings nicht gleich 2 mit einer tmu/takt.

Wiegel · 22. Oktober 2004

Alles klar, danke für die Info, schönes Wochenende

Carsten · 23. Oktober 2004

(c) schrieb:
Wie du schon angemerkt hast, hat die 6800 gegenüber der 59xx schon ca. 50% mehr Pipelines. Das kannst du erstmal 1 zu 1 in Taktrate umrechnen, womit die beiden Karten dann gleich auf wären.

Eigentlicht hat die 6800 aber dreimal soviele Pipelines (aber nur doppelt soviele ROPs).

Jeder "große" nV3x (also nV30, 35 und 38) kann pro Takt nur 4 colorierte Pixel wegschreiben, dazu kommt noch die Z-/Stencil-Optimierung der ROPs, womit acht Werte pro Takt, die allerdings keine Farbe haben dürfen, möglich sind.

(c) schrieb:
Zudem sind die einzelnen Pipes der 59xx einfach beschrieben sehr begrenzt und können insbesondere Operationen mit komplexen FP-Zahlen (24Bit und höher) nur kombiniert ausführen. Im ungünstigsten Fall kann zB nur eine Vertexoperation pro Takt ausgeführt werden anstatt der angegebenen 3! Überhaupt verhält sich die NV3x-Architektur bei parallen Operationen (INT und FPs gleichzeitig) sehr zickig. Da diese insbesondere in D3D vorkommen, fallen die NV3x hier weit hinter ihre theoretische Renderleistung zurück...

Sie können auch diverse Operationen mit FP16 nur kombiniert ausführen, aber für FP32 stehen nochmal ein MAD und ein MUL (IIRC) weniger zur Verfügung. Dazu kommt der sehr begrenzte Temp-Speicher.
Gemischten Code (FX/FP) können sie hingegen ziemlich flott abarbeiten, da hier auch die Register Combiner (die nur für Pixel-Shader bis 1.3 zugelassen sind und daher ohne das, was gern als Cheat beschrieben wird, nicht zur Berechnung von 2.0-Shader-ähnlichen Effekten genutzt werden dürften.)
Unter OpenGL sind die Berechnungen dagegen "dichter" am Chip, weil der Treiber dort aufgrund der herstellerspezifischen Extensionen nicht nur "DX-Spec" nehmen kann, sondern ziemlich genau das, was dem Chip am besten liegt. Meist ist OpenGL auf nV3x aus diesem Grunde auch deutlich schneller im Vergleich zu ähnlichen DX-Code.

Vertex-Operationen sind eigentlich gar nichtmal so ein Problem, die Bremse liegt vielmehr im Pixelshader.

(c) schrieb:
Die NV4x ist da wesentlich flexibler und operiert im Schnitt dichter an ihrer theoretischen Leistung. Hinzu kommen dann noch kleine Sachen wie winkelabhängiges AF, was einiges an Bandbreite einspart. Auch das 4xAA wird jetzt als Multisampling mit gedrehtem Raster ausgeführt und ist schneller als die (immer noch wählbaren) Supersamplings...

Ack, bis auf das winkelabhängige AF. Es spart zwar auch minimal Bandbreite, das Hauptaugenmerk liegt aber auf eingesparten Füllrate und (wenn es denn wirklich fest in der Hardware verankert ist, worüber ich noch so meine Zweifel habe) Transistorcount im Chip, wodurch im Gegenzug dann wieder eine höhere Taktrate möglich ist.

Suche

Woher kommen die Geschwindigkeitszuwächse bei der GT 6800

Wiegel

Ensign

Hinnibal

Ensign

KonKorT

Lt. Commander

LeChris

Vice Admiral Pro

riDDi

Admiral

Wiegel

Ensign

Carsten

Commodore

Ähnliche Themen

Passend zum Thema

Community 16 statt 8 GB VRAM Mehr Speicher für die GeForce RTX 3070 aus dem Hobbykeller

Nvidia × 007 First Light Ein GeForce-Kauf hat im Mai James Bond an Bord

Nach Nvidia, Meta & Co Auch AMD bewirbt nun das 1:1-CPU-GPU-Verhältnis für AI