2/28 Radeon HD 4670 im Test : ATis neue Mittelklasse-Grafikkarte gleicht nur aus

, 182 Kommentare

Technische Daten

Nachfolgend die technischen Daten der am heutigen Tag von uns getesteten Radeon HD 4670 mit 512 MB GDDR3-Speicher.

Radeon
HD 3650
Radeon
HD 4670
Radeon
HD 4850
GeForce
9600 GSO
Logo ATi Radeon Graphics ATi Radeon Graphics ATi Radeon Graphics Nvidia GeForce
Chip RV635 RV730 RV770 G92
Transistoren ca. 378 Mio. ca. 514 Mio. ca. 965 Mio. ca. 754 Mio.
Fertigung 55 nm 55 nm 55 nm 65 nm
Chiptakt 725 MHz 750 MHz 625 MHz 555 MHz
Shadertakt 725 MHz 750 MHz 625 MHz 1.350 MHz
Shader-Einheiten
(MADD)
24 (5D) 64 (5D) 160 (5D) 96 (1D)
FLOPs (MADD/ADD) 174 GFLOPs 480 GFLOPs 1000 GFLOP/s 389 GFLOPs*
ROPs 4 8 16 12
Pixelfüllrate 2900 MPix/s 6000 MPix/s 10000 MPix/s 6660 MPix/s
TMUs 8 32 40 48
TAUs 16 32 40 48
Texelfüllrate 5800 MTex/s 24000 MTex/s 25000 MTex/s 26640 MTex/s
Shader-Model SM 4.1 SM 4.1 SM 4.1 SM 4
Hybrid-CF/-SLI X X X X
effektive Windows
Stromsparfunktion
X
Speichermenge 512 GDDR3 512 GDDR3 512 GDDR3 384 GDDR3
Speichertakt 800 MHz 1.000 MHz 993 MHz 800 MHz
Speicherinterface 128 Bit 128 Bit 256 Bit 196 Bit
Speicherbandbreite 25600 MB/s 32000 MB/s 63552 MB/s 38400 MB/s

Die ATi Radeon HD 4670 basiert auf der 514 Millionen Transistoren schweren RV730-GPU, die im 55-nm-Prozess bei TSMC hergestellt wird. Die Architektur des RV730 ist größtenteils identisch mit der des RV770, allerdings hat man diverse Recheneinheiten entfernt, um den Chip günstiger herstellen lassen zu können. Die eigentlichen Fähigkeiten sind aber identisch geblieben, weswegen wir für nähere Technik-Details immer noch das Launch-Review zur Radeon-HD-4800-Serie empfehlen können.

Während der original RV770 über zehn SIMD-Shadereinheiten mit je 16 5D-Shadereinheiten verfügt (insgesamt 160 5D-Shader), sind von diesen auf dem RV730 nur noch acht übrig geblieben. Doch wenn man jetzt davon ausgeht, dass auf dem RV730 somit noch satte 128 5D-ALUs vorhanden sind, so müssen wir dies leider verneinen. Denn das RV700-Design scheint flexibler zu sein als man bis jetzt vermutet hatte. Anstatt 16 5D-Shadereinheiten pro SIMD wurde die Anzahl der ALUs beim RV730 halbiert. So setzt die Radeon HD 4600 auf acht SIMD-Blöcke mit je acht 5D-ALUs, was in 64 5D-Shadereinheiten resultiert.

Die 5D-Einheiten können sich theoretisch im Verhältnis 1:1:1:1:1 aufsplitten (wobei sie sich dann wie Skalarshader verhalten), jedoch müssen die Operationen dafür vollkommen unabhängig voneinander sein. Sind sie hingegen voneinander abhängig, warten einige ALUs auf die Ergebnisse der anderen und stehen still. Der Thread-Scheduler versucht dies zu verhindern und die ALUs mit anderweitigen Aufgaben zu belegen, doch ist dazu eine Menge Treiberoptimierung von Nöten. Jede ALU kann auf dem RV730 eine MADD-Operation (Multiply-ADD) pro Takt durchführen.

RV730-GPU
RV730-GPU

Da in der RV770-Architektur die Textureinheiten an die SIMD-Einheiten gekoppelt sind, deaktiviert man mit den ALUs auch die Texture Mapping Units, kurz TMU. Beim RV770 besteht jeder Texturcluster aus vier TMUs, die pro Takt einen bilinearen Pixel adressieren sowie texturieren können. Pro SIMD gibt es einen Texturcluster. Dementsprechend sind auf dem RV730 noch acht Texturcluster (und nicht vier, wenn man das Verhältnis SIMD/ALU wie beim RV770 belassen hätte) vorhanden, womit der Radeon-HD-4600-Serie noch 32 TMUs zur Verfügung stehen. Ein geschickter Schachzug, da die Texelfüllrate mit dem „original“ Verhältnis deutlich geringer ausgefallen wäre.

Darüber hinaus hat es beim Speicherinterface Einsparungen gegeben. Während dem RV770-Chip noch vier 64 Bit breite Speichercontroller (256-Bit-Speicherinterface) unterstellt sind, fallen zwei 64-Bit-Controller auf dem RV730 weg, womit das Speicherinterface nur noch 128 Bit breit ist. Da jeder Speichercontroller einen ROP-Cluster (Raster Operation Unit, ATi nennt diese Render Back Ends) beinhaltet, sind auf dem RV730 noch zwei ROP-Cluster mit je vier ROPs vorhanden. Der RV730 bietet dem Käufer also acht ROPs für die Rechenkraft an.

Die RV730-GPU auf der Radeon HD 4600 unterstützt logischerweise die Direct3D-10.1-API sowie den Unified Video Decoder (UVD) in der zweiten Generation, der sowohl den H.264- als auch den VC-1-Codec vollständig beschleunigen kann. PowerPlay 2.0, zum Reduzieren der Leistungsaufnahme, ist ebenso mit an Bord.

RV730-GPU
RV730-GPU

*Die von uns angegebenen GFLOP-Zahlen der G80/G92-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.

Auf der nächsten Seite: Impressionen