2/25 Radeon HD 4770 im Test : ATis erste 40-nm-Grafikkarte überzeugt durchweg

, 471 Kommentare

Technische Daten

Radeon
HD 4770
Radeon
HD 4830
Radeon
HD 4850
GeForce
9800 GT
Logo ATi Radeon Graphics ATi Radeon Graphics ATi Radeon Graphics Nvidia GeForce
Chip RV740 RV770 RV770 G92(b)
Transistoren ca. 826 Mio. ca. 965 Mio. ca. 965 Mio. ca. 754 Mio.
Fertigung 40 nm 55 nm 55 nm 65 nm
55 nm
Chiptakt 750 MHz 575 MHz 625 MHz 600 MHz
Shadertakt 750 MHz 575 MHz 625 MHz 1.512 MHz
Shader-Einheiten
(MADD)
128 (5D) 128 (5D) 160 (5D) 112 (1D)
FLOPs (MADD/ADD) 960 GFLOPs 736 GFLOPs 1000 GFLOP/s 508 GFLOPs*
ROPs 16 16 16 16
Pixelfüllrate 12000 MPix/s 9200 MPix/s 10000 MPix/s 9600 MPix/s
TMUs 32 32 40 56
TAUs 32 32 40 56
Texelfüllrate 24000 MTex/s 18400 MTex/s 25000 MTex/s 33600 MTex/s
Shader-Model SM 4.1 SM 4.1 SM 4.1 SM 4
Hybrid-CF/-SLI X X X ✓ (teilweise)
effektive Windows
Stromsparfunktion
✓ (bedingt) X
Speichermenge 512 MB GDDR5 512 MB GDDR3 512 MB GDDR3 512 MB GDDR3
Speichertakt 1.600 MHz 900 MHz 993 MHz 900 MHz
Speicherinterface 128 Bit 256 Bit 256 Bit 256 Bit
Speicherbandbreite 51200 MB/s 57600 MB/s 63552 MB/s 57600 MB/s

Die Radeon HD 4770 basiert auf der RV740-GPU, die im Prinzip nichts anderes als ein modifizierter RV770-Kern ist, aber trotzdem eine wichtige Premiere feiert: Der RV740 wird als erste GPU überhaupt im nagelneuen 40-nm-Prozess bei TSMC hergestellt, der nicht nur einen kleineren Die, sondern auch eine niedrigere Leistungsaufnahme ermöglicht. So gesehen ist der Rechenkern ein erster Probelauf für die „Next-Gen-GPU“ RV870.

Der RV740 besteht aus 826 Millionen Transistoren und fährt somit nicht viel weniger Schaltungen als der größere Bruder RV770 auf. Die GPU kann auf acht SIMD-Einheiten mit je 16 Shadercluster (ein Shadercluster besteht aus 5 ALUs sowie einer Branch Execution Unit, wobei eine ALU zusätzlich als Special Function Unit (SFU) agiert und somit blockiert sein kann) zurückgreifen, was in 128 5D-Shadereinheiten sowie insgesamt 640 MADD-fähigen ALUs resultiert. An der Architektur der RV7x0-Generation hat es also keinerlei Änderungen gegeben.

An jeder SIMD-Einheit ist ein Textur-Cluster angeschlossen, der sich aus vier vollwertigen Textureinheiten zusammensetzt, die jeweils einen Pixel adressieren und texturieren können. Der RV740 verfügt also über 32 Textureinheiten. Auch bei den ROPs, die ATi Render Back End nennt, hat sich nichts getan. Es gibt auf dem RV740 vier ROP-Partitions und somit insgesamt 16 ROPs. Die eigentliche Hardwareausstattung ist also identisch mit der der Radeon HD 4830.

RV740-Architektur
RV740-Architektur

Die GPU der Radeon HD 4770 betreibt ATi mit 750 MHz. Somit sind die theoretischen Leistungsdaten der Radeon HD 4770 nur minimal schwächer als die der Radeon HD 4850. Die eigentliche Schwachstelle des Rechenkerns findet man dagegen im Speicherinterface. Denn während bei Nvidias aktueller GT200-Generation die Memorycontroller direkt an die ROP-Partitions angebunden sind, ist das Design dort nun etwas flexibler. So kann man einen Memorycontroller entfernen, ohne dass dies einen Einfluss auf die ROPs hat.

Und genau das hat AMD beim RV740 getan. Trotz der 16 ROPs gibt es nur zwei 64-Bit-Speichercontroller, weswegen das Speicherinterface des RV740 nur 128 Bit anstatt 256 Bit breit ist. Um diesen Hemmschuh zu kompensieren, setzt ATi auf der Radeon HD 4770 flotten GDDR5-Speicher ein, der mit 1.600 MHz taktet. Nichtsdestotrotz ist die Speicherbandbreite der Radeon HD 4770 geringer als die der Radeon HD 4830. Die Speichergröße beträgt auf dem Referenzdesign 512 MB, wobei die Hersteller genauso 1.024-MB-Varianten anbieten können (und wohl auch werden).

Davon abgesehen gibt es zwischen dem RV740 und dem RV770 beziehungsweise dem RV790 keinerlei Unterschiede. Sämtlichen Features der größeren Brüder findet man auch auf der Radeon-HD-4700-Serie wieder.

RV740-GPU
RV740-GPU

*Die von uns angegebenen GFLOP-Zahlen der G80/G92-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.

Auf der nächsten Seite: Impressionen