Test: ATi Radeon HD 5870 (4/29)

ATi legt vor
Autor:

Technik im Detail Part 2

Speicherinterface:
Über das Speicherinterface des RV870 gab es diverse Gerüchte bis hin zu einem 384-Bit-Interface, die sich schlussendlich aber als falsch heraus gestellt haben. Stattdessen arbeitet die Radeon-HD-5800-Serie weiterhin mit einem gewöhnlichen 256-Bit-Interface, das sich aus vier 64-Bit-Controllern zusammen setzt. Pro Speichercontroller werden auf der 1.024-MB-Karte zwei 32-Bit-Speicherchips installiert.

Der RV870 setzt wie der RV770 auf eine klassische (aber effektive) Crossbar, die bei ATi mittels eines so genannten „Hubs“ realisiert wird. An diesen Hub sind jeweils vier 64-Bit-Controller angeschlossen. Darüber hinaus verwaltet der Hub den PCIe-Anschluss, den Unified Video Decoder (UVD 2), die Display-Verbindungen sowie den CrossFireX-Compositor.

Auffällig ist die Abstinenz des „CrossFire X Interconnect“, der erst beim RV770 eingeführt worden ist. Dieser sollte für zusätzliche Bandbreite zwischen den einzelnen GPUs sorgen, wurde offensichtlich im Treiber aber niemals aktiviert und ist mittlerweile für überflüssig empfunden worden.

ATi RV870 Architektur
ATi RV870 Architektur

ATi gibt als Verbesserung beim Speichercontroller im RV870 eine „Optimized Memory Controller Area“ an, ohne allzu ins Detail zu gehen. Der Chip kann spezielle Fehlerprüfungen (CRC-Checks) bei hohen Taktraten durchführen, um einen fehlerfreien Datenverkehr zu ermöglichen. Es wurde der Controller angepasst, sodass dieser nun besser mit hoch getaktetem GDDR5-Speicher umgehen kann. Zudem spricht ATi davon, dass sowohl die Taktraten als auch die Spannungen des Speichers ohne Wartezeiten verändert werden können, was vor allem im Energiesparmodus wichtig sein soll.

Energiesparmechanismus:
Der Energiesparmodus war vor allem auf den GDDR5-Modellen der Radeon-HD-4000-Serie problematisch, da dieser unter Windows nicht so richtig zu funktionieren schien. Das möchte ATi auf dem RV870 behoben haben und gibt für die Radeon HD 5850 und die die Radeon HD 5870 eine Leistungsaufnahme von gerade einmal 27 Watt im 2D-Modus an. Die Radeon HD 4870 soll dagegen noch 90 Watt aus der Leitung ziehen, die Radeon HD 4890 offiziell 60 Watt.

Erreicht will ATi diese Meilensteine dadurch haben, dass der GDDR5-Speicher sowie dessen Controller nun niedrigere Taktraten sowie Spannungen zulassen. Es gibt einen „Low Power Strobe Mode“, der das „Recovery“-Signal für den Speicher abschaltet und so die Leistungsaufnahme weiter senkt. ATi hat auch die Temperatur-Erkennung der Spannungswandler verbessert, um so ein Überhitzen zu verhindern. Auch spricht ATi von einem „Ultra Low Power State“, kurz ULPS, für Multi-GPU-Karten. Was genau dieser macht, bleibt vorerst unklar, jedoch ist es denkbar, dass damit ein Rechenkern komplett abgeschaltet werden kann.

DirectX 11:
Eine der größten Neuerung auf der RV870-GPU ist die Unterstützung der DirectX-11-API. Wir werden nur auf die wichtigsten Eckpunkte eingehen, da eine ausführliche Erklärung den Umfang dieses Artikels sprengen würde. Grob gesagt kommt DirectX 11 mit fünf wichtigen Neuerungen daher: Tessellation, Direct Compute 11, Multi-Threading, Shader-Model 5.0 sowie einer neuen Textur-Kompression.

ATi RV870 Architektur
ATi RV870 Architektur

Der Tessellator ist für ATi ein alter Bekannter, da er, wenn auch in einer anderen Form, bereits bei der Radeon-HD-2000-Serie (sowie der Xbox-360-GPU) verbaut wurde. Mit dem Feature ist es möglich, aus einem Polygon ohne großen Rechenaufwand ein vielfaches an Polygone zu erstellen, sodass die Optik aufgewertet werden kann. Der Tessellator besteht aus der (mehr oder wenigen Fixed-Function-) Einheit sowie dem Hull- und Domain-Shader. Der Hull-Shader bereitet die Daten für den Tessellator vor, sodass dieser die Geometrie bearbeiten kann, während der Domain-Shader sich um den weiteren Rechenvorgang nach der Tessellation kümmert.

Direct Compute ist für das GPU-Computing zuständig, also das Berechnen von Daten abseits der 3D-Grafik, und ist als Konkurrenz zu OpenCL gedacht. Direct Compute setzt sich aus drei verschiedenen Modi zusammen: Direct Compute 10 (DirectX 10), Direct Compute 10.1 (DirectX 10.1) und Direct Compute 11 für die neueste Generation. Je höher die Version, desto mehr Features kann der Entwickler nutzen.

Die Neuerung Multi-Threading ist genauso abwärtskompatibel, wobei sogar DirectX-9-Karten (allerdings in geringerem Umfang) davon profitieren können. Multi-Threading in DirectX 11 nimmt in Betracht, dass moderne CPUs über mehr als einen Kern verfügen. So kann eine DirectX-11-Applikation in mehrere Threads aufgeteilt werden (die Applikation, die DirectX Runtime sowie der Treiber), was die Performance erhöhen kann.

Das Shader-Model 5.0 (SM 5.0) stellt eine Verbesserung zum SM 4.0 beziehungsweise SM 4.1 dar. So kann SM 5.0 mit den neue Shadertypen wie Compute-, Hull- und Domain-Shader umgehen. Das SM 5.0 ist objektorientiert programmierbar und kommt mit einigen neuen Instruktionen daher. Die verbesserte Texturkompression in DirectX 11 sorgt für eine 6:1-Komprimierung bei 16-Bit-HDR-Texturen und verbessert die Artefakt-Bildung bei einer 8-Bit-Komprimierung.

ATi RV870 Architektur
ATi RV870 Architektur

Eyefinity:
Sämtliche Radeon-HD-5000-Karten werden mit einer „Eyefinity“ genannten Technologie ausgestattet. Eyefinity ist nichts anderes als die native Unterstützung dafür, mehr als zwei Monitore ansteuern zu können. So können die Radeon HD 5850 sowie Radeon HD 5870 zum Beispiel gleichzeitig drei Monitore ansteuern. Darüber wird es auch eine besondere Eyefinity-Version der Radeon HD 5870 geben, die gleich sechs Monitore (2560x1600 Pixel sind nur mit drei Monitoren möglich) ansprechen kann. Dazu sind auf der Karte gleich sechs Mini-DisplayPort-Anschlüsse verbaut.

Setzt man diesen 3D-Beschleuniger in Multi-GPU-Systemen ein, ist sogar die Nutzung von bis zu 24 Monitoren möglich. Eyefinity ist nicht nur ein reines Software-Feature, da ATi in der Eyefinity-Karte dafür gleich sechs TMDS-Transmitter verbaut. Alle sechs können einzig bei der Ansteuerung per Display-Port genutzt werden. Wer allerdings mehr als zwei Monitore nutzen möchte, muss zwangsweise auf den DisplayPort zurück greifen. Per DVI, HDMI oder D-SUB sind maximal zwei Displays möglich.

Eyefinity ermöglicht diverse Aufstellszenarien der Monitore, da deren Ansteuerung frei im Catalyst Control Panel konfiguriert werden kann. Die Technologie ist nicht nur für Spiele sondern ebenso für Filme oder den normalen Windows-Desktop gedacht. Windows Vista oder Windows 7 ist dafür Voraussetzung. Damit Eyefinity ordnungsgemäß funktionieren kann, weiß nur der Grafikkartentreiber von der richtigen Anzahl der Monitore, während Windows nur ein einziges Gerät erkennt.

Dementsprechend können fast alle Spiele „Out the Box“ riesig hohe Auflösungen wie zum Beispiel 5760x2160 darstellen, ohne dass eine Anpassung notwendig ist. Das soll nur bei wenigen Titeln nötig sein und für den Entwickler zudem schnell von Statten gehen. Wer nicht gewillt ist, entsprechend viele einzelne Monitore zu kaufen, soll demnächst von Samsung in Zusammenarbeit mit AMD Abhilfe bekommen. So soll es einen „Eyefinity-Monitor“ mit sechs 23-Zoll-Displays, einer Auflösung von jeweils 1920x1080 sowie einem extra dünnen Rand demnächst zu kaufen geben.

Anzeige