Immortalis-G715, Mali-G715, G615: Hardware-Raytracing und VRS ziehen in neue Arm-GPUs ein

Nicolas La Rocco
20 Kommentare
Immortalis-G715, Mali-G715, G615: Hardware-Raytracing und VRS ziehen in neue Arm-GPUs ein
Bild: Arm

Neben den neuen CPU-Kernen Cortex-X3, A715 und A510 Refresh hat Arm heute drei neue GPUs vorgestellt: Immortalis-G715, Mali-G715 und Mali-G615. Das Flaggschiff ist mit einer Raytracing-Unit ausgestattet, um Hardware-Raytracing etwa in Smartphones, Tablets und Arm-Notebooks zu ermöglichen. Alle drei GPUs unterstützen auch VRS.

Nach der CXT-GPU von Imagination Technologies und der Xclipse-920-GPU auf Basis von AMD RDNA 2 im Exynos 2200 ist die Immortalis-G715 die dritte für Arm-Prozessoren entwickelte mobile GPU, die Hardware-beschleunigtes Raytracing unterstützt und damit einen deutlichen Vorteil gegenüber Software-Implementierungen hat. Im Vergleich zu Lösungen dieser Art soll der Vorsprung wenig überraschend bei über 300 Prozent liegen, erklärt Arm auf Basis eigener interner Benchmarks. Damit fehlt im Android-Umfeld als Mitstreiter nur noch Qualcomm mit einer Adreno-GPU samt Raytracing-Unterstützung.

Valhall-Architektur in 4. Generation

Bei der Immortalis-G715 vertraut Arm weiterhin auf die im Mai 2019 mit der Mali-G77 erstmals eingeführte Valhall-Architektur, die 2020 auch bei der Mali-G78 und G68 sowie der letztjährigen Mali-G710 und G610 zum Einsatz kam. Einer vom Unternehmen veröffentlichten Roadmap zufolge dürfte im nächsten Jahr ein Wechsel der GPU-Architektur anstehen.

Immortalis kommt exklusiv mit Raytracing-Unit

Immortalis-G715, Mali-G715 und Mali-G615 nutzen allesamt die vierte Generation der Valhall-Architektur und besitzen einen sehr ähnlichen Aufbau, der lediglich in der Konfiguration der Shader-Cores und deren Anzahl abweicht. Die Immortalis-G715 ist innerhalb des Inner-Cores des Shader-Cores exklusiv mit einer neuen Raytracing-Unit (RTU) für Hardware-beschleunigtes Raytracing ausgestattet, die den zwei anderen Neuvorstellungen fehlt. Wie Arm erläutert, sollen weniger als 4 Prozent der Shader-Core-Fläche auf die neue Raytracing-Beschleunigung entfallen. Die Mali-G715 besitzt den gleichen Shader-Aufbau, allerdings in reduzierter Anzahl, und muss auf die RTU verzichten. Selbiges gilt für die Mali-G615, die auf nochmals weniger Shader-Cores beschränkt ist. Arm beschreibt die Immortalis-G715 als neues Flaggschiff und die Mali-G715 und Mali-G615 als neue Premium-GPUs.

Neue Ray Tracing Unit im Inner Core
Neue Ray Tracing Unit im Inner Core (Bild: Arm)

Effizientes Raytracing für Smartphones

Um das Raytracing auf einer mobilen GPU wie der Immortalis-G715 möglichst effizient zu gestalten, wird nicht jedes Primitiv einer Szene, also die Polygone, aus denen sich die Objekte einer Szene zusammensetzen, gegen den Strahl getestet. Stattdessen kommt wie bei anderen bekannten GPU-Herstellern eine Beschleunigungstechnik zum Einsatz, die den Strahl gegenüber stetig kleiner werdenden dreidimensionalen Boxen testet, die ein komplexes dreidimensionales Objekt aus Polygonen enthalten. Kreuzt der Strahl diese Box nicht, dann kreuzt er logischerweise auch nicht die darin enthaltenen Primitive, die somit nicht berechnet werden müssen. Dieses Verfahren führt die RTU so lange durch, bis in der sogenannten „Bounding Volume Hierarchy“ (BVH), also der Hierarchie der Datenstruktur (Baum), ein Blatt erreicht wird, gegen dessen Primitive dann der Strahl getestet wird. Um diese Berechnungen durchzuführen, verfügt jede RTU jedes Inner-Cores eines Shader-Cores der Immortalis-G715 über eine RBOX_UNIT (RT_RAY_BOX) für das Traversal der BVH und eine RTRI_UNIT (RT_RAY_TRI) für die Intersection mit dem Polygon. Das Shading und das Denoising übernehmen dann wieder die Shader im Shader-Core.

Raytracing nutzt BVH für Primitive (Bild: Arm)

Raytracing wird auf der Immortalis-G715 ausschließlich in Verbindung mit der Vulkan-API unterstützt und ist Stand heute nur für Android, aber nicht für Windows vorgesehen.

Raytracing-Units wachsen mit Anzahl der Shader-Cores

Wie viele Raytracing-Units eine Immortalis-G715 besitzt, ist somit davon abhängig, mit wie vielen Shader-Cores sie vom SoC-Anbieter konfiguriert wurde. Um die Positionierung als Flaggschiff im Portfolio zu wahren, ermöglicht Arm empfohlene Konfigurationen mit 10 bis 16 Shader-Cores und 2 oder 4 L2-Slices mit bis zu 1 MB. Maximal kommen somit 16 RTUs zum Einsatz. Die neue Mali-G715, die ohne RTU auskommt, lässt sich mit 7 bis 9 Shader-Cores konfigurieren und besitzt vom Raytracing abgesehen dieselben Eigenschaften. Die Mali-G615 ist für 1 bis 6 Shader-Cores ausgelegt und kann auf Wunsch mit nur 1 statt 2 oder 4 L2-Slices ausgerüstet werden.

Immortalis-G715
Immortalis-G715 (Bild: Arm)
Mali-G715
Mali-G715 (Bild: Arm)
Mali-G615
Mali-G615 (Bild: Arm)

Arm verdoppelt FMA-Einheiten

Arm legt mit 15 Prozent mehr Leistung und 15 Prozent weniger Verbrauch im Vergleich zur jeweils vorherigen Generation mit gleicher Anzahl Shader-Cores nach – Raytracing außen vor. Erreicht wird dies unter anderem durch eine Überarbeitung der Execution-Engines. Der Inner-Core jedes Shader-Cores kommt bei der Valhall-Architektur auf zwei Execution-Engines, die wiederum jeweils unter anderem zwei Processing-Units besitzen. In jeder Processing-Unit sitzt ein Processing-Element, das Arm für die vierte Valhall-Generation um ein zweites Modul für FMA („Fused Multiply-Add“) mit einem zusätzlichen Block für die Multiplikation von Matrizen (MMUL) ergänzt hat. Diese Verdoppelung der Einheiten löst den bisherigen Aufbau mit nur einem FMA-Modul ab und soll die Leistung speziell bei FMA verdoppeln, obwohl dafür die Shader-Core-Fläche nur um 25 Prozent wächst.

Shader-Cores großflächig überarbeitet

Die jeweils zwei Execution-Engines sind ein Bestandteil jedes Shader-Cores, die mit der vierten Valhall-Generation weitere Verbesserungen im Bereich „Power, Performance and Area“ (PPA) erhalten. Allgemein soll das „Command Stream Front-End“ (CSF) schneller arbeiten, der Tiler erreicht in der Spitze den dreifachen Polygon-Durchsatz, der FP16-Blender-Durchsatz wurde verdoppelt, ein neuer Hardware-Block für FP16-MSAA wurde integriert, das Texture-Mapping arbeitet bei gewissen LODs mit doppelter Geschwindigkeit, „Arm Fixed Rate Compression“ (AFRC) wurde implementiert, der Durchsatz der Varying-Unit wurde verdoppelt und die Load/Store-Effizienz der Caches wurde angehoben.

Alle neuen GPUs unterstützen VRS

Diese Optimierungen am Front-End, Tiler und Shader-Core fließen mit Ausnahme der RTU in alle heutigen Neuvorstellungen ein. Das gilt auch für die Unterstützung von „Variable Rate Shading“ (VRS), das für bestimmte Bildbereiche eine niedrigere Shading-Qualität ermöglicht, ohne dass darunter sichtbar die Qualität leiden soll. In einem Beispiel, in dem Arm mittels VRS die Rasterization- von der Shading-Frequenz entkoppelt, liegt die Shading-Rate nur noch bei eins pro vier Pixel statt eins pro ein Pixel ohne VRS.

Alle drei neuen GPUs unterstützen VRS (Bild: Arm)

VRS ist vor allem für mobile Endgeräte von Relevanz, weil damit nicht nur die FPS angehoben werden können, wobei Arm diese Steigerung mit bis zu 40 Prozent quantifiziert. Bei gleichen FPS wie zuvor kann alternativ auch der Verbrauch reduziert und damit die Energieeffizienz sowie Akkulaufzeiten des Smartphones gesteigert werden. VRS funktioniert auf Immortalis-G715, Mali-G715 und Mali-G615.

Treiber-Updates über Google Play geplant

Die drei neuen GPUs sollen zu einem späteren Zeitpunkt über die Google Play Services aktualisierbare Treiber erhalten, wie Arm in einer Frage-und-Antwort-Runde erklärte. Vor allem mit der Einführung von Hardware-Raytracing dürfte es im Bereich des Android-Treibers noch viel Optimierungspotenzial geben.

ComputerBase hat Informationen zu diesem Artikel von Arm im Rahmen einer Veranstaltung des Herstellers in Austin, Texas unter NDA erhalten. Die Kosten für Anreise, Abreise und Hotelübernachtungen wurden von dem Unternehmen getragen. Eine Einflussnahme des Unternehmens auf die oder eine Verpflichtung zur Berichterstattung bestand nicht. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.

Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.