Autonomes Fahren: Nvidia Orin vereint neue GPU mit ARM Hercules zu 200 TOPS

Nicolas La Rocco 27 Kommentare
Autonomes Fahren: Nvidia Orin vereint neue GPU mit ARM Hercules zu 200 TOPS
Bild: Nvidia

Nvidia hat zur GTC China erstmals über die „Orin“ genannte nächste Generation System-on-a-Chip für autonomes Fahren gesprochen. Das SoC ist der Nachfolger des Xavier-SoCs und soll in Zukunft in mehreren Konfigurationen von Level 2 bis Level 5 skalieren. Nvidia gibt der Autoindustrie zudem Zugriff auf seine Deep Neural Networks.

Einen ersten Ausblick auf Orin hatte Nvidia bereits im Frühjahr 2018 zur GTC unweit des Firmensitzes in San Jose gegeben, als der Chip auf einer Roadmap zu sehen war, aber nicht weiter im Detail erläutert wurde. Seitdem herrschte Stillschweigen rund um Orin, nur gelegentlich war Nvidia zu entlocken, dass weiter daran entwickelt werde.

17 Milliarden Transistoren

Zur GTC in China lüftet Nvidia zumindest zum Teil den Schleier und stellt Orin als Ergebnis einer vierjährigen Entwicklungsphase mit Kosten in Höhe von mehreren Milliarden US-Dollar vor. Orin versammelt 17 Milliarden Transistoren auf bislang unbekannter Fläche unter Verwendung eines 8-nm-Fertigungsprozesses. Das ist gut das Doppelte der 9 Milliarden Transistoren des Xavier-SoCs, den Orin ablösen soll. Zum Vergleich: Apples A13 Bionic bringt es auf 8,5 Mrd. Transistoren, Qualcomms Snapdragon 8cx soll die gleiche Anzahl haben. Nvidia zufolge soll Orin als Drive-AGX-Orin-Plattform für autonomes Fahren und Roboter 2022 einsatzbereit sein.

Next-Gen-GPU und ARM Hercules

Orin nutzt im Bereich der GPU erneut eine Eigenentwicklung von Nvidia, nachdem Xavier ebenso mit einer eigenen GPU auf Volta-Basis ausgestattet ist. Nvidia geht bei Orin jedoch nicht über die Angabe einer „Architektur der nächsten Generation“ hinaus, sodass Vermutungen zur Ausstattung neben Turing auch in Richtung Ampere gehen.

Kurzer Ausblick auf Orin zur GTC im März 2018
Kurzer Ausblick auf Orin zur GTC im März 2018 (Bild: Nvidia)

Nicht minder interessant ist die CPU, bei der Nvidia auf ARMs Hercules-Kerne des kommenden Jahres setzt. Hercules ist der Nachfolger von Deimos, zwischenzeitlich besser bekannt als Cortex-A77. Hercules ist ARM zufolge für die Fertigung in 7 nm und 5 nm ausgelegt, sodass aus Nvidias Wahl der CPU erste Hinweise zur Fertigung von Orin extrahiert werden können. Die Hercules-Kerne sollen bei gleichem Takt eine 10 Prozent höhere Leistung als Deimos alias Cortex-A77 liefern. Der Griff zu ARM-Designs ist eine Abkehr früherer SoC-Entwicklungen, als mit Denver (Tegra K1), Denver2 (Tegra X2) und Carmel (Xavier) noch eigene CPUs entwickelt wurden. Dem von Nvidia zur Verfügung gestellten Bild zufolge nutzt Orin zwölf Hercules-Kerne.

Nvidia integriert in das Orin-SoC außerdem neu entwickelte Beschleuniger für Deep Learning und Computer Vision, die in Summe mit GPU und CPU eine Rechenleistung von 200 TOPS liefern. Das ist ungefähr die siebenfache Rechenleistung des vor zweieinhalb Jahren vorgestellten Xavier-SoCs (30 TOPS/30 Watt). Drive PX Pegasus, das aus bis zu zwei Xavier-SoCs und zwei Turing-GPUs besteht, kommt auf 320 TOPS bei deutlich höherem Energiebedarf. Orin dürfte signifikant unter den je nach Auslastung 300 bis 500 Watt eines Drive PX Pegasus liegen. Zum Vergleich: Teslas FSD-Computer, der Nvidias Hardware in allen Modellen abgelöst hat, kommt auf 144 TOPS bei 72 Watt. Nvidia-CEO Jensen Huang hatte zur letzten GTC betont, dass Auto-Hardware schneller, kleiner und günstiger werden müsse. Mit Orin bewegt sich Nvidia in diese Richtung.

Neue Software für die Autoindustrie

Mit Orin sind Fahrerassistenzsysteme gemäß Level 2 bis hoch zum autonomen Fahren nach Level 5 geplant. Danny Shapiro, Senior Director of Automotive, erklärte, dass sich Orin wie Xavier oder Drive PX Pegasus in unterschiedlichsten Konfigurationen aus einem oder mehreren SoCs sowie zusätzlichen GPUs einsetzen lassen wird. Da Orin und Xavier über bekannte CUDA- und TensorRT-APIs sowie gleiche Bibliotheken programmiert werden, können Entwickler ihre Software auch auf dem neuen SoC nutzen. Orin soll mit einer großen Anzahl simultan laufender Anwendungen und Deep Neural Networks (DNN) zurechtkommen. In diesem Segment gibt Nvidia künftig Know-how weiter.

Der Autoindustrie will Nvidia Zugriff auf die eigenen DNNs geben, die über Jahre mit einer Testwagenflotte trainiert und für die Drive-Plattform optimiert wurden. Rohdaten zahlreicher Sensoren im Auto liefern Nvidia Informationen etwa zur Erkennung von Straßenschildern und Ampeln, anderen Autos, Fußgängern oder Fahrradfahrern. Auch die Pfaderkennung und -berechnung sowie das Eye-Tracking beim Fahrer und die Gestenerkennung im Auto decken die DNNs ab. Neue Tools für Entwickler etwa aus der Autoindustrie erlauben Herstellern Veränderungen an Nvidias DNNs für die eigene Nutzung bei paralleler Option auf die Bereitstellung der Anpassungen gegenüber Dritten, um gemeinschaftlich die Entwicklung des autonomen Fahrens voranzutreiben.

Update 18.12.2019 15:16 Uhr

Auf Nachfrage hat Nvidia bestätigt, dass Orin im 8-nm-Prozess gefertigt werden soll. Gemessen an den derzeit verfügbaren Fertigungsprozessen müsste der Auftrag an Samsung mit 8LPP gegangen sein. TSMC bietet keinen entsprechenden Node an.

Skalierbarkeit von Orin
Skalierbarkeit von Orin

Darüber hinaus liegen ComputerBase Angaben zum Verbrauch von Orin vor, wobei hier aufgrund der Skalierbarkeit der Plattform nicht nur ein Wert genannt werden kann. Orin startet in der Version für Level 2 als S-Variante für die Auswertung einer Kamera mit 36 TOPS bei 15 Watt, gefolgt von Orin für vier Kameras mit 100 TOPS bei 40 Watt. Nvidia sieht für Level 3 zwei Orin-SoCs in einer Konfiguration mit 400 TOPS bei 130 Watt (3,1 TOPS/Watt) vor. Level 5 könne 2022 mit zwei Orin-Chips und zwei GPUs der nächsten Generation mit 2.000 TOPS bei 750 Watt (2,7 TOPS/Watt) realisiert werden. In jedem Fall stellt Orin eine deutliche Verbesserung in Sachen Effizienz dar.

Plattform Leistung INT8 Verbrauch Leistung/W
L2 Xavier 30 TOPS 30 Watt 1 TOPS
Orin S (1 Cam) 36 TOPS 15 Watt 2,4 TOPS
Orin (4 Cam) 100 TOPS 40 Watt 2,5 TOPS
L3 Xavier + Turing-GPU 160 TOPS 230 Watt 0,7 TOPS
2 Orin 400 TOPS 130 Watt 3,1 TOPS
L5 2 Xavier + 2 Turing-GPUs 320 TOPS 460 Watt 0,7 TOPS
2 Orin + 2 Next-Gen-GPUs 2.000 TOPS 750 Watt 2,7 TOPS

ComputerBase hat Informationen zu diesem Artikel von Nvidia unter NDA erhalten. Die einzige Vorgabe war der frühest mögliche Veröffentlichungszeitpunkt.