News Autonomes Fahren: Nvidia Orin vereint neue GPU mit ARM Hercules zu 200 TOPS

nlr

Redakteur
Teammitglied
Dabei seit
Sep. 2005
Beiträge
6.594

Bigeagle

Ensign
Dabei seit
Nov. 2008
Beiträge
192
An sich interessant, aber der Graph ist ziemlicher Bullshit, was fragen zum restlichen Gehalt aufwirft.
Moores Law gilt für die Speerspitze der CPU Entwicklung. Natürlich kann man auch kleinere, langsamere CPUs bauen und davon ausgehend größere Wachstumsraten erreichen.
Dazu der Performancevergleich mit den Intel ... Kastraten? Nein ... Energieverbrauchsgedeckelten klingt komisch. U-Prozessoren. Die stellen absolut nicht die Leistungsspitze dar, nicht mal die Energieeffizienzspitze. Das sind nur CPUs für den Einsatz in Gebieten mit stark begrenzten Leistungsreserven (Akkubetrieb z.b.) und/oder Wärmeabfuhr (wie z.b. dünne Laptops, Tablets ...), beides ist sicher wenig relevant für den Nachfolger eines 300 W Chips. Auch hier ist Moores Law eher nicht anwendbar, dazu muss man eher die jeweils dicksten Serverprozessoren heranziehen.
Dazu kommt dass momentan Intel nicht mehr die Spitze stellt ^^
so als kleines Detail am Rande, denn aktuelles Maß für Leistung und Energieeffizienz stellen im CPU Bereich momentan AMD CPUs.

Mich persönlich stört auch die Angabe von TOPS ein wenig. FLOPS sind wenigstens Leistungsrelevant, aber reine OPS? Wenn man Load, Store etc mit dazu nimmt könnten CPUs und Grakas in ähnliche Bereiche kommen ohne dass es etwas besonderes wäre. Doch irgendetwas zu tun hilft noch nicht notwendigerweise dabei etwas bestimmtes zu tun. Hat da jemand eine Erleuchtung für mich, oder ist die Angabe so schwammig wie ich sie interpretiere?
 

Rickmer

Fleet Admiral
Dabei seit
Sep. 2009
Beiträge
12.222
Das sind nur CPUs für den Einsatz in Gebieten mit stark begrenzten Leistungsreserven (Akkubetrieb z.b.) und/oder Wärmeabfuhr (wie z.b. dünne Laptops, Tablets ...), beides ist sicher wenig relevant für den Nachfolger eines 300 W Chips.
Naja, der überwiegende Anteil des Power-Budget wird bei nvidia's Chip für den GPU-Teil reserviert sein.

Außerdem soll die Leistungsaufnahme im Vergleich zum Vorgänger reduziert sein.

was bedeutet das T in TOPS? Um Damenoberbekleidung handelt es sich dabei ja wohl nicht, oder?
https://en.wikipedia.org/wiki/TOPS
 

[wege]mini

Captain
Dabei seit
Juli 2018
Beiträge
3.160
Mich persönlich stört auch die Angabe von TOPS ein wenig. FLOPS sind wenigstens Leistungsrelevant, aber reine OPS?
Dito....

Am Ende vergleicht man ja aber alle Zahlen mit anderen Zahlen. Ob die "Rechenleistung" in Mips, Flops, Ops, Fps oder Lochkarten pro Stunde angegeben wird, bringt ja immer nur im Zusammenhang mit der Anwendung einen verwertbaren Wert.

Einordnen kann man das neue Baby aber ein wenig, damit.

https://www.computerbase.de/2019-04/tesla-fsd-computer-autonomes-fahren-nvidia-drive-agx-xavier/

"Drive AGX Pegasus ist Nvidias Plattform für autonomes Fahren nach Level 5, die mit 320 TOPS deutlich mehr Leistung bietet als Teslas FSD-Platine. Der große Nachteil: Dafür benötigt Nvidia zwei Xavier-SoCs und zwei TU104-GPUs. Der Verbrauch steigt auf 500 Watt, sodass der Energiebedarf pro TOPS beim Dreifachen von Tesla liegt. "

Wenn die neuen 200 TOPS mit so wenig Stromverbrauch schaffen, ist das schon ordentlich. Der gesamte Chip ist so riesig wie ein TU102....Da geht was, egal welche Zahlen du verwendest, um diese These zu untermauern. :smokin:

mfg
 

[wege]mini

Captain
Dabei seit
Juli 2018
Beiträge
3.160
FLOPS sind wenigstens Leistungsrelevant, aber reine OPS?
So sieht es schonmal aus. :D

Eine Floating Point Operation per Second kann man sich ja noch vorstellen....Bei 200 Tera davon (das kommt nach Giga) wird es schon schwerer.

https://de.wikipedia.org/wiki/Floating_Point_Operations_Per_Second

Selbst mips sind irgend wo ja noch "verständlich"...millionen Instruktionen pro Sekunde.

https://de.wikipedia.org/wiki/Instruktionen_pro_Sekunde

Wie schon erwähnt, reine Operations per Second anzugeben und dann davon noch 200 Tera, sagt usern wie uns überhaupt nichts.

Die Programmierer der Software können das ganz sicher einordnen und wir wissen, es ist in bestimmten Szenarien ähnlich schnell wie ein TU102 bei viel kleinerem Stromverbrauch.....sagt Nvidia.

mfg
 

Conqi

Lt. Commander
Dabei seit
Dez. 2011
Beiträge
1.739
Mich persönlich stört auch die Angabe von TOPS ein wenig. FLOPS sind wenigstens Leistungsrelevant, aber reine OPS?
Bei KI/Machine Learning und Co. kommen oft ja gar keine Gleitkommazahlen zum Einsatz. Nicht umsonst wird in dem Bereich mit Unterstützung von Int8-, Int4- und teils sogar Int2-Werten direkt in der Hardware geworben. TOPS sind da der deutlich häufiger anzutreffende Vergleichswert gegenüber TFLOPS.

was bedeutet das T in TOPS? Um Damenoberbekleidung handelt es sich dabei ja wohl nicht, oder?
Wie meistens im PC-Bereich Tera. Es sind also x Milliarden Operationen pro Sekunde. Im Endeffekt das nur ohne den Gleitkomma-Teil.
 

Rickmer

Fleet Admiral
Dabei seit
Sep. 2009
Beiträge
12.222

engineer123

Lt. Commander
Dabei seit
Jan. 2009
Beiträge
1.627
Chips für Automotive sind schon mal ein interessanter anderer Markt...

Die Rechenpower ist weit über dem was eigentlich in den nächsten 10 Jahren gesetzlich erlaubt ist und von Versicherungen abgedeckt ist.
Stichwort Level 5 = 2040 oder später :jumpin: :schaf:

Ich höre immer nur von den Chip-Produzenten, die absetzen wollen. Von Politik, Verbänden und Versicherungen kommt nichts, hulla Hoop.
 

derSafran

Ensign
Dabei seit
Dez. 2017
Beiträge
214
Die Rechenpower ist weit über dem was eigentlich in den nächsten 10 Jahren gesetzlich erlaubt ist und von Versicherungen abgedeckt ist
Die Rechenleistung ist aber auch nur bedingt ein Problem. Ich erinnere mich daran mal eine Doku gesehen zu haben über einen deutschen Professor, dessen Mercedes schon vor 25 Jahren autonom im normalen Verkehr mitfahren konnte. Klar wird das nicht mit Level 5 vergleichbar sein, aber es zeigt seinerzeit, dass die Software weitaus relevanter ist.
 

calluna

Lt. Commander
Dabei seit
Okt. 2010
Beiträge
1.660
Dazu der Performancevergleich mit den Intel ... Kastraten?
Dir sind die Jahreszahlen in dem Vergleich aufgefallen?

Davon abgesehen geht es hier doch offensichtlich um Prozessoren für ein ganz spezielles Problem, bei dem geringe Rechengenauigkeit ausreichend ist. Und die Angabe in TOPS ist in diesem Fall üblich.

Jede CPU und auch GPU ist für diese Art von Berechnungen Verschwendung.
 

estros

Admiral
Dabei seit
Sep. 2009
Beiträge
8.474
Toller Artikel CB, danke!
Die Rechenpower ist weit über dem was eigentlich in den nächsten 10 Jahren gesetzlich erlaubt ist und von Versicherungen abgedeckt ist.
Politiker denken nicht so weit voraus, ist kein Vorwurf, sondern gesunde Realität.
Unternehmen müssen jedoch voraus planen, besonders CV erfordert unfassbar viel DL. Vor allem Level 5. Die nächsten Jahre werden spanned, aber mMn auch ungewiss, wie schnell die Entwicklung abseits der Recheneinheit voranschreitet.
 

Hayda Ministral

Captain
Dabei seit
Nov. 2017
Beiträge
3.976
@derSafran : Falls wir die gleiche "Doku" meinen - der Mercedes konnte Abstand halten und lenken. Was damals schon ganz gut war und zu der Ansicht verleiten konnte dass man "das mit dem autonomen Fahren" wohl bald allgemein verwenden könne. Hat dann doch etwas länger gedauert, siehe DARPA Grand Challenge.
 

Odysseus277

Lt. Commander
Dabei seit
Dez. 2010
Beiträge
1.467
Ähm, bin ich blind, oder steht da tatsächlich nirgends, wie viel Watt der Orin denn nun real benötigt? o_O

Die Pegasus-Combo verbraucht mit seinen 500W übrigens nicht 3x, sondern 7x so viel wie der Tesla-FSD. Das war ja auch der Grund warum Elon ein eigenes Design forciert hatte: Es war klar, dass die etablierten HW-Hersteller (namentlich Nvidia) zu spät auf die Anforderung nach drastisch reduziertem Stromverbrauch, der bei einem E-Auto angesagt ist, Rücksicht nehmen würden.

Unterm Strich kann man beide Lösungen natürlich in Sachen Specs vergleichen, aber da Tesla einen ganz anderen Weg geht, als die anderen Marktteilnehmer im Rennen zur Voll-Autonomie, nützt ein reiner Vergleich nur der Zahlen eh nicht so viel.
 

rockfake

Ensign
Dabei seit
Aug. 2013
Beiträge
181
"Orinieren" wir mal zusammen. Autonomen Autos wird kräftig an Rechenleistung spendiert Level 4 in 2 Jahren! Skynet in 10. Hr hr hr..
 

Ned Flanders

Admiral
Dabei seit
Aug. 2004
Beiträge
7.682
Ist zwar etwas erbsenzählerisch, aber:

Orin versammelt 17 Milliarden Transistoren auf bislang unbekannter Fläche bei ebenso unbekanntem Fertigungsprozess. Das ist gut das Doppelte der 9 Milliarden Transistoren des Xavier-SoCs, den Orin ablösen soll.

Nicht ganz....
 

NoD.sunrise

Fleet Admiral
Dabei seit
Apr. 2006
Beiträge
16.371

Bigeagle

Ensign
Dabei seit
Nov. 2008
Beiträge
192
Bei KI/Machine Learning und Co. kommen oft ja gar keine Gleitkommazahlen zum Einsatz. Nicht umsonst wird in dem Bereich mit Unterstützung von Int8-, Int4- und teils sogar Int2-Werten direkt in der Hardware geworben. TOPS sind da der deutlich häufiger anzutreffende Vergleichswert gegenüber TFLOPS.
Mir ist nur nicht klar was alles in den OPS eingeschlossen ist, ganz zu schweigen von den Möglichkeiten der Hardware für SIMD.
Sind 10 OPS nun entweder
10 Additionen/Multiplikationen inklusive speicherzugriff unabhängig vom Datentyp?
10 64 Bit Integer Add/Mul, 20 32 Bit, 40 16 Bit etc?
10 Operationen aus dem Pool Add, Mul, Load, Store und ähnliches? Also eventuell nur 2 vollständige 64 Bit Integer Additionen

Eventuell werden manche OPS wie Division, Modulo oder sogar Multiplikation auch in mehreren atomaren OPS aufgeteilt.
Die reine OPS Angabe ist für mich eher eine typische Klischee-Microsoftsupportaussage - wahr, korrekt, aber nicht hilfreich
Ja, formal lässt sich damit die Leistungsfähigkeit von Hardware vergleichen, aber ohne weitere Informationen praktisch nur für die gleiche Architektur unter verwendung des gleichen Compilers. Da aber bei diesen Chips offenbar jeder sein eigenes Design hat ...
Dazu gilt wie immer: theoretische Leistung < Benchmarkleistung < Leistung bei der praktischen Nutzung
Ich kann zwar bei x86 CPUs einfach annehmen dass die entsprechung zu oben etwa 1; 0,6-0,99; 0,1-0,99 ist, aber bei solchen Chips habe ich keine Ahnung und hätte gerne irgendeinen Vergleichswert um das in Relation zu setzen. FLOPS, Integer OPS, LINPACK, Zeit für Pi auf 100 Mio stellen, FPS von Doom 1 mit Software Renderer ... sowas in der Richtung.
Dir sind die Jahreszahlen in dem Vergleich aufgefallen?
Ja. Und? Was sollen die mir noch sagen, außer der Zeit für den jeweiligen Messpunkt?
 

Ned Flanders

Admiral
Dabei seit
Aug. 2004
Beiträge
7.682
Top