Bericht Nvidia Ampere: A100 ist für KI eine 20 Mal schnellere GPU

nlr

Redakteur
Teammitglied
Registriert
Sep. 2005
Beiträge
9.979
tl;dr: Nvidia hat erste Details zur neuen GPU-Architektur Ampere verraten. Als Nachfolger von Volta richtet sich Ampere mit GA100 zu Anfang an den Einsatz im Datacenter für das KI-Training und Inferencing. Die erste Ampere-GPU A100 soll in diesem Szenario 20 Mal so schnell sein wie Volta. Das erste Produkt ist das DGX A100.

Zum Bericht: Nvidia Ampere: A100 ist für KI eine 20 Mal schnellere GPU
 
  • Gefällt mir
Reaktionen: Sennox, Mertsch, Ned Flanders und 20 andere
Ich hoffe auf einen baldigen Turing Nachfolger mit HDMI 2.1 Unterstützung für 4K 120Hz Oled Fernsehr mit G-Sync. Dann können diese ganzen lächerlichen Gaming Monitore vergessen werden. Ich gehe davon aus, dass es H2 2020 einen Gaming Ableger von Ampere geben wird.
 
  • Gefällt mir
Reaktionen: B.L. Swagger, Ops, MeisterOek und 17 andere
Der Artikel ist extrem detail- und umfangreich, vielen Dank für diese klasse Arbeit! Aber der Großteil der Community wartet doch fieberhaft auf Infos der Consumer-Variante, oder? :p
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Mertsch, flo.murr, LuzidDream und 49 andere
Mein persönliches Highlight: es geht weg von Intel und hin zu AMDs Server-CPUs :daumen:
 
  • Gefällt mir
Reaktionen: SprudelSaft, BachUhr, napoli83 und 36 andere
Der Chip ist echt ein ziemliches Monster!
 
  • Gefällt mir
Reaktionen: yummycandy, aid0nex, andi_sco und 5 andere
Shoryuken94 schrieb:
Der Chip ist echt ein ziemliches Monster!
Das werden wir beim Nachfolger auch sagen.😂😁👍🏻
 
  • Gefällt mir
Reaktionen: Klopskopp, Highskilled, aid0nex und 5 andere
@nlr
"für FP32 und INT8. Für FP32 wird eine Rechenleistung von in der Spitze 312 TFLOPS angegeben"
Das ist doch wohl FP16 oder?

So groß auf 7nm hätte ich nicht erwartet. Ob CDNA3 das dann aufholt?
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: paulemannsen und nco2k
ich dachte, heute gibt es erste Infos zum Turing Nachfolger. Das dauert dann wohl noch :(
 
  • Gefällt mir
Reaktionen: thommy86
Im Artikel ist ein Fehler! (Wenn ich nicht völlig zu blöd bin)
Die Leistungs-Werte in der Tabelle auf der 1. Seite stimmen nicht. Im Text darunter ist bspw. von einer Rechenleistung von 312 TFLOPS bei FP32 die Rede, in der Tabelle steht aber 19,5. Auch die anderen Werte stimmen nicht, direkt darunter stehen andere.

Es sieht aus, als wären die Werte in der Tabelle alle um eine Zeile nach unten gerutscht.
 
  • Gefällt mir
Reaktionen: Obvision
An den Leaks von KittyKitties zu den Gaming Karten scheint was dran zu sein
https://twitter.com/VideoCardz/status/1260903348158554112

geforce.PNG


Dazu kommt dieses Video von vor 2 Tagen, hört sich zumindest plausibel an.

 
  • Gefällt mir
Reaktionen: Mertsch, marcmurc, Randfee und 5 andere
echt guter Artikel.
am beeindruckensten ist das was man sieht , erst das Bild mit 25 Racks und dann dazu nur noch 1 Rack für die gleiche Leistung :daumen:
 
  • Gefällt mir
Reaktionen: BachUhr, aid0nex, fox40phil und 2 andere
Das ist kein Leak, das ist geklaut von einem anderen Twitterer aus 5/2019, Kopedimi oder so heißt der
 
  • Gefällt mir
Reaktionen: Highskilled, derSafran, aid0nex und 2 andere
Das wird kein HBM dummy stack sein, sondern einfach ein 8GB Stapel der für ECC draufgeht. Schließlich sind dies Produkte für den Server- und nicht den Gamingsektor.
 
  • Gefällt mir
Reaktionen: derSafran, aid0nex, McTheRipper und 2 andere
Na sowas, wie unerwartet ist Ampere kein Gaming Kärtchen und somit immer noch kein Turing Nachfogler in Sicht.

Stunrise schrieb:
Ich gehe davon aus, dass es H2 2020 einen Gaming Ableger von Ampere geben wird.
Mit Sicherheit nicht. Das wird doch immer deutlicher! Nvidia hat den kurzfristigen Fokus ganz klar auf den Volta Nachfolger Ampere gerichtet und dieser ist ohne deutliche Anpassungen nicht als Desktop-Grafikkarte nutzbar. Und selbst wenn, die dort nötige ALUs aka CUDA Leistung steigt bei Ampere kaum an, 24% wie man hier sieht. Man muss also sogar offen, dass die Gaming Ampere sich deutlich unterscheidet von der Datacenter Ampere, sonst wird der Leistungssprung sehr übersichtlich. Auch fehlen wohl RTX Kerne und ich bezweifele, dass Nvidia die bereits wieder aufgibt nach einer Generation.

Für mich wird immer unwahrscheinlicher, dass ein 2080 TI Nachfolger noch dieses Jahr kommt.
 
  • Gefällt mir
Reaktionen: Alphanerd, jjotun, KingL und eine weitere Person
Heißt also, dank NV könnte AMD ein Durchbruch (deutlich größerer Anstieg) im Data-Center gelingen. Lustig die Welt.

usb2_2 schrieb:
So groß auf 7nm hätte ich nicht erwartet. Ob CDNA3 das dann aufholt?
9,7 TFLOP7.8 TFLOPS
FP32-Performance (Peak)19,5 TFLOP
https://www.computerbase.de/2020-05/amd-radeon-vii-pro/
AMD spricht von 13,1 TFOPS FP32-Performance... FP64-Performance bei 6,5 TFLOPS
Mit Vega 20 scheint AMD zu mindestens was FP64 Performance angeht nicht so abgehängt und das ist noch kein CDNA.

Wie aber im Artikel beschrieben, liegen die Stärken ja wo anders!
 
  • Gefällt mir
Reaktionen: tarkin77 und nagus
hauptsächlich Marketing und Funktionserklärung
keine details zur Architektur
Notiert der chip heißt a100 (108sm=6912shader) ist was kleiner als gedacht und kann als mig kombiniert werden.
vieles ist software/firmware optimiert und lassen sich getrennte vm gpu zuordnen.
bzw aufgaben exklusiv berechnen auf nutzer gewählten arbeitsschritten.

Für Software Entwickler sehr interessant in den bereichen AI autonomen fahren und datacenter

Den quadro Nutzer ist das völlig egal somit ist das reine Werbung für HPC
keine 2d 3d modelling oder auch rendern nur zahlen für HPC
Würde mich nicht wundern das damit besser gemint werden kann.(kryptozahlen Berechnung)
 
Die FP16 Perfomance ist einfach nur faszinierend!
Die 3. Generation der Tensor-Cores gibt ihr bestes die gerade aufkommenden AI ASICs obsolet zu machen (auch wenn die Tensor Cores streng genommen genau das sind)

Ich vermute, dass durch die stark gesteigerte Leistung, die Entwicklung von neuen AI Modellen sich deutlich beschleunigt, da sich jetzt auch Universitäten und mittel-große Unternehmen die Rechenleistung leisten können einen Bert selbst zu trainieren
 
  • Gefällt mir
Reaktionen: [wege]mini und JohnVescoya
wüstenigel schrieb:
Mein persönliches Highlight: es geht weg von Intel und hin zu AMDs Server-CPUs :daumen:

Ob es auch so gekommen wäre, wenn Intel PCIe 4.0 geboten hätte? Wahrscheinlich hätte man AMD dann mal wieder den Rücken gekehrt wie es viele Andere weiterhin tun.
 
Kleiner Schnitzer in einem interessanten Artikel:

"dass Datacenter-Betreiber mehr Geld sparen könnten, umso (mehr?) Systeme sie erwerben. "
 
eXe777 schrieb:
Ob es auch so gekommen wäre, wenn Intel PCIe 4.0 geboten hätte? Wahrscheinlich hätte man AMD dann mal wieder den Rücken gekehrt wie es viele Andere weiterhin tun.
Was-wäre-wenn-Fragen sind schwierig. Für mich ist es ein Highlight, weil AMD und Nvidia schon einmal vor ein paar Jahren so ein bisschen miteinander kokettiert haben:
https://twitter.com/NVIDIAGeForce/status/895746289589039104
 
Zurück
Oben