Für das Metaversum: Metas KI-Supercomputer setzt auf 16.000 Nvidia-GPUs

Frank Hüber
86 Kommentare
Für das Metaversum: Metas KI-Supercomputer setzt auf 16.000 Nvidia-GPUs
Bild: Meta

Um das Metaversum zu erschaffen, baut Meta einen neuen KI-Supercomputer, der bei Fertigstellung 16.000 A100-GPUs von Nvidia nutzen soll, um Rechenaufgaben und Modelle zu verarbeiten. Der Supercomputer trägt den Name „AI Research SuperCluster“ (RSC) und soll Metas aktuellen Supercomputer auf V100-Basis um das 20-fache schlagen.

Wenn das RSC Mitte 2022 vollständig ausgebaut sein wird, soll es sich um den weltweit schnellsten KI-Supercomputer handeln. Meta will ihn nutzen, um neue und bessere KI-Modelle zu entwickeln, die aus Billionen von Datenpunkten lernen, mit Hunderten von verschiedenen Sprachen arbeiten und neue Augmented-Reality-Tools entwickeln können – immer mit dem Ziel, Metas Vision vom Metaversum zu entwickeln.

Am Ende sollen 16.000 A100-GPUs zusammenarbeiten

Anfang 2020 habe Meta mit der Planung des neuen System begonnen und sich für den Einsatz von Nvidias DGX-A100-Systemen entschieden. Aktuell besteht das bereits im Betrieb befindliche RSC aus 760 DGX A100 mit 6.080 A100-GPUs, die über Nvidias InfiniBand mit 200 Gbit/s angebunden sind. Diesen stehen 175 Petabyte Flash-Storage sowie 46 Petabyte Cache zur Seite. Bei Fertigstellung soll das System 16.000 A100-GPUs als Endpunkte umfassen, die über InfiniBand verbunden sind, was es zu einem der größten Netzwerke dieser Art macht. Das Speichersystem soll Trainingsdaten von bis zu 16 TB/s bereitstellen können, was im Laufe der Zeit auf bis zu ein Exabyte erweitert werden soll. Metas bisheriges System aus dem Jahr 2017 setzt auf 22.000 Nvidia-V100-GPUs.

Datenschutz soll gewahrt bleiben

Während Meta für die AI-Forschung bislang auf öffentlich zugängliche Daten gesetzt habe, sollen bei RSC künftig auch reale Daten aus Metas Systemen in die Trainingsmodelle einfließen, weshalb ein hoher Datenschutz und hohe Sicherheitsstandards an erster Stelle stünden. Unter anderem bestünde deshalb keine direkte Anbindung des Systems ans Internet. Daten zwischen dem Speichersystem und den GPUs sind Ende-zu-Ende-verschlüsselt und bevor Daten ins System importiert werden können, werde eine Datenschutzkontrolle auf Anonymisierung durchgeführt und Verschlüsselung vorgenommen. Die Schlüssel für alte, ungenutzte Daten sollen zudem regelmäßig gelöscht werden, um eine spätere Entschlüsselung unmöglich zu machen.

Meta AI Research SuperCluster
Meta AI Research SuperCluster (Bild: Meta)

ComputerBase hat Informationen zu diesem Artikel von Meta unter NDA erhalten. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.