Googles KI-Modelle: Gemini soll es mit GPT-4 und ChatGPT aufnehmen

Andreas Frischholz
36 Kommentare
Googles KI-Modelle: Gemini soll es mit GPT-4 und ChatGPT aufnehmen
Bild: Google Deepmind

Mit Gemini hat Google ein neues Large Language Model (LLM) vorgestellt, das die Nachfolge von PaLM 2 antritt. Das Ziel: Man will OpenAIs GPT-4 übertrumpfen und Punkte im Konkurrenzkampf mit ChatGPT erzielen. Von den neuen KI-Funktionen profitieren neben dem Chatbot Bard auch das Pixel 8 Pro sowie Android.

Wie bei GPT-4 handelt es sich um ein multimodales KI-Modell, es kann also neben Text auch Bilder, Video und Audio bei der Ein- und Ausgabe verarbeiten. In diesem Bereich soll auch einer der großen Fortschritte liegen. Indem das Modell in der Lage ist, Informationen differenzierter zu erfassen, soll es bessere Antworten in komplexen Fächern wie Mathematik und Physik geben können.

Gemini 1.0 erscheint in drei Größen:

  • Gemini Ultra: Das leistungsstärkste und größte Modell für komplexe Aufgaben
  • Gemini Pro: Die mittlere Variante, die für die meisten Aufgaben geeignet ist.
  • Gemini Nano: Das kleinste und effizienteste Modell, das auch auf Geräten der Nutzer laufen soll.

Nano ist laut dem technischen Report zudem noch in zwei Versionen unterteilt: Eine mit 1,8 Milliarden Parametern und eine mit 3,25 Milliarden Parametern. Bei Pro und Ultra macht Google keine Angaben zu der Größe der Modelle.

Den versprochen Leistungssprung untermauert Google mit eigenen Benchmarks. Demnach übertrifft die Ultra-Variante GPT-4 bzw. GPT-4 Vision in den meisten Fällen. Gemini soll zudem nicht nur leistungsfähiger, sondern auch deutlich effizienter als die eigenen Vorgänger sein.

Gemini Pro für Bard

Gemini Ultra ist noch nicht verfügbar. Derzeit laufen noch Vertrauens- und Sicherheitsprüfungen, zudem werde das Modell noch optimiert. Das erfolgt durch Feinabstimmungen und Reinforcement Learning, also einem Prozess, der auf menschlichem Feedback basiert. Zu diesem Zweck werden erste Kunden und Partner bereits einen Zugriff erhalten.

Im kommenden Jahr soll dann mit Bard Advanced eine überarbeitete Variante des ChatGPT-Konkurrenten erscheinen, die von den Ultra-Fähigkeiten profitieren kann. Generell ist dem Start von Ultra also erst 2024 zu rechnen.

Die bisherige Version von Bard erhält aber bereits mit Gemini Pro einen neuen technischen Unterbau, der bereits ab jetzt verfügbar ist. Damit soll der Chatbot Informationen schneller verarbeiten können, Google spricht vom größten Qualitätssprung seit dem Start. Verfügbar ist der neue Bard zunächst in mehr als 170 Ländern und Regionen auf Englisch. Europa zählt noch nicht dazu. Weitere Sprachen und Länder sollen aber bald kommen.

Pixel 8 Pro und Android erhalten neues KI-Modell

Das kleine Nano-Modell soll KI-Funktionen auf Smartphones beschleunigen und Neuerungen ermöglichen. Als erstes wird das auf dem Pixel 8 Pro der Fall sein. Mit Gemini Nano lassen sich auf dem Gerät künftig etwa Aufnahmen in der Rekorder App zusammenfassen. Über die Gboard-Tastatur lassen sich zudem „intelligente“ Antworten formulieren. Diese Funktion wird zunächst für WhatsApp verfügbar sein, weitere Messenger sollen folgen.

Das Pixel 8 Pro (Test) bleibt also die Spielweise für Googles KI-Neuerungen.

In den kommenden Monaten wird Gemini in weitere Dienste integriert. Dazu zählen die Google Suche, Ads, Chrome und Duet AI. Die neue Google-Suche – Search Generative Experience (SGE) –, die um generative KI-Funktionen ergänzt ist und sich noch im experimentellen Status befindet, erhält ebenfalls Gemini-Support für Testläufe.

Gemini-Zugriff für Android-Entwickler

Entwickler und Unternehmenskunden können aber dem 13. Dezember über die Gemini-API in Google AI Studio oder Google Cloud Vertex AI auf Gemini Pro zugreifen. Für Android-Entwickler ist mit AICore eine neue Systemfunktion in einer frühen Vorabversion verfügbar, mit der sich Apps mit Gemini-Nano-Support entwickeln lassen. Bei solchen Anwendungen kann das Modell also direkt auf dem Gerät laufen.

Im Zuge der Gemini-Ankündigung stellte Google auch eine neue Version der „Tensor Processing Unit“ (TPU) vor. Trainiert wurde Gemini mit den Versionen TPU v4 und v5e. TPU v5p ist zudem in der Google-Cloud verfügbar, Google verspricht ein besonderes effizientes Training moderner KI-Modelle.