Codex Research Preview: OpenAI stellt Programmier-KI-Agenten vor

OpenAI hat mit „Codex“ einen Agenten zur Software-Entwicklung auf Basis von o3 vorgestellt, der vielfältige Aufgaben rund um die Code-Erstellung übernehmen soll. Jede dieser Aufgaben läuft isoliert in einer Cloud-Sandbox, was die Sicherheit erhöhen soll. Ausgewählte Nutzer können den Agenten bereits als Research Preview testen.
Ein kompletter Agent für das Software-Engineering
Codex soll Software-Entwickler dabei bei einer Vielzahl von Tätigkeiten unterstützen, zu denen laut OpenAI unter anderem das Schreiben neuer Funktionen, die Beantwortung von Fragen zum vorhandenen Code, das Beheben von Fehlern sowie das Erstellen von Pull Requests zur Überprüfung zählen können. Darüber hinaus soll der Agent in der Lage sein, mehrere Aufgaben parallel auszuführen, die Bearbeitungszeit kann dabei laut dem Unternehmen in Abhängigkeit von der Komplexität der jeweiligen Anforderung allerdings bis zu 30 Minuten betragen. Neue Aufgaben lassen sich über einfache Textbefehle starten, wobei derzeit „Ask“ für Code-Fragen – etwa zur Fehleridentifikation und -korrektur – sowie „Code“ für die Code-Erstellung zur Verfügung stehen. Die Anweisung wird wie üblich als Prompt eingegeben und anschließend vom Agenten abgearbeitet.
Spezielles o3 als Basis
Grundlage für den neuen Agenten bildet codex-1, eine speziell auf Software-Engineering zugeschnittene Variante von OpenAI o3, die mithilfe von Reinforcement Learning an realen Programmieraufgaben in verschiedenen Umgebungen trainiert wurde. Ziel soll laut dem KI-Spezialisten sein, Code zu generieren, der dem menschlichen Stil sowie gängigen Pull-Request-Präferenzen möglichst nahekommt. Der Agent soll dabei Anweisungen präzise umsetzen und Tests wiederholt durchführen, bis diese erfolgreich abgeschlossen sind.
Der nächste Schritt
Bereits im vergangenen Monat hatte das Unternehmen das Modell GPT-4.1 veröffentlicht, das laut OpenAI nochmals eine deutlich höhere Qualität bei der Code-Erstellung liefern kann. Gleichzeitig seien Fortschritte im Bereich des Reasonings mit OpenAI o3 und o4-mini erzielt worden. Mit Codex innerhalb von ChatGPT sollen Entwickler nun die Möglichkeit erhalten, Programmieraufgaben nicht nur zu delegieren, sondern auch deren Wirkung zu vervielfältigen. Dabei geht OpenAI einen Schritt weiter als bisher: Die KI soll Aufgaben nicht mehr nur unterstützend begleiten, sondern eigenständig übernehmen und lösen können. Um dabei die Sicherheit zu gewährleisten, wird jede Aufgabe in einem isolierten Cloud-Container ausgeführt, der im Vorfeld mit dem entsprechenden Repository geladen wird. Jeder Bearbeitungsschritt wird zudem dokumentiert.
Noch muss Codex trainiert werden
Codex wird aktuell im Rahmen eines Research Previews bereitgestellt, um durch weitere Daten den Agenten gezielt weiterentwickeln zu können. Hierzu wird Codex auch außerhalb des eigenen Hauses getestet, unter anderem in Kooperation mit Unternehmen wie Cisco, Temporal, Superhuman und Kodiak.
Ganz neu ist der Ansatz jedoch nicht: Bereits im Jahr 2021 hatte OpenAI unter dem gleichen Namen ein erstes allgemeines KI-Modell vorgestellt, das auf Basis natürlicher Sprache Code generieren konnte.
Seit heute für bestimmte Nutzer verfügbar
OpenAI hat eigenen Angaben zufolge heute mit der schrittweisen Freigabe von Codex für Nutzer von ChatGPT Pro, Enterprise und Team begonnen. In Kürze soll der Zugang auch auf Abonnenten der Plus- und Edu-Tarife ausgeweitet werden.
Google ebenfalls mit neuem Code-Agenten
Am Mittwoch erst hatte mit Google einer der schärfsten Konkurrenten von OpenAI mit AlphaEvolve einen neuen, auf großen Sprachmodellen basierenden Kodierungsagenten vorgestellt, der selbst komplexe Algorithmen eigenständig erstellen können soll.