Claude Opus 4.8: Mehr Leistung und Kontrolle sowie geplante Mythos-Modelle für alle
Anthropic veröffentlicht mit Claude Opus 4.8 eine überarbeitete Version seines KI-Modells Claude Opus, die gegenüber Opus 4.7 beim Coding, agentischen Aufgaben und logischem Denken leistungsfähiger und zuverlässiger arbeiten soll. Zudem stellt das Unternehmen die mögliche Einführung erster Mythos-Modelle für alle in Aussicht.
Zuverlässiger, präziser und selbstkritischer
Claude Opus 4.8 baut auf Opus 4.7 auf und soll laut Anthropic einen deutlichen Leistungssprung darstellen. Das soll sich nicht nur bei der Programmierung und agentischen Aufgaben zeigen, sondern ebenso beim Reasoning und bei praktischen Wissensaufgaben. In ersten Tests wurde das neue Claude-Modell laut Nutzern als spürbar zuverlässiger und präziser wahrgenommen, darüber hinaus hebt Anthropic insbesondere die gesteigerte Ehrlichkeit hervor. KI-Modelle neigen dem Unternehmen zufolge häufig dazu, Fortschritte oder Ergebnisse mit zu großer Sicherheit darzustellen, obwohl die zugrunde liegende Basis dafür schwach ausfällt. Opus 4.8 soll Unsicherheiten hingegen häufiger offenlegen und deutlich seltener unbelegte Aussagen treffen. Internen Untersuchungen zufolge soll das neue KI-Modell Fehler im selbst geschriebenen Code bis zu viermal seltener unerwähnt lassen.
Gleichzeitig hat der KI-Spezialist nach eigenen Angaben auch seine internen Alignment-Tests erweitert. Diese sollen zeigen, dass Opus 4.8 bei Eigenschaften wie Nutzerunterstützung, Wahrung der Nutzerautonomie und Handeln im Interesse des Nutzers neue Höchstwerte erreicht habe. Ebenso soll der Anteil problematischen Verhaltens wie Täuschung oder Unterstützung von Missbrauch im Vergleich zum Vorgänger deutlich gesunken sein.
Neue Modi für mehr Leistung
Anthropic erklärt zudem, dass Opus 4.8 standardmäßig mit hohem Rechenaufwand arbeitet, was laut Unternehmen die beste Balance aus Qualität und komfortabler Nutzung bieten soll. Bei Programmieraufgaben soll diese Aufwandsstufe ähnlich viele Tokens wie die Standardeinstellung von Opus 4.7 verbrauchen, gleichzeitig jedoch eine höhere Leistung liefern. Für besonders komplexe Aufgaben führt Anthropic die zusätzlichen Modi „extra“ beziehungsweise „xhigh“ sowie „max“ ein. Damit Nutzer durch den gestiegenen Token-Verbrauch nicht zu schnell an ihre Nutzungslimits gelangen, hat das Unternehmen die Grenzen in Claude Code parallel angehoben.
Höhere Leistung, gleiche Preise
Durch die zahlreichen Neuerungen soll Claude Opus 4.8 in nahezu allen Bereichen eine deutliche Weiterentwicklung darstellen und insgesamt mehr Leistung bieten. Das neue KI-Modell ist ab sofort weltweit verfügbar und wird nicht erst schrittweise ausgerollt. Trotz der gesteigerten Leistung bleiben die regulären API-Preise unverändert. Weiterhin fallen 5 US-Dollar pro Million Input-Tokens sowie 25 US-Dollar pro Million Output-Tokens an. Für den neuen Fast Mode verlangt Anthropic dagegen einen Aufpreis von 10 US-Dollar pro Million Input-Tokens und 50 US-Dollar pro Million Output-Tokens. Dieser Modus soll dafür 2,5-mal schneller als bisherige Modelle arbeiten.
Claude plant eigenständig benötigte Abläufe für Aufgaben
Parallel zur neuen Modellgeneration hat Anthropic weitere Funktionen vorgestellt. Dazu zählt unter anderem „Dynamic Workflows“, eine neue Funktion in Claude Code, die sich derzeit als Research Preview im Test befindet. Damit soll Claude umfangreiche Aufgaben mit Hunderten parallel arbeitenden Subagenten bearbeiten können – von der Planung bis zur Zusammenführung der Ergebnisse, wobei die bestehende Test-Suite als Maßstab dient. Das System soll die dafür notwendigen Arbeitsschritte eigenständig planen und die Resultate anschließend selbst überprüfen. Als Beispiel nennt Anthropic groß angelegte Code-Migrationen über Hunderttausende Codezeilen hinweg. Die Funktion steht in Claude Code für Enterprise-, Team- und Max-Abonnements bereit.
Rechenleistung lässt sich ab sofort festlegen
Eine weitere Neuerung stellt „Effort Control“ für claude.ai und Cowork dar. Damit können Anwender künftig festlegen, wie viel Rechenaufwand Claude für eine Antwort investieren soll. Auf diese Weise lässt sich direkt Einfluss auf den Token-Verbrauch und das Erreichen des Nutzungslimits nehmen. Höhere Einstellungen sollen qualitativ bessere Antworten liefern, benötigen allerdings auch mehr Ressourcen und Zeit. Niedrigere Einstellungen sorgen hingegen für schnellere, möglicherweise aber weniger tiefgehende Antworten und schonen gleichzeitig das verfügbare Kontingent. Laut Anthropic steht die neue Steuerung allen Nutzern unabhängig vom Tarif zur Verfügung.
Anweisungen lassen sich in der API ab sofort im laufenden Prozess ändern
Darüber hinaus wurde auch die API erweitert. Die Messages API akzeptiert beispielsweise ab sofort Systemeinträge direkt innerhalb des Nachrichten-Arrays. Entwickler erhalten dadurch die Möglichkeit, Instruktionen während laufender Aufgaben anzupassen, ohne dabei den jeweiligen Prompt-Cache zu verlieren oder zusätzlichen Nutzer-Input integrieren zu müssen. Besonders relevant soll dies für Agentensysteme sein, etwa zur Anpassung von Berechtigungen, Token-Budgets oder Umgebungsinformationen.
Mythos-Modelle könnten in den nächsten Wochen erscheinen
Als Ausblick erklärte Anthropic in der Ankündigung, weiterhin leistungsfähigere und gleichzeitig günstigere Modelle entwickeln zu wollen. Dazu sollen auch die fortlaufenden Arbeiten an „Project Glasswing“ gehören, das mit einer neuen Modellklasse mit nochmals höherer Intelligenz als Opus einhergehen soll. Darüber hinaus testen erste Organisationen bereits „Claude Mythos Preview“ im Bereich der Cybersecurity. Für eine breite Veröffentlichung seien laut Anthropic allerdings noch zusätzliche Sicherheitsmaßnahmen erforderlich. Modelle dieser Klasse könnten dennoch bereits in den kommenden Wochen allgemein verfügbar werden.