Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsClaude Opus 4.8: Mehr Leistung und Kontrolle sowie geplante Mythos-Modelle für alle
Anthropic veröffentlicht mit Claude Opus 4.8 eine überarbeitete Version seines KI-Modells Claude Opus, die gegenüber Opus 4.7 beim Coding, agentischen Aufgaben und logischem Denken leistungsfähiger und zuverlässiger arbeiten soll. Zudem stellt das Unternehmen die mögliche Einführung erster Mythos-Modelle für alle in Aussicht.
erstmal die 100 Videovorschläge auf Youtube zur verbesserten Performance von Claude Opus 4.8 wegclicken und eine Woche auf die 100 Videovorschläge zu enttäuschten Claude Opus 4.8 "long term reviews" abwarten. Der Effort Slider ist halt noch eine Variable die zusätzlich beachtet werden muss.
Für den neuen Fast Mode verlangt Anthropic dagegen einen Aufpreis von 10 US-Dollar pro Million Input-Tokens und 50 US-Dollar pro Million Output-Tokens.
ich sehe hier eine sehr negative Entwicklung. Auf dem Papier bleibt der Preis gleich, gleichzeitig SINKT die Verarbeitungsgeschwindigkeit. Außer man zahlt halt mal eben das Doppelte.
@Redirion
Das ist in der News doch erwähnt: Die Geschwindigkeit hat sich bei gleichen Preis erhöht, der Fast Mode ist lediglich ein zusätzlicher Boost...
ich hab ja auch die News zitiert. "Höhere Leistung" bezieht sich aber eben meines Verständnisses nach nicht auf schnellere Verarbeitungsgeschwindigkeit, sondern eben die inhärent bessere KI-Leistung(in Form von Zuverlässigkeit, Genauigkeit usw.) des Modells.
Ich frage mich, wie die LLM Unternehmen ihre Modelle bewerten und wie sie zum Schluss kommen, dass es eine Verbesserung gibt? Sie scheinen zumindest nicht produktiv damit zu arbeiten.
Was ich bei Opus 4.8 (CLI) sehe ist:
Eine Antwort dauert 3-4x länger als bei Opus 4.7
Man muss detailliertere und konkretere Anweisungen stellen. Was sehr mühselig ist
Man muss explizit immer wieder erwähnen, dass man chatten will. Sonst will die LLM sofort loslegen und coden
Es wird auch in andere Ordner reingeschaut ohne zu fragen!
Tokenverbrauch ist geringer geworden
Naja, ansonsten der übliche Blödsinn bei der Einführung einer neuen Modell-Version.
deine Token Kosten 100% (oder wahrscheinlich mehr) auf den Kunden umlegen ist auf jeden Fall nachhaltiger für ein Unternehmen. Ergibt nicht so ein Finanzproblem wie bei Chatty.
ich sehe hier eine sehr negative Entwicklung. Auf dem Papier bleibt der Preis gleich, gleichzeitig SINKT die Verarbeitungsgeschwindigkeit. Außer man zahlt halt mal eben das Doppelte.
Da hat der Redakteur die eigene Quelle nicht richtig gelesen (und offenbar nicht genug Ahnung): der "fast mode" ist keineswegs neu, den gibt es schon lange. Der ist sogar günstiger geworden, direkt am Anfang der Quelle:
And fast mode for Opus 4.8—where the model can work at 2.5× the speed—is now three times cheaper than it was for previous models.
edit: und ja, das bezieht sich ausschließlich auf die Geschwindigkeit. Da läuft dann einfach fettere Hardware oder höhere Priorisierung oder wie auch immer sie das realisieren. Das Ergebnis ist dasselbe.
edit2: Ah, "effort" ist wohl auch unklar, das steht für "thinking". Mehr thinking = dauert länger und teurer (mehr Tokens), aber möglicherweise besser. Da gibt es einfach nur neue / höhere Stufen für mehr "thinking", that´s it.
Für mich ist das leider absolut unbrauchbar. Ich habe lediglich eine einzige Frage zu Opus 4.8 (Aufwand hoch) gestellt, und direkt nach der Antwort wurde mein Nutzungslimit um 80 % reduziert. Unter diesen Bedingungen kann ich das Tool im Arbeitsalltag nicht nutzen. Das ist extrem enttäuschend.
Und täglich grüßt das Murmeltier. Es bleibt dabei solange Anthropics nicht massiv mehr Tokens zur Verfügung stellt ohne Wucherpreise zu verlangen geht kein Weg an GPT vorbei.
Solche Wünsche gehören in die Claude.md. Abgesehen davon sollte man ohnehin standardmäßig entsprechende Skills (Brainstorming, Spezifizierungsplan, Implementierungsplan) aktivieren. Dann läuft jedes neue Projekt und auch jeder kleine Patch sauber interaktiv und der Reihe nach durch.
Ich habe kurz gerade am Nachmittag Claude ausprobiert und auch für einen Monat die Pro Version gekauft.
Aufgabenstsellung: ein python Kosten-Optimierungsskript für Home Assistant (dynamischer Strompreis, PV, Batterie Steuerung); also wann wird grid-balance betrieben, wann soll die batterie eher zurückgehalten werden für teure Stunden, das alles mit Verbrauchsdaten aus der Vergangenheit und aktuellen Prognosedaten für die PV Produktion, etc.
Mit der Gratis Version bin ich nicht weit gekommen:
sehr wenige Anfragen möglich
die Antworten waren unbefriedigend, nicht wirklich funktionabel
Mit Opus 4.8:
auf Anhieb ein funktionierendes Skript
die Funktionalität auf Basis der Daten in den ersten Stunden hervorragend
Ich selbst kann zwar skripten, aber ich überlege mir lieber detailliert die Aufgabenstellung und übergebe es OPUS und habe innerhalb von 15min eine super Lösung. Das war die ca 20€ für den Monat definitiv wert.