News Claude Opus 4.8: Mehr Leistung und Kon­trolle sowie geplante Mythos-Mo­delle für alle

mischaef

Kassettenkind
Teammitglied
Registriert
Aug. 2012
Beiträge
7.534
  • Gefällt mir
Reaktionen: User404 und 12nebur27
erstmal die 100 Videovorschläge auf Youtube zur verbesserten Performance von Claude Opus 4.8 wegclicken und eine Woche auf die 100 Videovorschläge zu enttäuschten Claude Opus 4.8 "long term reviews" abwarten. Der Effort Slider ist halt noch eine Variable die zusätzlich beachtet werden muss.
 
  • Gefällt mir
Reaktionen: Zoba, immutef, the_IT_Guy und 3 andere
Gut getrennt.
1780046600332.png
 
  • Gefällt mir
Reaktionen: Zoba, the_IT_Guy und R O G E R

Höhere Leistung, gleiche Preise​

Für den neuen Fast Mode verlangt Anthropic dagegen einen Aufpreis von 10 US-Dollar pro Million Input-Tokens und 50 US-Dollar pro Million Output-Tokens.

ich sehe hier eine sehr negative Entwicklung. Auf dem Papier bleibt der Preis gleich, gleichzeitig SINKT die Verarbeitungsgeschwindigkeit. Außer man zahlt halt mal eben das Doppelte.
 
  • Gefällt mir
Reaktionen: slow_snail, devanet, the_IT_Guy und eine weitere Person
@Redirion
Das ist in der News doch erwähnt: Die Geschwindigkeit hat sich bei gleichen Preis erhöht, der Fast Mode ist lediglich ein zusätzlicher Boost...
 
ich hab ja auch die News zitiert. "Höhere Leistung" bezieht sich aber eben meines Verständnisses nach nicht auf schnellere Verarbeitungsgeschwindigkeit, sondern eben die inhärent bessere KI-Leistung(in Form von Zuverlässigkeit, Genauigkeit usw.) des Modells.
 
Zuletzt bearbeitet:
Ich frage mich, wie die LLM Unternehmen ihre Modelle bewerten und wie sie zum Schluss kommen, dass es eine Verbesserung gibt? Sie scheinen zumindest nicht produktiv damit zu arbeiten.

Was ich bei Opus 4.8 (CLI) sehe ist:
  • Eine Antwort dauert 3-4x länger als bei Opus 4.7
  • Man muss detailliertere und konkretere Anweisungen stellen. Was sehr mühselig ist
  • Man muss explizit immer wieder erwähnen, dass man chatten will. Sonst will die LLM sofort loslegen und coden
  • Es wird auch in andere Ordner reingeschaut ohne zu fragen!
  • Tokenverbrauch ist geringer geworden
Naja, ansonsten der übliche Blödsinn bei der Einführung einer neuen Modell-Version.
 
  • Gefällt mir
Reaktionen: Redirion, the_IT_Guy und mightyplow
deine Token Kosten 100% (oder wahrscheinlich mehr) auf den Kunden umlegen ist auf jeden Fall nachhaltiger für ein Unternehmen. Ergibt nicht so ein Finanzproblem wie bei Chatty.
 
Redirion schrieb:
ich sehe hier eine sehr negative Entwicklung. Auf dem Papier bleibt der Preis gleich, gleichzeitig SINKT die Verarbeitungsgeschwindigkeit. Außer man zahlt halt mal eben das Doppelte.
Da hat der Redakteur die eigene Quelle nicht richtig gelesen (und offenbar nicht genug Ahnung): der "fast mode" ist keineswegs neu, den gibt es schon lange. Der ist sogar günstiger geworden, direkt am Anfang der Quelle:

And fast mode for Opus 4.8—where the model can work at 2.5× the speed—is now three times cheaper than it was for previous models.

1780054799416.png


edit: und ja, das bezieht sich ausschließlich auf die Geschwindigkeit. Da läuft dann einfach fettere Hardware oder höhere Priorisierung oder wie auch immer sie das realisieren. Das Ergebnis ist dasselbe.

edit2: Ah, "effort" ist wohl auch unklar, das steht für "thinking". Mehr thinking = dauert länger und teurer (mehr Tokens), aber möglicherweise besser. Da gibt es einfach nur neue / höhere Stufen für mehr "thinking", that´s it.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: jotecklen
Für mich ist das leider absolut unbrauchbar. Ich habe lediglich eine einzige Frage zu Opus 4.8 (Aufwand hoch) gestellt, und direkt nach der Antwort wurde mein Nutzungslimit um 80 % reduziert. Unter diesen Bedingungen kann ich das Tool im Arbeitsalltag nicht nutzen. Das ist extrem enttäuschend.
 
  • Gefällt mir
Reaktionen: FabianX2
Und täglich grüßt das Murmeltier. Es bleibt dabei solange Anthropics nicht massiv mehr Tokens zur Verfügung stellt ohne Wucherpreise zu verlangen geht kein Weg an GPT vorbei.
 
njal schrieb:
  • Man muss explizit immer wieder erwähnen, dass man chatten will. Sonst will die LLM sofort loslegen und coden
Solche Wünsche gehören in die Claude.md. Abgesehen davon sollte man ohnehin standardmäßig entsprechende Skills (Brainstorming, Spezifizierungsplan, Implementierungsplan) aktivieren. Dann läuft jedes neue Projekt und auch jeder kleine Patch sauber interaktiv und der Reihe nach durch.
 
Zuletzt bearbeitet:
Zwischen Chatgpt und Claude liegen halt Welten. Deswegen sieht nicht chatgpt in nächster Zukunft nicht mehr so schnell.
 
Sobald das bezahlbar mit genug Tokens ist bin ich dabei. Jetzt leider wieder zurück zu GPT.
 
Ich habe kurz gerade am Nachmittag Claude ausprobiert und auch für einen Monat die Pro Version gekauft.

Aufgabenstsellung: ein python Kosten-Optimierungsskript für Home Assistant (dynamischer Strompreis, PV, Batterie Steuerung); also wann wird grid-balance betrieben, wann soll die batterie eher zurückgehalten werden für teure Stunden, das alles mit Verbrauchsdaten aus der Vergangenheit und aktuellen Prognosedaten für die PV Produktion, etc.

Mit der Gratis Version bin ich nicht weit gekommen:
  • sehr wenige Anfragen möglich
  • die Antworten waren unbefriedigend, nicht wirklich funktionabel

Mit Opus 4.8:
  • auf Anhieb ein funktionierendes Skript
  • die Funktionalität auf Basis der Daten in den ersten Stunden hervorragend

Ich selbst kann zwar skripten, aber ich überlege mir lieber detailliert die Aufgabenstellung und übergebe es OPUS und habe innerhalb von 15min eine super Lösung. Das war die ca 20€ für den Monat definitiv wert.
 
Zurück
Oben