Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsSpitze in Benchmarks: Anthropics Claude Opus 4.5 schlägt Gemini 3 und GPT-5.1
Mit Claude Opus 4.5 hat Anthropic ein neues Spitzenmodell vorgestellt, das sich vor allem beim Coding, den Agenten-Fähigkeiten und der Computer-Nutzung von der Konkurrenz absetzen soll. Laut den internen Benchmarks positioniert es sich sowohl vor Gemini 3 Pro von Google als auch OpenAIs GPT-5.1.
Mir sagen diese Prozente ehrlich gesagt gar nichts. Was entspricht denn 1% in dieser Skala? Was wäre entsprechend 0% bzw. was muss passieren, um 100% zu erreichen?
naja sobald OpenAI 5.5 rausbringt oder 6.0 sind die halt wieder für ein paar Wochen ganz vorne - das wechselt sich an der Spitze doch dauernd ab, je nachdem wer halt ein gerade neu trainiertes Modell hat.
Wichtig ist doch nur dass man nicht komplett abgeschlagen irgendwo auf den hintersten Plätzen rumdümpelt und der Abstand immer grösser wird.
Für meinen Usecase ist Claude echt schon fantastisch, selbst Sonnet! Für Opus bin ich aber zu geizig. Da kann man <hier Währung einfügen> echt beim schmelzen zusehen.
Aber vielleicht wird Sonnet ja aufgebohrt, "demnächst"?
Für wie viele Anfragen reicht das im normalen 20EUR Abo?
Ist ja das hauptproblem, gibt man einmal mehr Input ist das Limit ja sofort aufgebraucht, selbst im 100EUR Abo rennt man schnell in Limits. Kann man zwar auf API umsteigen aber da brennt man aus wie man ja an den Preisen pro Mio Token sieht. Und trotzdem machen die KI Firmen Mrd Verluste im Quartal, da müsste man ja mindestens 10x mehr verlangen.
Bin ja echt gespannt wo das hinführt und wie lange das noch so weitergeht.
Oder die KIs werden 10x effizienter. Optimierte Hardware, optimierte Software und schon ist der Drops gelutscht.
Zum Thema: Claude mit abstand der beste Coding-Freund! Also wenn es mal etwas professioneller wird als, erstelle mir das Spiel Tic-Tac-Toe oder bau mir eine Website, egal wie das Ding ausschaut,, egal ob man es gescheit nutzen kann.... Hab die Tage auch Antigravity mit Gemini 5 Pro getestet aber die Ergebnisse waren etwas ernüchternd. Das gleiche mit Claude, viel praktikabler.
Naja Google/Alphabet hat ja ~ 1000x fache Rechenleistung in 4-5 Jahren für ihren AI Bereich geplant - das wird man kaum durch Hard und Softwareoptimierung alles auffangen
Google geht von einer exponentiellen Steiugerung der Rechneleistung aus - bei Optimierung hat man eher eine exponentielle Entwicklung in die andere Richtung - also grosse weil einfache Optimierugnen zuerst danach wird es immer schwerer.
Ist wie Glücksspiel, hab ich das Gefühl. Die Token können schmelzen wie Eis in der Sonne, und manchmal kann man gefühlt "ewig" rumhantieren.
....kann HIER die EU nicht mal eingreifen? Ich will transparente Nutzung in den Tools sehen "Ihr Token kostet x.xx€ möchten Sie fortfahren? (yes/no/always)
Denke auch, aber irgendwie schaffen sie bei komplexeren Projekten nie zu Ende. Heute auch wieder, so 80-90% gehen quasi immer via AI aber das finalisieren failen sie immer hart, auch sonnet 4.5
Geht über Github Copilot, da ist auch Opus 4.5 verfügbar. Da zahlt man pauschal pro "Chatanfrage", egal wie viel er dadurch ackert. Nachteil ist, dass meist das Kontextfenster deutlich kastriert ist.
Bisschen selektive Bench Auswahl, beim vending vergleicht man dann z.b. nur mit Sonnet obwohl die Gemini 3 Werte da bekannt (aber halt besser) sind.
Letztlich aktuell alles nicht so relevant für mich, Claude, ChatGPT und Gemini sind alle ziemlich stark - entscheidend ist dann eher was man für die API Nutzung hinlegen muss.