News Spitze in Benchmarks: Anthropics Claude Opus 4.5 schlägt Gemini 3 und GPT-5.1

@sedot Genau. Ich meine eine Alternative zu Claude Code und ChatGPT Codex, sodass man der KI Zugriff auf alle Dateien im Projekt geben kann. Ich habe aber eben recherchiert und es scheint nicht möglich zu sein.
 
Also diese KI-News...da überholt doch wöchentlich einer den anderen. War vor einem halben Jahr nicht DeepSeek the biggest shit? Ist das jetzt wieder tot oder warum hört man nichts mehr? Diese Sensationsberichtserstattung nutzt sich bei mir ehrlich gesagt ziemlich ab.
 
  • Gefällt mir
Reaktionen: tollertyp
User38 schrieb:
@konkretor Danke für den Tipp! Sind die Credits dann pro LLM oder auf alle bezogen? Also kann ich z.B. wenn ich die Credits für ChatGPT aufgebraucht habe dann zu Gemini wechseln und habe dort dann wieder Credits? Und wie sind deine Erfahrungen bei "normaler" Benutzung wie lange die Credits halten?
Das ist egal welches LLM genutzt wird. Ich komme gut hin, bei täglicher Nutzung, reichen mir die Credits gut für einen Monat.
 
  • Gefällt mir
Reaktionen: User38
Yosup schrieb:
Was macht eigentlich mistral.ai so?
Ich nehme an, die trainieren gerade neue Modelle. Das wird ja immer größer aufgezogen und dauert daher immer länger.
Zuletzt haben sie an Le Chat rumgebastelt und 1,7 Mrd. € Finanzierung eingesammelt. ASML (ja, die mit den Belichtungsmaschinen) ist bei denen eingestiegen. Ich sager daher mal, dass es denen im Moment gut geht.
 
  • Gefällt mir
Reaktionen: Yosup
Ruff_Ryders88 schrieb:
Also diese KI-News...da überholt doch wöchentlich einer den anderen. War vor einem halben Jahr nicht DeepSeek the biggest shit? Ist das jetzt wieder tot oder warum hört man nichts mehr? Diese Sensationsberichtserstattung nutzt sich bei mir ehrlich gesagt ziemlich ab.
Ist halt bei neuen Gebieten so, kann verstehen, dass es als nicht-Nutzer da nicht so spannend ist Schritt zu halten, aber als Nutzer kann ich dir sagen, dass diese Entwicklungen relevant sind. Ich kann dir auch sagen, dass ich nicht nur eine sondern 3 KIs verwende, weil die unterschiedliche Stärken und Fähigkeiten haben. Claude kann am besten programmieren aber dafür keine Bilder, Perplexity ist eine Suchmaschine, Mistral ist schnell und günstiger, Google hat im Moment u.a. tolle Bilderstellungs-KI, wo Mistral bspw. immer noch hängt und nicht in der Lage ist korrekte deutsche Texte in Bilder zu schreiben... Nur über OpenAI kann ich nichts gutes berichten.
 
  • Gefällt mir
Reaktionen: Wedge.
Zum Vergleichen habe ich meisten Chathub.gg genutzt (die haben alle Modelle), dann ist es Perplexity Pro und ChatGPT Plus geworden!

Außerdem kannst du die gleiche Frage auf verschiedene Modelle setzen können und so den Output vergleichen.
 
@interesTED du irrst, ich nutze täglich KI und das auch recht intensiv. Trotzdem sind die Entwicklungen zum Teil ermüdend, da man sich kaum auf ein Tool fokussieren kann, ohne das Gefühl zu haben, ein Modell zu nutzen, dass schon wieder outdated ist.
 
Das sieht https://artificialanalysis.ai/ aber anders. Intelligenz ist nicht alles, Preis und Geschwindigkeit sind auch wichtig. Für mich bleibt aktuell Gemini 3 Pro das beste Modell auch wenn ich bisher Claude-Anhänger war.

Ruff_Ryders88 schrieb:
du irrst, ich nutze täglich KI und das auch recht intensiv. Trotzdem sind die Entwicklungen zum Teil ermüdend, da man sich kaum auf ein Tool fokussieren kann, ohne das Gefühl zu haben, ein Modell zu nutzen, dass schon wieder outdated ist.
OpenRouter nutzen und einfach Modell auswechseln – das ist doch die Fokussierung auf Tool und nicht Modell? Da ist nichts ermüdend? Einmal in der woche bei OpenRouter die Rankings abchecken und in der Software einen Haken setzen und fertig.
Die Festlegung auf eine Chattool/Agentensoftware vom LLM-Hersteller verstehe ich überhaupt nicht. Nutze eine Software oder Plattform, die dir die Wahl lässt, alles andere befeuert nur den Vendor-LockIn. Und nein, Microsoft/Azure bietet nicht alle Modelle zur freien Auswahl sondern tut nur so als ob.
 
  • Gefällt mir
Reaktionen: User38 und Ruff_Ryders88
ja das habe ich oben gelesen und werde es mir anschauen.
 
  • Gefällt mir
Reaktionen: HrLX
fr0ntb0t schrieb:
OpenRouter nutzen und einfach Modell auswechseln – das ist doch die Fokussierung auf Tool und nicht Modell? Da ist nichts ermüdend? Einmal in der woche bei OpenRouter die Rankings abchecken und in der Software einen Haken setzen und fertig.
Musste man bei OpenRouter früher nicht immer die API's selbst hinzufügen? Ist das jetzt neu das man direkt alle Models benutzen kann? Cool! :cool_alt:
 
@User38 Ich meine, man muss nur noch darauf achten, dass das Tool/Software OpenRouter nutzen kann, dann wählt man im nächsten Schritt meistens einfach über ein Dropdown das entsprechende Modell aus. Die API-Keys gelten dann nur noch pro Software/Tool/Device.
 
  • Gefällt mir
Reaktionen: User38
calluna schrieb:
Wäre interessant zu Wissen, was deine Fachdomäne ist?
Und wie groß ist die Codebasis?
Java, Spring (Boot), Postgres, REST, etc. Also typischer Industrie-Standard fürs Backend.

Code Basis kommt drauf an wie man es sieht, bei Microservices ist das natürlich immer relativ.
 
  • Gefällt mir
Reaktionen: calluna
Zurück
Oben