News Neues Spitzenmodell für ChatGPT: OpenAI verbessert GPT-5.4 bei autonomer Computersteuerung

Andy · Heute um 08:45

OpenAI hat mit GPT-5.4 ein neues Spitzenmodell für ChatGPT vorgestellt. Während das erst zwei Tage zuvor präsentierte GPT-5.3 Instant vor allem die alltäglichen Chatgespräche verbessern soll, bietet GPT-5.4 mehr Leistungsfähigkeit in Bereichen wie Logikaufgaben, Reasoning und Agenten-Funktionen.

Zur News: Neues Spitzenmodell für ChatGPT: OpenAI verbessert GPT-5.4 bei autonomer Computersteuerung

Fighter1993 · Heute um 08:59

Man muss ja im Gespräch bleiben…

Diablokiller999 · Heute um 09:04

Wenn ich ehrlich bin, sehe ich eigentlich keinen Unterschied in den Ergebnissen von GitHub Copilot (GPT-Codex 5.3) auf er Arbeit und meinem lokal laufenden devstral. Auch qwen2.5 und Deepseek-coder-v2-lite bringen fast die gleichen sinnvollen und sinnlosen Vorschläge.

Glaube nicht, dass 5.4 jetzt n großer Wurf wird, die Zeit der linearen Skalierung der Ergebnisse bei LLMs ist seit GPT4 wohl vorbei.

Ultra_Force · Heute um 09:04

„Jetzt noch besser - verbesserte Formel für sichtbar gesündere Zähne.“
„Entfernt bis zu 3× mehr Plaque als eine herkömmliche Zahnpasta.“
„Klinisch getestet – bis zu 100 % mehr Schutz vor Karies.“
„Jetzt mit verbesserter Formel im Vergleich zum Vorgänger.“

....

LamaMitHut · Heute um 09:07

Immer dieses substanzlose Bashing....

Wie lange habt ihr die neue Version denn getestet, um zu euren urteilen zu kommen? 🤡

MAYvonBlei · Heute um 09:27

Kann man eigentlich so einen Agenten auch ein PC-Spiel zocken lassen? Wird wahrscheinlich früher oder später kommen.

shifty29 · Heute um 09:31

Er war stets bemüht... ne danke Sam, Abo ist schon gekündigt...

0range · Heute um 09:43

Ich hab mir gestern einen Lageplan für ein Event mit Hilfe von Ai erstellen lassen. Claude free version hat´s besser hinbekommen als Chatgpt Plus-Membership. Prompt war derselbe.

Was kann chatgpt eigentlich besser als claude?

pseudopseudonym · Heute um 09:44

MAYvonBlei schrieb:
Kann man eigentlich so einen Agenten auch ein PC-Spiel zocken lassen? Wird wahrscheinlich früher oder später kommen.

Bei den jetzigen dürfte die Geschwindigkeit das Problem sein. Aber Tic-Tac-Toe? Klar, mit z. B. den richtigen MCP-Servern.

R O G E R · Heute um 10:00

0range schrieb:
Was kann chatgpt eigentlich besser als claude?

Die waren zuerst am Markt und ChatGPT ist in aller munde.
Finde Claude wesentlich besser. Okay ich nutzte es nur zur Programierunterstützung

Alphanerd · Heute um 10:58

LamaMitHut schrieb:
Immer dieses substanzlose Bashing....

Wie lange habt ihr die neue Version denn getestet, um zu euren urteilen zu kommen? 🤡

Sag uns doch deine Ergebnisse?

LamaMitHut · Heute um 11:02

@Alphanerd ich brauche keine, da ich mir kein Urteil erlaube.

Alphanerd · Heute um 11:04

LamaMitHut schrieb:
Wie lange habt ihr die neue Version denn getestet, um zu euren urteilen zu kommen? 🤡

Dafür erlaubst du dir dann einfach ein Urteil über die Kritiker.

monstar-x · Heute um 11:07

Sam Altman, du kannst deinen Scheiß ChatGPT behalten und weiter auf Kuschelkurs mit dem US Militär gehen.

LamaMitHut · Heute um 11:17

Alphanerd schrieb:
Dafür erlaubst du dir dann einfach ein Urteil über die Kritiker.

Quod gratis asseritur, gratis negatur

Sun_set_1 · Heute um 11:43

Alphanerd schrieb:
Dafür erlaubst du dir dann einfach ein Urteil über die Kritiker.

Ach komm, sein Punkt ist, dass Leute wenige Minuten nach Erscheinen des Modell bereits zu wissen scheinen, wie gut es funktioniert. Was einfach und simpel in der Kürze der Zeit nicht möglich sein kann, da dafür ne Stunde Nutzung wohl kaum ausreicht.

Der Comment, auf den er sich bezog, schrieb übrigens das er einen Vergleich zu seinem "lokalen" Modell sieht.
Die "lokalen" Modelle von openAI können aktuell dann nur GPT OSS 120b oder 20b sein.

Da 120b in der Regel erst ab 80GB VRAM flüssig und ohne Aussetzer läuft, kann er sich eigentlich nur auf 20b beziehen. Hier gibt OpenAI eine vergleichbare Leistungsfähigkeit zu GPT3-mini aus. Qwen 2.5 und deepseek (lokal) gelten als vergleichbar, bis leicht schlechter.

Wenn also jemand nach einer Stunde Nutzung zu dem Ergebnis kommt, dass 5.4 nicht besser sei als 3.1-mini, naja, dann kann man dem entweder Glauben schenken, oder kritisch hinterfragen, in wie weit denn da qualitativ getestet wurde.

SheepShaver · Vor 44 Minuten

MAYvonBlei schrieb:
Kann man eigentlich so einen Agenten auch ein PC-Spiel zocken lassen? Wird wahrscheinlich früher oder später kommen.

LLMs sind da jetzt eher nicht das beste Mittel. Dazu nutzt man eher RL (reinforcement learning) Agents weil sie aus ihren Interaktionen mit der Umgebung lernen und in ihrem Wissen nicht eingefroren sind wie LLMs.
Siehe z.B. die diversen Modelle von DeepMind oder OpenAI Five.

Xood · Vor 28 Minuten

Ich nutze ChatGPT und Copilot bei der Programmierung, seit es auf dem Markt ist. Die Fortschritte sind immer deutlich sichtbar. Mit Agenten (z. B. Codex CLI) wurde noch einmal eine ganz andere Liga erreicht.

Bei jedem Wechsel habe ich zunächst das Gefühl, dass irgendetwas nicht ganz stimmt. Aber nach ein paar Tagen oder Wochen läuft es dann meistens sehr rund.

Wo ich früher maximal die Vervollständigungen nutzen konnte, ist es mittlerweile möglich, wirklich sinnvolle Dinge damit umzusetzen, teilweise quasi halb autonom. Das ist schon bemerkenswert und längst kein Spielzeug mehr.
Lokale Modelle kommen da nicht mit, wobei meine 8 GB Grafikarte auch keine anständigen Modelle ausführen kann. :-)

Produktions-Code lasse ich allerdings noch nicht direkt davon schreiben. Ich nutze es eher für Tooling und ähnliche Dinge. Ideen und Ansätze habe ich unendlich viele, nur fehlt mir die Zeit, alles umzusetzen. Genau hier öffnet sich langsam eine interessante Möglichkeit: der KI zu sagen, was ich gerne hätte, wie es funktionieren soll, und sie dann ein paar Stunden daran arbeiten zu lassen.

Innerhalb eines guten Frameworks und mit klarer Guidance kann das eine solide Basis liefern. Lässt man es jedoch komplett frei laufen und quer durch Open Source alles mögliche einbinden, entsteht schnell Spaghetti-Code, der kaum noch zu bändigen ist.

Piehnat · Vor 19 Minuten

Nee danke. Scam Altman kann sein Zeug ruhig behalten und weiter auf Trump-Kurs kuscheln und dem Militär beim töten von Menschen helfen.

Suche

News Neues Spitzenmodell für ChatGPT: OpenAI verbessert GPT-5.4 bei autonomer Computersteuerung

Andy

Tagträumer

Fighter1993

Admiral Pro

Diablokiller999

Captain

Ultra_Force

Lieutenant

LamaMitHut

Captain

MAYvonBlei

Lt. Junior Grade

shifty29

Lt. Junior Grade

0range

Lt. Junior Grade Pro

pseudopseudonym

Fleet Admiral

R O G E R

Vice Admiral

Alphanerd

Admiral

LamaMitHut

Captain

Alphanerd

Admiral

monstar-x

Lieutenant

LamaMitHut

Captain

Sun_set_1

Commodore

SheepShaver

Commodore

Xood

Lieutenant

Piehnat

Cadet 4th Year