Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsClaude Mythos und Opus 4.7: Was leisten Anthropics neue Spitzenmodelle?
Claude Mythos ist Anthropics Spitzenmodell, das aber nicht für ausgewählte Organisationen bereitgestellt wird, weil es zu stark im Entdecken und Ausnutzen von Sicherheitslücken sein soll. Für die Allgemeinheit gibt es nun aber Claude Opus 4.7.
Naja, wieso sollen die Modelle nicht besser werden und wieso sollen Menschen alle Fehler finden. Wenn ich genug Energie in eine Auomatismus stecke, der alle Wahrscheinlichkeiten abklappern kann, wird der nunmal Fehler finden.
Positiv formuliert ist das schon spannend wo das hinführt, vor allem im globalen Kontext.
Der Beitrag und die darin präsentierten Ergebnisse decken sich nicht mit den vielen vielen Klagen in Onlineforen darüber wie 'dumm' Opus plötzlich geworden ist. Anthropic wird wohl ordentlich Einsparungen fahren und die Zeit der billigen starken Modellen für alle mag bereits vorbei sein. Schön wars.
Keine Ahnung wie der Autor auf diese Ergebnisse kommt. Überall wird berichtet, wie schlecht Opus 4.7 gegenüber 4.6 sei und das es das bisher schlechteste Model sei.
Ja, man hat ja in den 80/90ern schon erkannt das das Problem eigentlich immer vor dem Bildschirm sitzt, von daher klar - wenn da fehlerfreie Routinen implementiert werden wird die KI auch tatsächlich hilfreich sein, einem viel Arbeit abnehmen und viele Projekte massiv beschleunigen - wäre ja nichts schlechtes per se, wenn da nicht dieses Riesenproblem mit der Wegrationalisierung von zahllosen Arbeitsplätzen wäre - das ist halt leider die Schattenseite von KI.
Indirekt schon, indem darauf vollständig verzichtet wird und alles von diesen AI Tools entweder geforked oder ohnehin gleich selbst implementiert wird, das ganze natürlich nicht auf ihre Funktionsweise geschweige denn Schwachstellen getestet.
Woher viele Sicherheitslücken stammen wird nicht mehr diskutiert—ein Großteil davon kommt mittlerweile sicher auch schon von der Verwendung jener Tools. Das quasi perfekte Business Modell wenn man auf der Angebots- und Nachfrage-Seite mitwirken kann. 😎
Keine Ahnung wie der Autor auf diese Ergebnisse kommt. Überall wird berichtet, wie schlecht Opus 4.7 gegenüber 4.6 sei und das es das bisher schlechteste Model sei.
Das ist bei jedem, wirklich jedem neuen Modell egal von welchem Anbieter so. Einfach mal die Redditsuche anschmeißen. "Lobotomized" ist mittlerweile zum absoluten Standardbegriff geworden. Deckt sich zum Beispiel aber überhaupt nicht mit den Tests von Artificial Analysis.
An dieser Stelle steht ein externer Inhalt von YouTube, der den Forumbeitrag ergänzt. Er kann mit einem Klick geladen und auch wieder ausgeblendet werden.
Auf reddit liest man das 4.7 ca. 35% mehr Tokens verbraucht aber nicht viel besser sein soll. Man läuft also noch schneller ins Limit. Nutze derzeit Codex und Gemini für meine 0815-Programmierunterstützung und bin sehr zufrieden. Bei reddit findet man ja gute "Angebote" für die Pro-Varianten bei 4€ im Monat.
Keine Ahnung wie der Autor auf diese Ergebnisse kommt. Überall wird berichtet, wie schlecht Opus 4.7 gegenüber 4.6 sei und das es das bisher schlechteste Model sei.
Das ist der übliche Zyklus bei der Einführung neuer Modelle. In drei Monaten heisst es dann überall "Nimm 4.7, mit 4.6 konnte man ja nicht wirklich arbeiten!"
Auf reddit liest man das 4.7 ca. 35% mehr Tokens verbraucht aber nicht viel besser sein soll. Man läuft also noch schneller ins Limit. Nutze derzeit Codex und Gemini für meine 0815-Programmierunterstützung und bin sehr zufrieden. Bei reddit findet man ja gute "Angebote" für die Pro-Varianten bei 4€ im Monat.
Wenn man sich alle neuen Funktionen aufschwatzen lässt kann das eventuell passieren, aber 35% mehr weiß ich jetzt auch nicht?
Und 4€ für die anderen Pro Subscriptions? Wo gibt es das? Habe prompt eine Seite gefunden, aber die ist in etwa so dubios wie bei anderen "Key-Sellern" im Gaming Bereich. Oder hast du zufällig auch eine seriöse Quelle dafür?
Ansonsten auch Copilot, den gibt's für 10€ mit freier Modellauswahl und anderen Features, die einen sogar noch aktiv beim Programmieren!! unterstützen.
Erstaunlich wie wenig Kommentare und (ich schließe daraus) wie wenig Interesse es hierzu gibt. Aber wenn nVidia die RTX 3060 neu auflegt, dann eskaliert alles
Die Monetarisierung ist mir hier definitiv zu aggressiv. Ich bin kostenpflichtig in ChatGPT und Gemini, aber Claude wollte ich gestern mal testen, der wollte schon nach dem dritten Prompt Geld von mir. So werden die mich kaum anfixen.
Opus 4.6 und 4.7 fressen dir halt die Limits wie sonst was, ich nutze es mittlerweile nur noch wenn es nicht anders geht. Das Opus 4.6 die letzten Monate schlechter geworden ist, ist erst seit ein paar Tagen im Gespräch.
Man muss hier schon sagen ob das nicht Vorwand ist, damit 4.7 besser da steht.
Die sind aber auch nur mit sehr viel Salz zu genießen, da sehen diverse Modelle wesentlich stärker aus, als sie in der Realität bei (Vibe) Coding sind.
Neu bei Opus 4.7 ist, dass es offenbar schon an Tag 1 generft ist. Habe mittlerweile extrem viele Berichte gelesen, wie es gegenüber Opus 4.5 (oder 4.6 vor dem Nerf) massiven Blödsinn halluzinieren soll.
Keine Ahnung wie der Autor auf diese Ergebnisse kommt. Überall wird berichtet, wie schlecht Opus 4.7 gegenüber 4.6 sei und das es das bisher schlechteste Model sei.
Weil es sich nicht um eine Objektive Meinung handelt. Jeder der in diesem Thema informiert ist, wird es beim lesen des Artikels bemerken.
2Stoned schrieb:
Der Beitrag und die darin präsentierten Ergebnisse decken sich nicht mit den vielen vielen Klagen in Onlineforen darüber wie 'dumm' Opus plötzlich geworden ist. Anthropic wird wohl ordentlich Einsparungen fahren und die Zeit der billigen starken Modellen für alle mag bereits vorbei sein. Schön wars.
Die platzen aus allen nähten und können die versprochenen Produkteigenschaften nicht halten. Siehe das Thema vom "adaptive thinking" und anderer Änderungen die mit Verlust der Leistungsfähigkeit des Modells einhergehen. Die user sind gar nicht erfreut.
konkretor schrieb:
Das Opus 4.6 die letzten Monate schlechter geworden ist, ist erst seit ein paar Tagen im Gespräch.
An dieser Stelle steht ein externer Inhalt von YouTube, der den Forumbeitrag ergänzt. Er kann mit einem Klick geladen und auch wieder ausgeblendet werden.