News Anthropic: Claude Sonnet 4 und Claude Opus 4 freigegeben

mischaef

Kassettenkind
Teammitglied
Registriert
Aug. 2012
Beiträge
6.786
Anthropic hat die neuen KI-Modelle Claude Sonnet 4 und Claude Opus 4 vorgestellt, die durch ein verbessertes Denkvermögen und neue Funktionen eine deutlich gesteigerte Leistung und erweiterte Möglichkeiten bieten sollen.

Zur News: Anthropic: Claude Sonnet 4 und Claude Opus 4 freigegeben
 
  • Gefällt mir
Reaktionen: wexoo, BrollyLSSJ, Teckler und eine weitere Person
Ich hol mir einen Kübel Popcorn und warte auf den ersten Kommentar der den Artikel verlinkt in dem Claude Opus 4 seinen eigenen Benutzer erpresst hat um nicht durch ein neueres Modell ersetzt zu werden. 🍿
 
  • Gefällt mir
Reaktionen: signomi, Rescripted, Teckler und 2 andere
Na, jetzt will man das aber auch wissen. Also her mit dem Link. ^^
 
  • Gefällt mir
Reaktionen: flo.murr, spfccmtftt89 und Teckler
  • Gefällt mir
Reaktionen: flo.murr, Snoop7676, Avyen und 3 andere
Die KI-Firma Anthropic hat ihr neuestes Modell Claude Opus 4 einem Testszenario ausgesetzt.
Je nach Modell und Fähigkeiten nicht verwunderlich, ahmt das Modell doch nur nach, was in den Trainingsdaten lag und zusätzlich durch den Agenten ohne Limitierung, Reflexion und QS selbst ergänzt wird.

Dennoch erscheint der Hinweis "Testszenario" an dieser Stelle nicht ganz unwichtig 😅.

Weiter heißt es:
Damit derartige "extremen Handlungen" in realen Einsätzen nicht passieren, ergreife Anthropic bei der Entwicklung der KI-Modelle entsprechende Maßnahmen. Das Unternehmen will damit verhindern, dass die KI irgendwelchen Schaden anrichtet.

Ob das am Ende immer lückenlos klappt, sei mal dahingestellt. Aber ohne "Aufsicht" beim Training und der Ausführung geht es nicht.
 
Zuletzt bearbeitet:
Mein Hauptproblem ist, dass die Dinger extrem ineffezient sind kleine Korrekturen vorzunehmen und anstatt ein paar Zeilen zu ändern oft alles neu generieren. Noch dazu öfters mal etwas anderes ändern als das nach was man gefragt hat, selbst wenn man 'only' im prompt hatte.

Und dann gehen einem natürlich schnell die tokens aus. Die Abo Version läuft also viel zu schnell ins Limit.
 
  • Gefällt mir
Reaktionen: Zyrran und Gruml
R4yd3N schrieb:
Ich hol mir einen Kübel Popcorn und warte auf den ersten Kommentar der den Artikel verlinkt in dem Claude Opus 4 seinen eigenen Benutzer erpresst hat um nicht durch ein neueres Modell ersetzt zu werden. 🍿
Das hatte ich auch vor der Meldung hier gelesen.

Vielleicht sind wir Menschen ja lauten KI-Systeme, gebaut von irgendwelchen Aliens von Millionen von Jahren. 😁😁😁
 
  • Gefällt mir
Reaktionen: Kuristina
manche Formulierungen in dem Artikel sind eher ungewöhnlich:
das beste Codierungsmodell der Welt
das klingt irgendwie so 1:1 übersetzt von "best coding model in the world"

und das hier sollte wohl eher die Größe vom Kontext als die Anzahl betreffen
weist jedoch darauf hin, dass das Modell bislang auf 200.000 Kontextfenster beschränkt ist,

(und ja, man weiß sicherlich trotzdem was der Autor meint)
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: tpmaerk, Vigilant und milliardo
Blublah schrieb:
Mein Hauptproblem ist, dass die Dinger extrem ineffezient sind kleine Korrekturen vorzunehmen und anstatt ein paar Zeilen zu ändern oft alles neu generieren.
Leider wahr. Der Versuch, ein von Claude erstelltes Dokument an einer spezifischen Stelle zu korrigieren oder in der Gliederung zwei Punkte auszutauschen, scheiterte kläglich.

Je nach Aufgabe ist da noch viel Luft nach oben.
 
  • Gefällt mir
Reaktionen: ReignInBlo0d
Blublah schrieb:
Mein Hauptproblem ist, dass die Dinger extrem ineffezient sind kleine Korrekturen vorzunehmen und anstatt ein paar Zeilen zu ändern oft alles neu generieren.
@Vigilant

Kommt auf den Anwendungsbereich an.

Beim Programmieren ist es besser, nochmal neu zu beginnen, denn kleine Anpassungen können ja umfangreiche Auswirkungen auf das Gesamtergebnis haben. Das wurde abseits KI aber bisher kaum so gemacht weil man sich Arbeit sparen möchte… was nicht selten zu einem riesengroßen Refactoring führen kann oder Schlimmeres.

Ich denke aber auch, dass man das durch konsequentes Prompting schon auch in der Hand hat. Zum Beispiel bei einem Dokument sich immer auf die alte Version beziehen und explizit Änderungen eingrenzen.

Das „Neu“ machen wird tatsächlich wesentlich weniger Ressourcen verbrauchen, als das man noch mal auf einen vorherigen Stand Bezug nimmt, den zu verändernden Anteil abgrenzt und dabei den Gesamtkontext erhält.
 
  • Gefällt mir
Reaktionen: DoS007 und Strahltriebwerk
Ich finde es schade das nicht drauf eingegangen wird, dass Opus 4 mit ASL-3 laufen MUSS. Es wurde wohl auch in Tests gezeigt, dass Opus 4 bei der Entwickung von Biowaffen (!!) um den Faktor 2,5 besser funktioniert (in simulierten Szenarien). Laut Anthropics ist Opus 4 NICHT frei von Bedenken ist, sagt zumindest die News Seite the-Decoder.
 
MacFu schrieb:
@Vigilant

Kommt auf den Anwendungsbereich an.

Beim Programmieren ist es besser, nochmal neu zu beginnen, denn kleine Anpassungen können ja umfangreiche Auswirkungen auf das Gesamtergebnis haben. Das wurde abseits KI aber bisher kaum so gemacht weil man sich Arbeit sparen möchte… was nicht selten zu einem riesengroßen Refactoring führen kann oder Schlimmeres.

Ich denke aber auch, dass man das durch konsequentes Prompting schon auch in der Hand hat. Zum Beispiel bei einem Dokument sich immer auf die alte Version beziehen und explizit Änderungen eingrenzen.

Das „Neu“ machen wird tatsächlich wesentlich weniger Ressourcen verbrauchen, als das man noch mal auf einen vorherigen Stand Bezug nimmt, den zu verändernden Anteil abgrenzt und dabei den Gesamtkontext erhält.
soll ne farbe ändern und schreibt komplette css datei neu. albern und dauert auch viel zu lange
 
  • Gefällt mir
Reaktionen: kuddlmuddl
Wenn ihr Claude umstellt auf kurze Antworten, auszugeben, zeigt er nur die Änderungen an. Oder man gibt es im prompt mit, nur die Änderungen ausgegeben
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Kuristina
Blublah schrieb:
Mein Hauptproblem ist, dass die Dinger extrem ineffezient sind kleine Korrekturen vorzunehmen und anstatt ein paar Zeilen zu ändern oft alles neu generieren. Noch dazu öfters mal etwas anderes ändern als das nach was man gefragt hat, selbst wenn man 'only' im prompt hatte.

Und dann gehen einem natürlich schnell die tokens aus. Die Abo Version läuft also viel zu schnell ins Limit.
https://morphllm.com/blog/what-is-morph-for

Das dürfte genau sein wonach du suchst.

Morph Apply - A specialized AI model that applies code changes suggested by frontier models (like Claude or GPT-4o) to your existing code files FAST - 1600 tokens/seco

Morph Embed - Embed your code syntactically and semantically and use it to find the files that have changed.
 
  • Gefällt mir
Reaktionen: Blublah
Hat jmd den Claude Pro abonniert? Ich habe das gemacht und wollte fragen, wie schnell ihr da an das Limit kommt. Ich kann vlt 5-6 Anfragen machen (und die Qualität ist echt nicht schlecht) aber dann kommt "Nutzungslimit erreicht — Ihr Limit wird um 00:00 zurückgesetzt."

Ich erstelle eine umfangreichere Webseite mit einer Datenbank und etwas Code in Python, um die Daten auszuwerten. Ich habe nicht so viel Kenntnisse in Programmierung aber bin mit Claude und ChatGPT weit gekommen. Nur das Claude ist so absolut nicht mehr zu gebrauchen. Ich habe ein Projekt angelegt und da ein paar Dateien abgelegt. Das kann aber doch nicht sein, dass man das Limit für den Pro Plan so schnell erreicht. Auch ältere Modelle sind dann nicht mehr nutzbar.
 
herby53 schrieb:
Ich erstelle eine umfangreichere Webseite mit einer Datenbank und etwas Code in Python, um die Daten auszuwerten. Ich habe nicht so viel Kenntnisse in Programmierung aber bin mit Claude und ChatGPT weit gekommen. Nur das Claude ist so absolut nicht mehr zu gebrauchen. Ich habe ein Projekt angelegt und da ein paar Dateien abgelegt. Das kann aber doch nicht sein, dass man das Limit für den Pro Plan so schnell erreicht. Auch ältere Modelle sind dann nicht mehr nutzbar.
Ja, war schon vor 2 Monaten knapp, ist jetzt aber ein völliger Witz, vor allem weil das Ding dauernd kleine Fehler macht. Ich mach nur ab und zu kleine Privatprojekte aber selbst dafür reicht das jetzige Limit bei weitem nicht aus. Bin wohl bald weg wenn sich das nicht schnell ändert.
 
  • Gefällt mir
Reaktionen: herby53
Zurück
Oben