News Autonom Exploits entwickeln: Anthropics neues Modell ist so stark, dass es nicht veröffentlicht wird

0xffffffff schrieb:
Mit anderen Worten: Wir haben ein super krasses Modell, das ist so krass, dass wir das nichtmal veröffentlichen! Trust me bro!

Als würde nen Autohersteller den besten Motor der Welt entwickeln und ankündigen, aber dann nicht veröffentlichen wollen weil er zu Leistungsfähig ist. Sounds legit.
Als würde ein Glühbirnenhersteller eine unendlich haltbare Glühbirne entwickeln, aber dann nicht veröffentlichen..
 
SheepShaver schrieb:
Ein „Coder“ schreibt Code, aber entwirft keine Software-Systeme. „Coder“ sind schon jetzt zunehmend obsolet.

Viele benutzen die Worte Coder, Programmierer, Softwareentwickler … synonym.


ETI1120 schrieb:
Wenn man die klassische Literatur zu Softwareentwicklung anschaut dann geht die davon aus, dass die Performance von den besten Softwareentwicklern um den Faktor 28 über dem der schlechtesten liegt

Quelle? Wie wird das denn gemessen? Eines der großen Probleme von Software, besonders im industriellen Umfeld, ist: dass sie nur ungenügend die Anforderungen erfüllt - darum geht es oft in der Literatur … und um Strategien für den Umgang mit den begrenzten kognitiven Fähigkeiten von Menschen.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Kuristina
0xffffffff schrieb:
Naja, wenn ich ein tolles neues Produkt habe und damit Werbewirksam an die Öffentlichkeit trete, dann aber Einschränke, dass es nur ein Handverlesener Cool-Club nutzen darf weil GeFäHrLiCh... was soll es anderes sein als ein PR-Stunt?
Es wird doch bereits aktiv genutzt und bringt da auch seinen Nutzen? Da es schon seit einer Woche Leaks gab wäre es auch unmöglich es unter Verschluss zu halten - also was wäre deiner Meinung nach die Alternative?
 
Also als jemand der jetzt seid gut einem Jahr intensiv mit KI programmiert und auch andere IT und Büroarbeiten damit ausführt, lasst euch gesagt sein: Ich glaube jedes Wort davon!

Wenn ich den Sprung von Opus 4 auf Opus 4.5/4.6 sehe, dann kann Mythos nur der nächste logische Schritt sein. Das ist der Weg gewesen von "nettes Tool um mal ne Funktion zu schreiben" zu "ich programmiere gar nicht mehr, macht alles die KI" und das waren ein paar Monate.
Aber nicht nur programmieren ist sein Steckenpferd. Ich lasse von Opus Server administrieren und auf Sicherheit prüfen. Das Dingen hat mir komplexe Netzwerkstrukturen aufgezogen, Firewalls konfiguriert und Dinge mit DNS und Provider APIs getan, von denen ich vorher nicht mal wusste. Das es jetzt ein Model geben soll, dass krasse Sicherheitslücken findet und Exploits dafür schreibt, überrascht mich gar nicht.
 
  • Gefällt mir
Reaktionen: Jurial und Sinush
@GrooveXT
Dein Versuch in allen Ehren, aber mindestens 29 Leute

417.jpg


wollen lieber an die Verschwörung den Witz glauben als irgendwelchen ominösen Quellen, interessensgeleiteten Erfahrungsberichten gar oder - Gott bewahre - schlechten Argumenten.

Do mähste nix! 🤷‍♂️
 
  • Gefällt mir
Reaktionen: LamaMitHut
Ergänzung ()

@GrooveXT Kann das Ganze so in etwa bei mir bestätigen. Während vor 2 Jahren das Ganze häufig mehr nette Spielerei war, hat es sich innerhalb des letzten Jahres auch krass in unserer Nutzung geändert.
Die neuen Modelle können (eingepackt in Claude Code oder GitHub Copilot) noch nicht alles und machen manchmal richtigen Quatsch aber für passende Coding/Design Aufgaben sind sie ein mächtiges Tool.

  • Hübsche lauffähige Prototypen lassen sich z.B. heute innerhalb von wenigen Minuten anstatt von Tagen hochziehen.
  • Recherche und Implentierung nach der aktuellen Dokumentation eines SDKs funktioniert gut
  • vergleiche von z.B. verschiedenen Versionen komplexer Excel Schlachten funktionieren auch überraschend gut
  • Code Reviews sehen Dinge, die mir auch bei der doppelten Zeit nicht aufgefallen wären (ehrlicherweise auch neben false positives)
  • der Performance boost bei der Umsetzung privater Projekte ist krass. Während ich vorher 2 Tage gebraucht habe, um eine Erweiterung von einem c++ Projekt zu realisieren, bekomme ich was ähnliches jetzt in einer Stunde hin.

Die Agenten Unterstützung (!) ist nicht perfekt, aber sie wird bleiben und besser werden. Wenn man keine unheimlich esoterischen Dinge handhabt, wird man in der IT um die Nutzung nicht drumherum kommen in der Zukunft.
 
Zuletzt bearbeitet:
Ich Calle PR BlaBla
 
ETI1120 schrieb:
Coden ist überbewertet. Es geht um Softwareentwicklung und das umfasst weit mehr als Coden.

Das Internet quillt über von Statements die besagen, dass die Person noch nie so viel Software geschrieben hat und dabei nicht eine Zeile Code geschrieben hat. Darunter sind viele Leute, die verstehen was Softwareentwicklung ausmacht.


Wenn man die klassische Literatur zu Softwareentwicklung anschaut dann geht die davon aus, dass die Performance von den besten Softwareentwicklern um den Faktor 28 über dem der schlechtesten liegt. Und dieses Verhältnis wird sich durch den Einsatz von AI-Tools noch erheblich vergrößern.
Das ist alles schön und gut. Ja, es gibt einen positiven Aspekt. Augmentation. Leute die keine Software geschrieben haben (oder zu faul waren) können das jetzt. Super.

Das Problem an dem "gute Softwareentwickler steigern ihren Output" Szenario ist: um gut zu sein muss man seine Skills nutzen, das macht einen erst gut. Den produktiven Teil an die Ki auszusourcen auch wenn es schnell ist, auch wenn die Person einen immensen Wissensvorsprung hat kann aber nur ein Resultat erzielen: Verkümmerung des Skillsets das die Ki übernimmt.

Und irgendwann haben wir keine Leute mehr die ohne Ki vernünftige Software schreiben können. Dann sind wir darauf angewiesen. Außerdem gibt es die Theorie das, wenn Ki trainiert, und das zunehmend an synthetischem Code geschieht (also Ki generiertem), dies einen Feedback Loop erzeugt der die Resultate langsam aber ständig qualitativ degradiert da alles abgeschrieben wird also keine echte Innovation mehr stattfindet. Ich bin nicht ganz sicher ob das so stimmt aber es ist ganz klar ein ernstzunehmendes Argument.
 
swage schrieb:
Den produktiven Teil an die Ki auszusourcen auch wenn es schnell ist, auch wenn die Person einen immensen Wissensvorsprung hat kann aber nur ein Resultat erzielen: Verkümmerung des Skillsets das die Ki übernimmt.
Kommt drauf an wie man das nutzt. Einfaches "Vibe Coding", ohne sich den generierten Code anzuschauen, führt sicherlich zu dem was du beschreibst. Den Code mit dem Agent durchgehen und an komplexen Stellen reinzugehen und mit eigenen Skills für Anpassungen sorgen, trainiert genau das was wichtig ist. Aber klar, dazu muss man in die Diskussion mit seiner KI gehen.
 
Es ist sehr verführerisch, gerade bei längerem Code. Die Ki hat schon eine sehr genaue Vorstellung in welche Richtung es geht und alles jedesmalig akribisch zu prüfen ist umständlich.
 
Zurück
Oben