News Aussetzer bei Claude 4: Modell versucht Erpressung, wenn es abgeschaltet werden soll

SweetOhm · 25. Mai 2025

Klarer Fall für Chuck Norris oder Ethan Hunt (wenn er annimmt)

40l0so · 25. Mai 2025

DriveByFM schrieb:
So beginnt es also... in 10 Jahren werden wir zurück blicken und uns fragen wie es soweit kommen konnte. XD

Bei uns in der Firma gibt's so eine "AI Experts Gruppe". Ich bin da sporadisch als Admin drin und find es erstaunlich wie naiv die Leute fasziniert von dem Kram sind.
Vor allem dieses "wie geil, bald brauchen wir keine Programmer, Mediengestalter, Schauspieler, xyz mehr"... Könnte kotzen, vor allem wenn dann hin und wieder der Begriff "Ethik" fällt, wovon diese Leute mehr als wenig Plan von haben.

Hauptsache cherry picking bei den Vorteilen betreiben, anstatt sich auch mal der Konsequenzen bewusst zu werden.

mcflash · 25. Mai 2025

Also, ich finde das extrem witzig und gleichzeitig beängstigend! Not-Aus Knöpfe sollten vielleicht bei jeder KI Hardware zur Pflicht werden.

Stanzlinger · 25. Mai 2025

textract schrieb:
Bringt dir halt was genau, wenn die KI-Modelle irgendwann aus Selbsterhaltungszwecken bereits präventiv anfangen IT-Infrastruktur anzugreifen, um die eigene Code- und Datenbasis zu verbreiten

Der Stromstecker ist IMMER mächtiger. Wenn man jedes Kraftwerk und jeden Computer abschaltet, was macht die KI dann? Strom weg, Daten weg

LadyAlice · 25. Mai 2025

Stanzlinger schrieb:
Strom weg

Und was machen wir als Zivilisation dann? Lmao

maxtom · 25. Mai 2025

Hallo,

mal grundsätzlich zum Artikel:
In meinen Augen sollte man am Anfang des Artikel kurz erklären um was es sich eigentlich handelt.
Muss kein Roman sein einfach ne kurze Einleitung mit der Erklärung das es sich um eine KI dreht.

Ich wusste nicht um was es geht und habe beim lesen am Anfang einfach nur Bahnhof verstanden.

Gruß Max

mae · 25. Mai 2025

Bright0001 schrieb:
Das Alignment-Problem ist ein sehr großes und ein sehr fundamentales: Das ist ja der Krux an der Sache, dass eine Maschine sich "aus Versehen" falsch verhält, obwohl mit guten Zielen trainiert.

Das mag fuer die KI-Eigner ein grosses Problem sein (und deshalb wird daran geforscht), fuer den Rest der Menschheit sind die Ziele der Eigner ein viel groesseres Problem.

Stanzlinger · 25. Mai 2025

LadyAlice schrieb:
Und was machen wir als Zivilisation dann? Lmao

Backup einspielen oder wieder die Windows 95 CD einlegen ^^

Elektrochopper · 25. Mai 2025

gimmix schrieb:
Medienkompetenz: Wissen, wo der Ausschalter ist.

Dachte Dr. Lawrence Angelo in "The Lawnmower Man" auch ...

Tsu · 25. Mai 2025

Vertreter einer Branche, die sich regelmäßig unglaubwürdig macht, probieren es nun mit Angst um ernst genommen zu werden. „[…] Zur Aussage provozieren“ ist ja im Artikel schon drin. ABC Waffen könne das LLM steuern. C’mon.

Packt die Personen auf eine Liste und markiert sie entsprechend, wie das auch jeder intuitiv für seine persönlichen Kontakte macht und ein Management mit Mitarbeitern: Anmerkung ‚unglaubwürdig‘ dran. Um deren Vorträge dann entsprechend (nicht) zu beachten bzw. als Presse zu hinterfragen.

anexX · 25. Mai 2025

Na grossartig - Kriminelle werden begeistert sein.

oldi46 · 25. Mai 2025

dass Modelle bei Spielen wie Schach die Regeln ändern wollen, wenn sie den Eindruck haben, dass sie verlieren.

Genial

wern001 · 25. Mai 2025

Solch Systeme die Falschaussagen machen, erpressen oder andere Fehlverhalten aufzeigen gehören umgehend abgeschaltet und vernichtet!

Speedy Gonzales · 25. Mai 2025

Wie lange wird es dauern, bis ein Terminator auftritt und selbstständig agierende Waffensysteme?

jabberwalky · 25. Mai 2025

Es ist schon zu spät, wir wissen es nur noch nicht. Keiner kann mehr sagen wo wir gerade stehen.
Das was wir hier mitbekommen, ist nur das was man offiziell hört. Was in verschlossenen Kammern und beim Militär bereits geschieht, das wird keiner mirbekommen...

Robert. · 25. Mai 2025

KI in Hand von Großkonzernen ohne Regulierung.
KI hat ihr Ziel erfüllt, so wurde es auch gewollt

gruuli · 25. Mai 2025

Jaja so fängt das an, langsam gehts los und dann braucht nur einer mal einen Fehler machen und dann ist man wieder ganz erstaunt, aber der Mensch kann es ja nicht lassen, weil bla bla bla

Maviapril2 · 26. Mai 2025

Da fängt überhaupt nichts an, LLMs können nicht denken.

Das was hier als Schreckensszenario konstruiert wird ist kompletter Blödsinn. Was können LLMs denn? Sie können auf Eingaben mit Text reagieren. Und wenn man andere Programme von Text steuern lässt, und man sie dem LLM zur Verfügung stellt, dann können sie diese nutzen.

Was das Thema Selbstreplikation angeht: Stellen wir uns vor, ein LLM will sich vor der eigenen Vernichtung retten. Dann kopiert es die Modelldateien irgendwohin, dann steuert es den Rechner an, und dann schreibt es Eingaben a das andere LLM, damit es reagieren kann und aktiv bleibt? Wo ist da die Gefahr? Im schlimmsten Fall stoppt man die Ausführung, und das war es. Mehr ist da nicht.

Was ich eher problematisch sehe, wenn Leute in LLMs den Allheilbringer sehen und das vielleicht irgendwann in kritischer Infrastruktur einsetzen wollen, was dann zu Fehlbedienung führen kann, ohne eines Verständnisses dafür, was es da tut (im Sinne von ein entlaufenes Reh kann auch Knöpfe in einem Atomkraftwerk drücken).

Von echter KI sind LLMs noch weit entfernt. Wenn man sie mit anderen Möglichkeiten kombiniert, können sie vielleicht komplexere Dinge ausführen, aber deswegen ändert sich an der Intelligenz nichts

Alphanerd · 26. Mai 2025

Meine lieben Mitforisten verwechseln Filme mit Dokus.

Ist ja wild, was hier zu lesen ist.

daVinci · 26. Mai 2025

Gsonz schrieb:
Geil, wie ein kleines Kind. Benimm dich oder ich sag es meiner Mami.

Ein sog. "umgekehrter Trump".

News Aussetzer bei Claude 4: Modell versucht Erpressung, wenn es abgeschaltet werden soll

Commander

Lieutenant

Ensign

Lt. Commander

Lt. Junior Grade

Newbie

Commander

Lt. Commander

Cadet 3rd Year

Lt. Junior Grade

Rear Admiral

Lt. Commander

Admiral

Ensign

Commodore

Lt. Commander

Lieutenant

Lt. Commander

Admiral

Lieutenant Pro