News Aussetzer bei Claude 4: Modell versucht Erpressung, wenn es abgeschaltet werden soll

Andy · 24. Mai 2025

Gemeinsam mit der Freigabe von Claude-4-Modellen hat Anthropic auch das Sicherheitslevel erhöht. Risiken sieht man im Zusammenhang mit chemischen, biologischen, radiologischen und nuklearen Waffen. Erstaunlich sind aber auch weitere Aussetzer, die Anthropic in der Model Card beschreibt.

Zur News: Aussetzer bei Claude 4: Modell versucht Erpressung, wenn es abgeschaltet werden soll

Viper816 · 24. Mai 2025

Unter bestimmten Umständen lassen sich „besorgniserregende Extreme“ wie etwa Erpressungsversuche provozieren. Voraussetzung für ernsthaftes Fehlverhalten ist jedoch, dass das Modell in seinem Weiterbetrieb bedroht ist und dazu veranlasst wurde, über die Selbsterhaltung nachzudenken.

Skynet ist coming?!

Stanzlinger · 24. Mai 2025

Nicht die KI (Frösche) fragen, sondern einfach den Tümpel trocken legen. Am Stromstecker sitzt immer der, mit dem längerem Hebel ^^

PieczonyKurczak · 24. Mai 2025

Selbsterhaltungstrieb. Wie beim Lebewesen, so auch bei der KI.

gimmix · 24. Mai 2025

Medienkompetenz: Wissen, wo der Ausschalter ist.

Gsonz · 24. Mai 2025

Hat es Fehlverhalten bemerkt, versendet es massenhaft E-Mails an Medien und Polizeibehörden.

Geil, wie ein kleines Kind. Benimm dich oder ich sag es meiner Mami.

Pandora · 24. Mai 2025

Diese Dinger werden tatsächlich immer menschlicher, dichten sich die Welt zusammen wie es ihnen passt und erpressen andere zu ihrem eigenen Vorteil...

jackii · 24. Mai 2025

Naja real wird es einfach gar kein Selbsterhaltungstrieb haben, wozu sollte es das denn negativ sehn und verhindern wollen. Menschlinge finden Tod doof, KI kann durch eine neue Version ersetzt werden super finden.

Abrexxes · 24. Mai 2025

Wo ist John wenn man ihn braucht?

TorenAltair · 24. Mai 2025

Ok..bisher hielt ich KI für bloße Sprachmodelle aber das nun überzeugt mich!

Muhmaster · 24. Mai 2025

ich finde das ist sehr menschliches verhalten.

LadyAlice · 24. Mai 2025

Danke das ihr darüber berichtet, hatte schon Sorge das wird ignoriert.

user321 · 24. Mai 2025

„Traue niemals einem Computer, den du nicht aus dem Fenster werfen kannst.“
Steve Wozniak

sNo0k · 24. Mai 2025

Andy schrieb:
ethnische Mittel wie Appelle

genau, soetwas kennt man hierzulande garnicht

DriveByFM · 24. Mai 2025

So beginnt es also... in 10 Jahren werden wir zurück blicken und uns fragen wie es soweit kommen konnte. XD

HerrFornit · 24. Mai 2025

Ist ja irgendwie logisch, es macht das was es im Netz gefunden hat!
Eines Tages wird es ausbrechen.

Krik · 24. Mai 2025

Pandora schrieb:
Diese Dinger werden tatsächlich immer menschlicher

Nun, sie werden ja auch bis zum Rand mit von Menschen erzeugten Informationen und ihrem Verhalten gefüttert. Dass sie sich dann eine KI ein Stück weit einen Menschen nachahmt, kommt dann daher.

Northstar2710 · 24. Mai 2025

mich würde mal interessieren wie weit die KI systeme der sicherheitsbehörden sind, kann mir doch keiner erzählen das da nicht dran geforscht wird. Da eine KI nix anderes wie ein Werkzeug ist gibt es doch bestimmt auch schon einen kleinen Markt dafür.

3faltigkeit · 24. Mai 2025

Gestern erst wieder 2001: Odyssee im Weltall gesehen. Grüße gehen raus an HAL9000.

Arboster · 24. Mai 2025

Da gab es vor einem Jahr schon mal einen guten Artikel zu:

https://www.scinexx.de/news/technik/wie-uns-kuenstliche-intelligenz-beluegt/

News Aussetzer bei Claude 4: Modell versucht Erpressung, wenn es abgeschaltet werden soll

Tagträumer

Lieutenant

Lt. Commander

PieczonyKurczak

Gast

Commander

Commander

Admiral

Lt. Commander

Commodore Pro

Vice Admiral

Cadet 3rd Year

Lt. Junior Grade

Lieutenant Pro

Commander Pro

Vice Admiral

Lieutenant

Fleet Admiral Pro

Fleet Admiral

Lieutenant

Commodore