möglichst unzensierte LLM

Alister1 · 3. Oktober 2025

Hallo,

ich suche aktuell eine LLM, welche so unzensiert wie möglich ist. Die LLM soll mit allem umgehen können, was nicht verboten ist (Gewalt, Straftaten, irgendwas mit Minderjährigen). Auf letzteres brauche ich natürlich einen Filter, damit nicht aus Versehen irgendwas dummes passiert, ansonsten soll diese so unzensiert wie möglich sein (also auch explizite Inhalte mit Personen ab 21 Jahren - zur Sicherheit, da Volljährigkeit in einigen Ländern erst dann erreicht wird).

TLDR:

Möglichkeit einer LLM gesucht, die mit allem umgehen kann, was den gängigen Gesetzen nicht widerspricht.

Es geht nur um TEXTE. Keine Bilder, keine Videos!

Wer kann helfen?

madmax2010 · 3. Oktober 2025

https://huggingface.co/
such dir eins aus

Mistral, dolphin, hermes, qwen,...

Musst nur dein Stichwort suchen

oicfar · 3. Oktober 2025

Falls man Ollama nutzt ...

https://ollama.com/search?q=uncensored

Pyrukar · 3. Oktober 2025

also du willst erwachsenen Inhalte haben aber (verständlicher weise) nicht, dass erwachsenen Inhalte mit Kindern kombiniert werden und das Zensieren in einer Text umgebung ... Also entweder wird die KI dir vermutlich beides zensieren oder auch zu Illegalem verwendet werden können.

Ich weis jetzt nicht, wie gut die LLMs zensiert werden können, aber ich fürchte ein Modell das Gut darin ist Erwachsenen Inhalte zu generieren, wird sich überreden lassen, auch verwerfliches zu generieren. Denn das Alter eines Charakters ist idR für eine LLM eine Zahl und vielleicht ist da noch gecoded dass dann ein "das gehört sich aber nicht" rauskommt aber sowas kann man vermutlich umgehen.

Beispiel: ich habe The Bloke Storytime Model Lokal laufen und ich hatte schon immer wieder ein Problem damit, dass zumindest dieses Modell nicht verstanden hat, dass man ein gewisses Alter benötigt um auto fahren zu dürfen oder alkohol zu trinken.
Das ist aber auch ein unzensiertes modell und ich würde mal vermuten, dass ich da problemlos das Modell dazu bringen könnte verbotene Erwachsenen Inhalte zu generieren. Was ich aber sagen möchte ist, dass ein Modell vermutlich Probleme bekommt wenn es um Altersgenzen im generellen geht, weil das Alter einer Person für die LLM nur eine Zahl ist und nur wenn du das Modell darauf stößst es sich "Altersgerecht" verhält und im Nächsten moment schon wieder vergessen hat.

Bei mir wars zumindest so, dass ich eine Geschichte schreiben habe lassen, wo eine Familie essen geht und der 5 jährige Sohn dann plötzlich Wein getrunken hat und schon mal das Auto vorgefahren hat während der Vater noch gezahlt hat ... vielleicht sind andere Modelle hier besser, aber ich fürchte austricksen lassen sie sich irgendwie alle oder zumindest die Meisten.

dernettehans · 3. Oktober 2025

Ich würd so gern lokal ein 671b Deepseek laufen lassen 😭

Pyrukar · 3. Oktober 2025

dernettehans schrieb:
671b Deepseek

ist das nicht eines der Riesenmodelle ... viel spaß beim aufbauen deines Lokalen Rechenzentrums mit Nvidia AI beschleunigern

Rickmer · 3. Oktober 2025

oicfar schrieb:
https://ollama.com/search?q=uncensored

Stichwort abliteration
https://huggingface.co/blog/mlabonne/abliteration

https://ollama.com/search?q=abliterated

Ich weiß nicht, wie sehr der Prozess die Performance der LLM verschlechtert, aber die beantwortet dir danach jede Frage. Allerdings auch undifferenziert, um das einhalten von Gesetzen musst du dich dann kümmern.

DaysShadow · 3. Oktober 2025

Pyrukar schrieb:
ist das nicht eines der Riesenmodelle

Jup

Das OpenAI GPT 120b braucht 80GB VRAM(!), kannst dir ja dann, auch wenn's nicht immer 1:1 übertragbar ist, ungefähr vorstellen wo das 671b Deepseek liegt...vor allem am Ende preislich

Rickmer · 3. Oktober 2025

Pyrukar schrieb:
ist das nicht eines der Riesenmodelle ...

Nö, ein Q4 Quant ist auf dem Mac Studio mit M4 Ultra und 512GB RAM durchaus lauffähig und auch von der Qualität brauchbar. Das kostet auch 'nur' 12k€.

Im Vergleich zu dem was man bei nvidia GPUs bezahlen müsste ist das regelrecht ein Schnäppchen.

DaysShadow schrieb:
auch wenn's nicht immer 1:1 übertragbar ist, ungefähr vorstellen wo das 671b Deepseek liegt...

Etwas über 400GB plus noch etwas mehr damit man mehr als nur miese 2k Token Context hat.

oicfar · 3. Oktober 2025

dernettehans schrieb:
Ich würd so gern lokal ein 671b Deepseek laufen lassen 😭

Und dann?

Ergänzung (3. Oktober 2025)

Rickmer schrieb:
Stichwort abliteration

Das war mir neu. Zum 1. Mal gehört. Danke.. Auch, wenn es für mich nicht so relevant ist.

Garmor · 3. Oktober 2025

Pyrukar schrieb:
Beispiel: ich habe The Bloke Storytime Model Lokal laufen

Aber warum so ein uraltes Modell?

madmax2010 · 3. Oktober 2025

Pyrukar schrieb:
Ich weis jetzt nicht, wie gut die LLMs zensiert werden können

nicht gut.
Das ist ja gerade das ganze Forschungsfeld um Alignment herum..

Pyrukar schrieb:
weil das Alter einer Person für die LLM nur eine Zahl ist und nur wenn du das Modell darauf stößst es sich

nicht mal das, es ist ein token, dessen repräsentation gerade am wahrscheinlichsten war.
Sehr viele LLMs haben die ersten 1-2 Jahre auf die Frage "Was ist schwerer, 1KG Ziegelsteine oder10KG Federn" mit "sie sind gleich schwer" geantwortet. Auf die Zahl kommt es bei nackten modellen ohne entsprechendes alignment, tool use und CoT/Reasoning kaum an.

Pyrukar schrieb:
Das ist aber auch ein unzensiertes modell und ich würde mal vermuten, dass ich da problemlos das Modell dazu bringen könnte verbotene Erwachsenen Inhalte zu generieren. W

Selbst gpt5 ist da relativ leicht zu zu bringen. Wie auch jedes andere auch.

Pyrukar schrieb:
aber ich fürchte austricksen lassen sie sich irgendwie alle oder zumindest die Meisten.

alle.

Alister1 · 3. Oktober 2025

madmax2010 schrieb:
https://huggingface.co/
such dir eins aus
Mistral, dolphin, hermes, qwen,...

Musst nur dein Stichwort suchen

ja, von huggingface habe ich sogar schonmal was gehört in diesem Zusammenhang.

Benötigt man zur Nutzung irgendeine spezielle Hardware an Mindestanforderung?

madmax2010 · 3. Oktober 2025

Deine Grafikkarte sollte so viel GB VRAm haben, wie das ModellMilliarden Parameter.
bei einem 70 Milliarden Parameter Modell, entsprechend mindestens 70GB VRAM

oicfar · 3. Oktober 2025

Alister1 schrieb:
ja, von huggingface habe ich sogar schonmal was gehört in diesem Zusammenhang.

Habe mich schon gefragt, dass wenn man nach einem unzensierten LLM fragt, dann hat weiß man wenig über LLMs.

Alister1 schrieb:
Benötigt man zur Nutzung irgendeine spezielle Hardware an Mindestanforderung?

Und nun wird es noch besser.

Welche Frage kommt dann?

Rickmer · 3. Oktober 2025

Alister1 schrieb:
Benötigt man zur Nutzung irgendeine spezielle Hardware an Mindestanforderung?

Speziell, nö
Aber das gewählte Modell sollte in den VRAM passen und eine vernünftige Menge an RAM ist auch hilfreich.

Für meinen Teil habe ich eine RTX 4090 und 96GB RAM, damit lassen sich alle LLMs bis so 120B Parameter wenigstens ausprobieren, auch wenn die nur bis 30B Parameter oder so nur wirklich gut performant sind weil sonst der VRAM überläuft.

madmax2010 schrieb:
Deine Grafikkarte sollte so viel GB VRAm haben, wie das ModellMilliarden Parameter.

... und die Faustregel ist für Q4 Quantisierung, also schon stark 'komprimierte' LLMs

oicfar · 3. Oktober 2025

madmax2010 schrieb:
Deine Grafikkarte sollte so viel GB VRAm haben, wie das ModellMilliarden Parameter.
bei einem 70 Milliarden Parameter Modell, entsprechend mindestens 70GB VRAM

Rickmer schrieb:
... und die Faustregel ist für Q4 Quantisierung, also schon stark 'komprimierte' LLMs

70B Q4 Modell braucht ~40-43GB VRAM + Context. D.h. da würde eine GPU mit 48GB VRAM reichen.

dernettehans · 3. Oktober 2025

Pyrukar schrieb:
viel spaß beim aufbauen deines Lokalen Rechenzentrums mit Nvidia AI beschleunigern

Alister1 · 3. Oktober 2025

madmax2010 schrieb:
Deine Grafikkarte sollte so viel GB VRAm haben, wie das ModellMilliarden Parameter.
bei einem 70 Milliarden Parameter Modell, entsprechend mindestens 70GB VRAM

Wir reden hier ausschließlich von TEXT , nichts visuelles.
Meine Grafikkarte ist nichtmal von Nvidia und zudem ein steinalt-Modell.

dms · 3. Oktober 2025

@Alister1 - seufz - das "LLM" wird auf der Grafikkarte ausgeführt

Ergänzung (3. Oktober 2025)

Alister1 schrieb:
Wir reden hier ausschließlich von TEXT , nichts visuelles.

stimmt ... da gabs ja den anderen Tröt

https://www.computerbase.de/forum/threads/gpt-fuer-nsfw.2251836/

möglichst unzensierte LLM

Ensign

Fleet Admiral

Captain

Commodore

Lt. Commander

Commodore

Silent-Fanatiker Pro

Admiral

Silent-Fanatiker Pro

Captain

Commander

Fleet Admiral

Ensign

Fleet Admiral

Captain

Silent-Fanatiker Pro

Captain

Lt. Commander

Ensign

Commander

Ähnliche Themen