[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Ah ok, na die Erkenntnisse und vorgefertigte Workflows /Modelle kommen ja. Da das Modell wirklich inkl. Trainingsdaten open source ist und schon so eine gute Basis bietet, werden da viele Optimierungen, LORAs usw. kommen :) Dann kannst Du jederzeit wieder einsteigen und davon profitieren.

PS: (Kleinerer Text-encoder für den LTXV (github) workflow) (aus vorherigem Video)
 
Zuletzt bearbeitet:
ComfyUI_00056_.png
 
  • Gefällt mir
Reaktionen: Dennis_BW
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: ChatGehPeeTee
Das wollt ich eigtl schon vorgestern machen und schicken, aber jetzt halt mit etwas Verspätung :D
 
  • Gefällt mir
Reaktionen: Dennis_BW
Weis einer was das bedeutet?

"Es tut uns leid, aber das von uns erstellte Bild verstößt möglicherweise gegen unsere Schutzmechanismen in Bezug auf potenziell betrügerische oder betrugsähnliche Aktivitäten."

Ich verstehe das bezüglich Gewalt oder Sexualität diverse Filter greifen, aber das als Antwort bei ner Standardanfrage...?

Okay ich glaub ChatGPT is tot. Da geht nichts mehr.
 
Zuletzt bearbeitet:
braindamage10k schrieb:
Ich verstehe das bezüglich Gewalt oder Sexualität diverse Filter greifen, aber das als Antwort bei ner Standardanfrage...?
Ja nu, was war denn diese Standardanfrage?
 
Meine Auto Sammlung 😉
1767545745158.jpg1767544411424.jpg1767544127662.jpg1767543981773.jpg
 
  • Gefällt mir
Reaktionen: Dennis_BW
Wie bist du denn drauf?

Fragst hier nach Rat und wenn jemand nach deinem Prompt fragt (ohne den dir niemand sagen können wird, woran sich ChatGPT möglicherweise gestört hat) kommst du mit so einer Antwort?
 
  • Gefällt mir
Reaktionen: MechanimaL und Rickmer
@braindamage10k

Möglicherweise meint ChatGPT Personen öffentlichen Lebens zu erkennen und schließt diese von der Bearbeitung aus. Genimi (Nano Banana Pro) hat ähnliche Sicherheits-Einstellungen (um bspw. gegen Deep Fakes vorzugehen) und teilt sich dann so mit:

"There are a lot of people I can help with, but I can't edit some public figures. Do you have anyone else in mind?"

Sehr vernünftig, auch absolut begrüßenswert und richtig, selbst wenn die Erkennung nicht immer treffsicher ist, dafür aber tendenziell auf Nummer Sicher geht.
 
Vigilant schrieb:
Sehr vernünftig, auch absolut begrüßenswert und richtig
Aber wieso sollten Personen des öffentlichen Lebens besser geschützt sein als Privatpersonen?
 
Was fragst du mich das? Sollten sie nicht, Und vermutlich wird auch nicht unterschieden. Würde jetzt allerdings auch nicht Material von bspw. Freunden und Bekannten hochladen, um das auszuprobieren.

Hier die Antwort von Genimi auf die Fragen:

Kontext: Nano Banana, Meldung: "There are a lot of people I can help with, but I can't edit some public figures. Do you have anyone else in mind?"

Was genau hat diese Antwort zu bedeuten? Welcher Sicherheits-Mechanismus steht dahinter und wie wird das Material geprüft? Werden Personen des öffentlichen Lebens genauso behandelt wie bspw. Privatpersonen?

Diese Meldung ist eine typische Sicherheitsbarriere (ein sogenanntes Guardrail), die in moderne KI-Systeme integriert ist. Sie signalisiert, dass das System eine Anfrage blockiert hat, um ethische, rechtliche oder missbräuchliche Risiken zu vermeiden.

Hier ist eine detaillierte Analyse, was dahintersteckt:

1. Was bedeutet diese Antwort genau?

Die Antwort besagt, dass die KI eine Richtlinie hat, die das Erzeugen oder Bearbeiten von Bildern (oder Texten) über bestimmte Personen des öffentlichen Lebens untersagt. Das Ziel ist es, die Erstellung von Deepfakes oder irreführendem Material zu verhindern. Die KI erkennt den Namen oder die Beschreibung einer berühmten Person und bricht den Prozess ab, bevor das Material generiert wird.


2. Welcher Sicherheits-Mechanismus steht dahinter?

Hinter dieser Sperre steht ein mehrstufiges Sicherheitskonzept, das oft als Content Moderation System bezeichnet wird.
  • Namen-Filter (Blacklists): Das System gleicht deine Eingabe mit einer Datenbank ab, die Tausende von Namen von Politikern, Prominenten, religiösen Führern oder anderen einflussreichen Personen enthält.
  • Contextual Analysis: Die KI prüft nicht nur den Namen, sondern auch den Kontext. Wenn die Beschreibung stark nach einer bekannten Persönlichkeit klingt (z. B. "Der aktuelle deutsche Bundeskanzler"), greift der Filter ebenfalls.
  • Post-Generation Check: Falls die KI das Bild dennoch erstellt, prüft ein zweites, im Hintergrund laufendes Modell das Ergebnis visuell, bevor es dir angezeigt wird. Erkennt dieses Modell ein bekanntes Gesicht, wird die Anzeige blockiert.

3. Wie wird das Material geprüft?

Die Prüfung erfolgt in Echtzeit und automatisiert durch verschiedene Technologien:
  • NLP (Natural Language Processing): Der Textprompt wird auf verbotene Begriffe gescannt.
  • Computer Vision: Bei Bildgeneratoren werden neuronale Netze darauf trainiert, biometrische Merkmale prominenter Gesichter zu erkennen.
  • Vektordatenbanken: Namen werden in mathematische Vektoren umgewandelt. Wenn ein Vektor zu nah an einem "geschützten" Vektor (z. B. dem von "Elon Musk") liegt, wird die Anfrage abgelehnt.

4. Werden Personen des öffentlichen Lebens anders behandelt als Privatpersonen?

Ja, aber aus unterschiedlichen rechtlichen und ethischen Gründen:

1767945332792.png


Wichtiger Hinweis: Während Prominente durch Blacklists geschützt sind, greifen bei Privatpersonen oft allgemeinere Filter, die z. B. sexuelle oder gewalttätige Inhalte verhindern sollen. Viele professionelle Tools verbieten mittlerweile jegliche Bearbeitung von realen menschlichen Gesichtern, um das Risiko von Rachepornos oder Identitätsdiebstahl zu minimieren.
 
Zuletzt bearbeitet:
Tr8or schrieb:
Aber wieso sollten Personen des öffentlichen Lebens besser geschützt sein als Privatpersonen?
Aber sie könnten eher dazu bereit sein einen Anwalt loszuschicken...
 
  • Gefällt mir
Reaktionen: Vigilant und Tr8or
  • Gefällt mir
Reaktionen: Dennis_BW und Keuleman
Jemand Lust einen prompt zu testen / weiter zu entwickeln?
High-resolution, cinematic winter still-life captured from a high angle. The scene unfolds on an empty, snow-covered parking lot illuminated by soft, dim streetlights. The snow is pristine, untouched, except for a set of footfalls that lead toward a small, clear patch of ground in the center of the lot. This patch, exactly the size of a car, remains unblemished by snow, revealing the absence of the vehicle that once stood there. The position of the footprints is deliberate: they approach the patch precisely where the driver's side door would have been, as if the person had left their vehicle one last time and walked away into the night. The faint, softened lines of tire tracks stretch out from the bare patch, already being covered by fresh snowfall, fading gradually into the whiteness. The contrast between the untouched snow, the exposed asphalt, and the carefully placed footprints creates a poignant emptiness, as if the absence itself is quietly observed by the winter night.The gentle glow of streetlamps casts muted amber light and elongated shadows across the snow, accentuating the stillness and the subtle loneliness of the scene. The color palette remains restrained—cold blues, silvers, and soft whites dominate, pierced only by the warm halo around each lamp.The overall composition evokes a profound sense of solitude, quiet departure, and the traces we leave behind—capturing a fleeting, melancholic moment preserved in the hush of a winter night.
der prompt ist eigentlich noch nicht ganz fertig. Die Reifenspuren sollen noch eine große Kurve fahren und die Fußspuren kreuzen.... aber es ist jetzt schon schwer genug.
Außerdem ist die Beschreibung "clear patch of ground" unglücklich. Andere Formulierungen und Umschreibungen haben aber noch schlechter funktioniert... Vielleicht fällt euch was besseres ein.

Mit zImage keine Chance. Beste Ergebnisse mit nanoBanana und ChatGPT
spuren.jpg

537d65cf-5cde-4fc4-ba90-35cf0da77669.png

schneespuren.jpg
 
Ah ja interessant. Das letzte Fahrzeug hat aber Heckeinstieg :D FLux2 und Qwen kann ich ggf mal testen.. :)
Beim oberen Bild ist die ist der Spurabstand evtl nicht ganz perfekt und Fronteinstieg ;) und beim mittleren könnte man - wenn auf Perfektion gemünzt - noch bemängeln, dass die Fahrspuren direkt vorm Fahrzeug nicht da sind, ist aber das beste der drei. Edit: wobei es hat rechts Doppelbereifung links Triple ^^

Evtl könnte es mit einer eher stupiden Beschreibung dessen, was man sehen möchte, besser klappen also: Fleck, Fußspuren zur linken seite des Flecks, Fahrspuren beginnend nach vorne vom Fleck symmetrisch davon ausgehend und ausschließlich dort -neben der Umgebungsbeschreibung versteht sich. Ist vll bischen unnötige Prosa drin, wie so oft bei gpt-Prompts (das kann helfen, aber auch vom wesentlichen ablenken ^^ ).
 
Zuletzt bearbeitet:
Fooocus versagt komplett :)
Muss mich eh mal um was Neues kümmern.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Tr8or
zidius schrieb:
Jemand Lust einen prompt zu testen / weiter zu entwickeln?
Mit Qwen Image 2512 (ohne LORA; etwas hit and miss natürlich, aber es geht prinzipiell, wie man sieht)
1768077138114.png
Winter at night. An empty parking lot seen from a top down bird’s-eye view. Fresh snow covers the entire ground uniformly.
In the snow there is one single exposed patch of dark asphalt roughly the size of a parked car. The patch is clean and sharply defined.
From the left corner a straight horizontal line of bootprints leads to the edge of the asphalt patch and stops there. These are the only footprints visible in the image.
At the top of the asphalt patch, two parallel car tire tracks begin and move straight forward into the snow, extending away from the patch. These are the only tire tracks visible in the image. The rest of the parking lot is completely untouched, smooth, and empty, covered by snow.
Cold, dim nighttime lighting, softly reflecting off the snow as if from distant streetlights.
Minimal, quiet, and slightly eerie atmosphere.

Die Fußspuren waren häufig ziemlich zufällig oder von unten kommend, bis ich "horizontal" hinzugefügt habe. Btw: In der Regel machte QWEN bei "human footprints", oder auch nur "footprints" tatsächliche Fußabdrücke :D
1768077218934.png

^^
 
  • Gefällt mir
Reaktionen: zidius und Dennis_BW
Zurück
Oben