[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Welches Prompt hast du verwendet, wo es nicht geklappt hat? Es gibt noch Optionen wie Maskging/ Inpainting, das heißt, dass das Modell rein vom Ansatz her nur in einem bestimmten bereich arbeiten darf. oder controlnet, was Sachen festschreibt, an denen sich die neue Erstellung orientieren muss. Mit einem konkreten Beispielbild könnten wir da gemeinsam schauen. Sehe ich das richtig, dass es dann jetzt um den In-Game Screenshot geht? Was hast Du denn da als Prompt genutzt? Denn das Bild an sich ist ja von der Komposition und allem her auch schon stark verändert.
 
MechanimaL schrieb:
Welches Prompt hast du verwendet, wo es nicht geklappt hat?
The woman in the white bikini is supposed to be wearing the computer character's robe, as if it were a cosplay.

MechanimaL schrieb:
Es gibt noch Optionen wie Maskging/ Inpainting, das heißt, dass das Modell rein vom Ansatz her nur in einem bestimmten bereich arbeiten darf
Stimmt. Das wäre ne Möglichkeit.
Es war auch nur mit dem Standard Workflow, den mir ComfyUI anbietet.

Wie gesagt, ich bin immer noch der Meinung, das die Darstellung von Menschen auf eine "realistische" Darstellung trainiert wurde, aber das muss jetzt auch nicht schlecht sein... nur gibt es eben auch Menschen, die sind tatsächlich schön, auch ohne Instagram-Filter.

Aber das Editing scheint zu funktionieren.
 
Also das Gesicht hat sich jetzt bei mir kaum verändert. Auch die Umgebung ist sehr konsistent. Am meisten Abweichung per Seed gibt es noch darin, wie sehr nah das ganze fotorealistisch oder eher künstlich aussieht.

Probier mal Dein Prompt mit "turn into a realistic photograph" zu beginnen. Das alleine kann im Prinzip schon reichen, dann paar Seeds durchprobieren. Bei dem konkreten Bild gibt es die Challenge mit den etwas für Elfen ungewöhnlich langen ;) Ohren und riesigen Augenbrauen. Da hilft es, wenn man das noch ins Prompt mit aufnimmt, sonst werden meistens extra Ohren hinzugefügt und das vorhandene als etwas anderes interpretiert. Es gibt dann nicht unbedingt den einen Weg, man muss schauen, wie man es am besten per Prompt hinbekommt. (z.B. auch per positiv Prompt konkrete Bezüge zum Input Bild herstellen oder Sachen ausschließen). Hier mal ein Beispiel mit:

"turn into a realitic photograph of elven woman with two long upward hairless elven ears and very long natural silver eyebrows. eyes are glowing blue"
1768775789716.png
Hier ist übrigens ein kurzer Prompting Guide für Flux2.klein von BFL.
 
  • Gefällt mir
Reaktionen: Meta.Morph
Gefällt mir sehr!

Wobei das eher wie WoW 3 Aussieht und noch nicht "realistic" ist... die Augenbrauen müsste man auch Nachbearbeiten.

Was mir gerade Aufgefallen ist: CB entfernt wohl die Meta-Daten? Normalerweise ist es möglich, das Bild in ComfyUI zu ziehen um den Workflow nachzuvollziehen. Hat meiner Meineung aber auch den Vorteil, das sofort ersichtlich ist, das es sich um ein KI Bild handelt.

Gerade wenn die Bilder von Menschen inzwischen so gut bzw. realistisch werden. Wer weiß denn schon, ob es sich um das generierte Bild um keinen Deepfake handelt? (Gerade im Kontext der aktuellen Debatte) Irgendeinem Menschen wird Bild XY dann vielleicht doch zu ähnlich sehen...

Irgendwie ist das alles echt wild...
 
Ich teste grad mit Control net rum und bin auch sehr angetan. Das einzige, was mir zu meinem Glück fehlt ist ein vernünftiges, idealerweise portables, Posing/Mannequin Programm:

Screenshot 2026-01-19 090653.png
 
Meta.Morph schrieb:
Aber man muss wahnsinnig Präzise in der Sprache sein, auf englisch
Ich nutze bei langen Prompts sehr gerne
https://www.deepl.com/de/translator

Ich spiele gerade ein wenig mit LTX-2 I2V rum, sehr genial was da für Ergebnisse kommen, wenn man das Ausgangsbild nur genau genug beschreibt. Aber leider kann er keine Schrift. Schade.
 
Tr8or schrieb:
Ich nutze bei langen Prompts sehr gerne
Ich nutze den Translator von Google.

Wobei ich bessere Erfahrung mit Gemini gemacht hab. Zwar will der Chatbot mir immer noch Prompts für SDXL und co. aufs Auge drücken aber wenn die Fronten klar sind, kommen auch gute Anweisungen für Flux 2 raus.
 
Meta.Morph schrieb:
Gefällt mir sehr!

Wobei das eher wie WoW 3 Aussieht und noch nicht "realistic" ist... die Augenbrauen müsste man auch Nachbearbeiten.
ja ich hatte auch noch welche, die noch fotorealistischer waren, da war dann aber anderes "falsch". Mit genügend Geduld kann man natürlich in alle Richtungen gehen, erst recht, wenn jetzt noch LORAs bzw. Finetunes für KLein kommen werden :)
Meta.Morph schrieb:
Was mir gerade Aufgefallen ist: CB entfernt wohl die Meta-Daten? Normalerweise ist es möglich, das Bild in ComfyUI zu ziehen um den Workflow nachzuvollziehen. Hat meiner Meineung aber auch den Vorteil, das sofort ersichtlich ist, das es sich um ein KI Bild handelt.
evtl. macht es einen Unterschied ob man das Bild per copy+paste oder per Upload einfügt? Nicht sicher. war aber nix besonders eingestellt bei mir.

Meta.Morph schrieb:
Gerade wenn die Bilder von Menschen inzwischen so gut bzw. realistisch werden. Wer weiß denn schon, ob es sich um das generierte Bild um keinen Deepfake handelt? (Gerade im Kontext der aktuellen Debatte) Irgendeinem Menschen wird Bild XY dann vielleicht doch zu ähnlich sehen...
Ich weiß nicht, ob es ein Wasserzeichen o.ä. gibt, das man nicht entfernen kann, also bei solchen Formaten wie png usw. wohl eher nicht. Es gibt für die Metadaten auch tools, um diese einfach zu entfernen, wenn man z.B. grade nicht wollte, dass andere die Gen-Info auslesen (exif-cleaner z.b.).
 
Grad mal Bilder aus Raumplaner mit QWEN mit Details versehen lassen, großartig!
260118 Sweet Home 3D Test4.png
Qwen_Edit_2511_00017_.png

260119 Sweet Home 3D Test.png
Qwen_Edit_2511_00014_.png
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Maviapril2 und MechanimaL
Das mit der Raumplanung ist mal eine geniale Idee 👍👍

Hätte ich vor drei Jahren gut brauchen können 😂
Schöne Ergebnisse auf jeden Fall.
 
Danke! Gestern Abend noch mal bisschen gebaut und auch das doch zu klein geratene Klavier auf realistische Größe gebracht:
2601202200 Qwen_Edit_2511_00018_.png
 
  • Gefällt mir
Reaktionen: Dennis_BW
Neuer Versuch: und ja, ChatGPT is doof. Das zweite war so nicht geplant. ^^
 

Anhänge

  • 0d7513e3-5238-40ae-9c60-53b16db31962.png
    0d7513e3-5238-40ae-9c60-53b16db31962.png
    2,7 MB · Aufrufe: 47
  • 09460826-cc72-4b43-bfe7-da847fed1d23.png
    09460826-cc72-4b43-bfe7-da847fed1d23.png
    2,7 MB · Aufrufe: 46
Ich finde es faszinierend, das gerade ein Schwert die fehlende Intelligenz aufzeigt. Die AI versteht nicht was sie da tut. Oder wenn irgendwo ein dritter Arm auftaucht usw.
 
Macht ja Sinn, jeder Arm an sich ist an einer passenden Stelle. Aber der 3. Arm weiß nichts vom ersten weil unabhängig von dem Arm ausgedacht.
 
Vielleicht teste ich das mal, bin aber mit Fedora sehr zufrieden bisher.
 
Damit dann auch ansprechende KI Möglichkeiten in Comfy? Fände ich gut, AMD Karten bringen ja gut VRAM mit.
 
Scheinbar nativ ROCm 7.2 und PyTorch Unterstützung laut dem News threat hier auf CB.
 
Zurück
Oben