[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

MechanimaL · 18. Januar 2026

Welches Prompt hast du verwendet, wo es nicht geklappt hat? Es gibt noch Optionen wie Maskging/ Inpainting, das heißt, dass das Modell rein vom Ansatz her nur in einem bestimmten bereich arbeiten darf. oder controlnet, was Sachen festschreibt, an denen sich die neue Erstellung orientieren muss. Mit einem konkreten Beispielbild könnten wir da gemeinsam schauen. Sehe ich das richtig, dass es dann jetzt um den In-Game Screenshot geht? Was hast Du denn da als Prompt genutzt? Denn das Bild an sich ist ja von der Komposition und allem her auch schon stark verändert.

Meta.Morph · 18. Januar 2026

MechanimaL schrieb:
Welches Prompt hast du verwendet, wo es nicht geklappt hat?

The woman in the white bikini is supposed to be wearing the computer character's robe, as if it were a cosplay.

MechanimaL schrieb:
Es gibt noch Optionen wie Maskging/ Inpainting, das heißt, dass das Modell rein vom Ansatz her nur in einem bestimmten bereich arbeiten darf

Stimmt. Das wäre ne Möglichkeit.
Es war auch nur mit dem Standard Workflow, den mir ComfyUI anbietet.

Wie gesagt, ich bin immer noch der Meinung, das die Darstellung von Menschen auf eine "realistische" Darstellung trainiert wurde, aber das muss jetzt auch nicht schlecht sein... nur gibt es eben auch Menschen, die sind tatsächlich schön, auch ohne Instagram-Filter.

Aber das Editing scheint zu funktionieren.

MechanimaL · 18. Januar 2026

Also das Gesicht hat sich jetzt bei mir kaum verändert. Auch die Umgebung ist sehr konsistent. Am meisten Abweichung per Seed gibt es noch darin, wie sehr nah das ganze fotorealistisch oder eher künstlich aussieht.

Probier mal Dein Prompt mit "turn into a realistic photograph" zu beginnen. Das alleine kann im Prinzip schon reichen, dann paar Seeds durchprobieren. Bei dem konkreten Bild gibt es die Challenge mit den etwas für Elfen ungewöhnlich langen

Ohren und riesigen Augenbrauen. Da hilft es, wenn man das noch ins Prompt mit aufnimmt, sonst werden meistens extra Ohren hinzugefügt und das vorhandene als etwas anderes interpretiert. Es gibt dann nicht unbedingt den einen Weg, man muss schauen, wie man es am besten per Prompt hinbekommt. (z.B. auch per positiv Prompt konkrete Bezüge zum Input Bild herstellen oder Sachen ausschließen). Hier mal ein Beispiel mit:

"turn into a realitic photograph of elven woman with two long upward hairless elven ears and very long natural silver eyebrows. eyes are glowing blue"

Hier ist übrigens ein kurzer Prompting Guide für Flux2.klein von BFL.

Meta.Morph · 19. Januar 2026

Gefällt mir sehr!

Wobei das eher wie WoW 3 Aussieht und noch nicht "realistic" ist... die Augenbrauen müsste man auch Nachbearbeiten.

Was mir gerade Aufgefallen ist: CB entfernt wohl die Meta-Daten? Normalerweise ist es möglich, das Bild in ComfyUI zu ziehen um den Workflow nachzuvollziehen. Hat meiner Meineung aber auch den Vorteil, das sofort ersichtlich ist, das es sich um ein KI Bild handelt.

Gerade wenn die Bilder von Menschen inzwischen so gut bzw. realistisch werden. Wer weiß denn schon, ob es sich um das generierte Bild um keinen Deepfake handelt? (Gerade im Kontext der aktuellen Debatte) Irgendeinem Menschen wird Bild XY dann vielleicht doch zu ähnlich sehen...

Irgendwie ist das alles echt wild...

Meta.Morph · 19. Januar 2026

Fast Perfekt:

Aber man muss wahnsinnig Präzise in der Sprache sein, auf englisch.

Keuleman · 19. Januar 2026

Ich teste grad mit Control net rum und bin auch sehr angetan. Das einzige, was mir zu meinem Glück fehlt ist ein vernünftiges, idealerweise portables, Posing/Mannequin Programm:

Tr8or · 19. Januar 2026

Meta.Morph schrieb:
Aber man muss wahnsinnig Präzise in der Sprache sein, auf englisch

Ich nutze bei langen Prompts sehr gerne
https://www.deepl.com/de/translator

Ich spiele gerade ein wenig mit LTX-2 I2V rum, sehr genial was da für Ergebnisse kommen, wenn man das Ausgangsbild nur genau genug beschreibt. Aber leider kann er keine Schrift. Schade.

Meta.Morph · 19. Januar 2026

Tr8or schrieb:
Ich nutze bei langen Prompts sehr gerne

Ich nutze den Translator von Google.

Wobei ich bessere Erfahrung mit Gemini gemacht hab. Zwar will der Chatbot mir immer noch Prompts für SDXL und co. aufs Auge drücken aber wenn die Fronten klar sind, kommen auch gute Anweisungen für Flux 2 raus.

MechanimaL · 19. Januar 2026

Meta.Morph schrieb:
Gefällt mir sehr!

Wobei das eher wie WoW 3 Aussieht und noch nicht "realistic" ist... die Augenbrauen müsste man auch Nachbearbeiten.

ja ich hatte auch noch welche, die noch fotorealistischer waren, da war dann aber anderes "falsch". Mit genügend Geduld kann man natürlich in alle Richtungen gehen, erst recht, wenn jetzt noch LORAs bzw. Finetunes für KLein kommen werden

Meta.Morph schrieb:
Was mir gerade Aufgefallen ist: CB entfernt wohl die Meta-Daten? Normalerweise ist es möglich, das Bild in ComfyUI zu ziehen um den Workflow nachzuvollziehen. Hat meiner Meineung aber auch den Vorteil, das sofort ersichtlich ist, das es sich um ein KI Bild handelt.

evtl. macht es einen Unterschied ob man das Bild per copy+paste oder per Upload einfügt? Nicht sicher. war aber nix besonders eingestellt bei mir.

Meta.Morph schrieb:
Gerade wenn die Bilder von Menschen inzwischen so gut bzw. realistisch werden. Wer weiß denn schon, ob es sich um das generierte Bild um keinen Deepfake handelt? (Gerade im Kontext der aktuellen Debatte) Irgendeinem Menschen wird Bild XY dann vielleicht doch zu ähnlich sehen...

Ich weiß nicht, ob es ein Wasserzeichen o.ä. gibt, das man nicht entfernen kann, also bei solchen Formaten wie png usw. wohl eher nicht. Es gibt für die Metadaten auch tools, um diese einfach zu entfernen, wenn man z.B. grade nicht wollte, dass andere die Gen-Info auslesen (exif-cleaner z.b.).

Keuleman · 19. Januar 2026

Grad mal Bilder aus Raumplaner mit QWEN mit Details versehen lassen, großartig!

Dennis_BW · 20. Januar 2026

Das mit der Raumplanung ist mal eine geniale Idee 👍👍

Hätte ich vor drei Jahren gut brauchen können 😂
Schöne Ergebnisse auf jeden Fall.

Keuleman · 21. Januar 2026

Danke! Gestern Abend noch mal bisschen gebaut und auch das doch zu klein geratene Klavier auf realistische Größe gebracht:

braindamage10k · 21. Januar 2026

Neuer Versuch: und ja, ChatGPT is doof. Das zweite war so nicht geplant. ^^

Keuleman · 21. Januar 2026

Waffen sind immer schwierig in allen Modellen.

braindamage10k · 21. Januar 2026

Ich finde es faszinierend, das gerade ein Schwert die fehlende Intelligenz aufzeigt. Die AI versteht nicht was sie da tut. Oder wenn irgendwo ein dritter Arm auftaucht usw.

Keuleman · 21. Januar 2026

Macht ja Sinn, jeder Arm an sich ist an einer passenden Stelle. Aber der 3. Arm weiß nichts vom ersten weil unabhängig von dem Arm ausgedacht.

MechanimaL · 21. Januar 2026

https://www.computerbase.de/news/gr...reiber-des-jahres-bringt-das-ai-bundle.95870/

Neues AI Paket inkl. Comfy beim neusten AMD Treiber, Rocm unter Windows (war das vorher schon?). Evtl was für unsere AMD User.

Dennis_BW · 22. Januar 2026

Vielleicht teste ich das mal, bin aber mit Fedora sehr zufrieden bisher.

Keuleman · 22. Januar 2026

Damit dann auch ansprechende KI Möglichkeiten in Comfy? Fände ich gut, AMD Karten bringen ja gut VRAM mit.

Dennis_BW · 22. Januar 2026

Scheinbar nativ ROCm 7.2 und PyTorch Unterstützung laut dem News threat hier auf CB.

[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Lt. Commander

Meta.Morph

Gast

Lt. Commander

Meta.Morph

Gast

Meta.Morph

Gast

Lt. Junior Grade

Commander

Meta.Morph

Gast

Lt. Commander

Lt. Junior Grade

Cadet 4th Year

Lt. Junior Grade

Lt. Junior Grade

Anhänge

Lt. Junior Grade

Lt. Junior Grade

Lt. Junior Grade

Lt. Commander

Cadet 4th Year

Lt. Junior Grade

Cadet 4th Year