[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Keuleman · 23. Dezember 2025

MechanimaL · 24. Dezember 2025

Qwen Image Edit 2511 ist erschienen. Verbesserte Version des ohnehin schon guten 2509 Modells.

https://huggingface.co/unsloth/Qwen-Image-Edit-2511-GGUF (GGUF Versionen)
https://huggingface.co/silveroxides/Qwen-Image-fp8-scaled-quants/tree/main (FP8/INT8)

Dennis_BW · 24. Dezember 2025

MechanimaL schrieb:
https://huggingface.co/unsloth/Qwen-Image-Edit-2511-GGUF (GGUF Versionen)

Nachdem 2509 als GGUF bei mir läuft, werde ich 2511 bei Gelegenheit auch testen. 👍

MechanimaL · 24. Dezember 2025

beachten, dass es weitere nodes verwendet im Vergleich zum Vorgänger. Also auf jedenfall comfyui updaten und dann einfach zb. mit dem template workflow starten.

Dennis_BW · 24. Dezember 2025

Danke für den Hinweis 👍 ich lade mir eh immer ein Workflow und wenn was fehlt wird man drauf hingewiesen 😀

zidius · 24. Dezember 2025

Ich finds ja echt beeindruckend, wie ihr immer alle neuen Sachen und alles auf einmal ausprobiert

Ich kann da echt nicht Schritt halten.
Wo nehmt ihr nur die Zeit dafür her?^^

Habe mich jetzt etwas mit zImage befasst.
Auch das ControlNet eingerichtet und ausprobiert.... keine Ahnung, aber ich finde die Ergebnisse damit immer noch extrem ernüchternd....

Trotzdem, mit zImage an sich habe ich wieder echt Spaß.
Wirklich eine super Mischung aus Qualität und Geschwindigkeit. (Das Bild ist mit LoRAs)

Dennis_BW · 24. Dezember 2025

Mehr als ein paar Spielereien habe ich noch nicht geschafft. Fehlt als Familienvater viel Zeit. Bin ja schon froh mit AMD GPU dass ich es nach einigen Fehlversuchen unter CachyOS zum Laufen gebracht habe.

Gerade Qwen wollte anfangs nicht.

MechanimaL · 24. Dezember 2025

zidius schrieb:
Auch das ControlNet eingerichtet und ausprobiert.... keine Ahnung, aber ich finde die Ergebnisse damit immer noch extrem ernüchternd....

Vom Controlnet gibts ja mittlerweile 3 Versionen. Die 2.1 fand ich funktioniert am besten, aber benötigt mehr Steps als der normale Prozess, also zumindest für Inpainting.. Sie haben auch eine Version mit 8 Steps jetzt rausgebracht, aber irgendwie funktioniete die schlechter in meinem kurzen Test. Strength vom Controlnet ggf. etwas absenken (0.75 zb).

blubberbirne · 24. Dezember 2025

QWEN2511 macht bock. Gesichter konsistenz ist viel besser geworden.

Keuleman · 24. Dezember 2025

Ich mache das immer so: auf der Arbeit mit CPU kleine 512x512 Bilder (Flux 1 Schnell), da habe ich einen alten "Designer-PC", i7-10 irgendwas mit 32 GB RAM. Dauert so 10 Minuten pro Bild. Da dann die "verheissungsvollen" durch Z Image oder Flux 2 daheim jagen in guter Auflösung.

Edit: auf der Arbeit "nebenbei", daher "Zeit gespart".

Keuleman · 27. Dezember 2025

MechanimaL · 28. Dezember 2025

Böllerverbot incoming

zidius · 28. Dezember 2025

Böller?, da hab ich auch ein Bild zum teilen

Wird wohl mein Neujahrsgruß.

MechanimaL · 31. Dezember 2025

QWEN Image 2512 ist erschienen. Bisher gibt es nur GGUF Varianten. Bald sollten auch fp8/fp16 safetensor Versionen vorliegen. Erste Bilder sehen herrvoragend aus. Ausschnitt von der Selbst-Beschreibung seitens QWEN:

Enhanced Huamn Realism Qwen-Image-2512 significantly reduces the “AI-generated” look and substantially enhances overall image realism, especially for human subjects.
Finer Natural Detail Qwen-Image-2512 delivers notably more detailed rendering of landscapes, animal fur, and other natural elements.
Improved Text Rendering Qwen-Image-2512 improves the accuracy and quality of textual elements, achieving better layout and more faithful multimodal (text + image) composition.

EIne Turbo Lora ist schonmal hier zu finden.

EDIT: Hier noch die fp8 und bf16 Versionen, sowie Lightx2v Turbo Lora

Rickmer · 31. Dezember 2025

MechanimaL schrieb:
Enhanced Huamn Realism

Ich nehme das mal als Bestätigung, dass die Patchnotes nicht von einem LLM zusammengefasst wurden...

Keuleman · 31. Dezember 2025

Schaut gut aus! Bin gespannt, wie der erste Run durch meinen Eis-im-Wald Benchmark/Prompt ausfällt.

Dennis_BW · 1. Januar 2026

MechanimaL schrieb:
QWEN Image 2512 ist erschienen. Bisher gibt es nur GGUF Varianten.

Vielen Dank fürs zusammenstellen und die Info 👍

Keuleman · 1. Januar 2026

Safetensors nun auch da, ebenso ein offizielles Template im ComfyUI!

Sieht wirklich erstaunlich gut aus. Kann nix mehr zu meckern finden so recht.

MechanimaL · 2. Januar 2026

Evtl. etwas untergegangen ist, dass für FLUX.2 dev eine Turbo Lora erschienen ist, die es ermöglicht etwas komfortabler mit dem Modell zu arbeiten. Die Entwickler sprechen von bis zu 6x schnellerer Inferenz-Zeit bei gleichen oder besseren Ergebnissen. (Beim Download die LORA Datei im Unterordner "comfy" nehmen.)

Als Z-Image Turbe (ZIT) kurz nach Flux2.dev erschien, scherte sich niemand mehr um das Flux2 Modell, da es sehr groß (60GB BF16, 33GB FP8) und langsam in der Anwendung war und der reine Bild Output des kleineren, effizienteren ZIT nicht schlechter schien.

Mit dem neuen Speed-Boost könnte es sich nochmal lohnen Flux2 zu probieren, denn die Fähigkeiten des Modells sind durchaus vorzeigbar: Es besitzt wie QWEN Edit auch die Option bspw. Charaktere zu implementieren per Bild Input oder bestehende Bilder per Prompt zu bearbeiten. Der größte Vorteil gegenüber anderen Modellen ist das Prompt-Verständnis aufgrund der Größe: ZIT hat z.B. 6 Milliarden Parameter, während QWEN 20 und FLUX2 32 hat. Größter Nachteil: Es ist auch mit der LORA noch eher auf der langsameren Seite, was die Dauer angeht.

Die benötigten Dateien sind hier zu finden (fp8 text encoder nehmen) und es gibt auch gguf Varianten des Bildmodells ink. eines Vergleichbilds. In der Regel werden wohl 24+GB VRAM User die FP8 Variante als erstes probieren, bei allem darunter bieten sich wsl. eher die kleineren GGUF Varianten an. Aber einfach mal probieren. Noch zu beachten: Mit der Turbo LORA sollte die "guidance-scale" auf 2.5 gesenkt werden bei 8 Steps.

Keuleman · 2. Januar 2026

Scheint auf jeden Fall Text-treu zu sein, wenn man die Zeitung des alten Herren sieht. Das gefällt mir :-) Werde Flux2 mit Turbo Lora definitv noch mal testen. Ergebnisse bisher waren immer super aber mir tatsächlich für das bisschen mehr zu Z Image zu langsam. Bin allerdings auch gerade mit QWEN Image echt zufrieden, das hat auch mächtig zugelegt.

EDIT: bisschen rumprobiert... ja, schneller, aber hat auch wieder die gute alte Flux-Haut. Ich bin mit Z-Image und dem neueren Qwen grad zufriedener.

[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Lt. Junior Grade

Lt. Commander

Cadet 4th Year

Lt. Commander

Cadet 4th Year

Lieutenant

Cadet 4th Year

Lt. Commander

Lt. Commander

Lt. Junior Grade

Lt. Junior Grade

Lt. Commander

Lieutenant

Lt. Commander

Silent-Fanatiker Pro

Lt. Junior Grade

Cadet 4th Year

Lt. Junior Grade

Lt. Commander

Lt. Junior Grade