[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Flux2_00004_.png
 
beachten, dass es weitere nodes verwendet im Vergleich zum Vorgänger. Also auf jedenfall comfyui updaten und dann einfach zb. mit dem template workflow starten.
 
  • Gefällt mir
Reaktionen: Dennis_BW
Danke für den Hinweis 👍 ich lade mir eh immer ein Workflow und wenn was fehlt wird man drauf hingewiesen 😀
 
Ich finds ja echt beeindruckend, wie ihr immer alle neuen Sachen und alles auf einmal ausprobiert :D
Ich kann da echt nicht Schritt halten.
Wo nehmt ihr nur die Zeit dafür her?^^

Habe mich jetzt etwas mit zImage befasst.
Auch das ControlNet eingerichtet und ausprobiert.... keine Ahnung, aber ich finde die Ergebnisse damit immer noch extrem ernüchternd....

Trotzdem, mit zImage an sich habe ich wieder echt Spaß.
Wirklich eine super Mischung aus Qualität und Geschwindigkeit. (Das Bild ist mit LoRAs)
2025-12-23-212938_zImage_turbo_131094973318306_b.png
 
  • Gefällt mir
Reaktionen: MechanimaL und blubberbirne
Mehr als ein paar Spielereien habe ich noch nicht geschafft. Fehlt als Familienvater viel Zeit. Bin ja schon froh mit AMD GPU dass ich es nach einigen Fehlversuchen unter CachyOS zum Laufen gebracht habe.

Gerade Qwen wollte anfangs nicht.
 
zidius schrieb:
Auch das ControlNet eingerichtet und ausprobiert.... keine Ahnung, aber ich finde die Ergebnisse damit immer noch extrem ernüchternd....
Vom Controlnet gibts ja mittlerweile 3 Versionen. Die 2.1 fand ich funktioniert am besten, aber benötigt mehr Steps als der normale Prozess, also zumindest für Inpainting.. Sie haben auch eine Version mit 8 Steps jetzt rausgebracht, aber irgendwie funktioniete die schlechter in meinem kurzen Test. Strength vom Controlnet ggf. etwas absenken (0.75 zb).
 
  • Gefällt mir
Reaktionen: zidius
QWEN2511 macht bock. Gesichter konsistenz ist viel besser geworden.
 
Ich mache das immer so: auf der Arbeit mit CPU kleine 512x512 Bilder (Flux 1 Schnell), da habe ich einen alten "Designer-PC", i7-10 irgendwas mit 32 GB RAM. Dauert so 10 Minuten pro Bild. Da dann die "verheissungsvollen" durch Z Image oder Flux 2 daheim jagen in guter Auflösung.

Edit: auf der Arbeit "nebenbei", daher "Zeit gespart".

ComfyUI_00322_.png

ComfyUI_00018_.png

ComfyUI_00528_.png

Flux2_00008_.png
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Dennis_BW
Böllerverbot incoming :D
 
QWEN Image 2512 ist erschienen. Bisher gibt es nur GGUF Varianten. Bald sollten auch fp8/fp16 safetensor Versionen vorliegen. Erste Bilder sehen herrvoragend aus. Ausschnitt von der Selbst-Beschreibung seitens QWEN:
  • Enhanced Huamn Realism Qwen-Image-2512 significantly reduces the “AI-generated” look and substantially enhances overall image realism, especially for human subjects.
  • Finer Natural Detail Qwen-Image-2512 delivers notably more detailed rendering of landscapes, animal fur, and other natural elements.
  • Improved Text Rendering Qwen-Image-2512 improves the accuracy and quality of textual elements, achieving better layout and more faithful multimodal (text + image) composition.
EIne Turbo Lora ist schonmal hier zu finden.

EDIT: Hier noch die fp8 und bf16 Versionen, sowie Lightx2v Turbo Lora
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Maviapril2
MechanimaL schrieb:
Enhanced Huamn Realism
Ich nehme das mal als Bestätigung, dass die Patchnotes nicht von einem LLM zusammengefasst wurden...
 
  • Gefällt mir
Reaktionen: Maviapril2
Schaut gut aus! Bin gespannt, wie der erste Run durch meinen Eis-im-Wald Benchmark/Prompt ausfällt.
 
Safetensors nun auch da, ebenso ein offizielles Template im ComfyUI!

Qwen-Image-2512_00002_.png
Sieht wirklich erstaunlich gut aus. Kann nix mehr zu meckern finden so recht.
 
Zuletzt bearbeitet:
1767367303048.png
Evtl. etwas untergegangen ist, dass für FLUX.2 dev eine Turbo Lora erschienen ist, die es ermöglicht etwas komfortabler mit dem Modell zu arbeiten. Die Entwickler sprechen von bis zu 6x schnellerer Inferenz-Zeit bei gleichen oder besseren Ergebnissen. (Beim Download die LORA Datei im Unterordner "comfy" nehmen.)

Als Z-Image Turbe (ZIT) kurz nach Flux2.dev erschien, scherte sich niemand mehr um das Flux2 Modell, da es sehr groß (60GB BF16, 33GB FP8) und langsam in der Anwendung war und der reine Bild Output des kleineren, effizienteren ZIT nicht schlechter schien.

Mit dem neuen Speed-Boost könnte es sich nochmal lohnen Flux2 zu probieren, denn die Fähigkeiten des Modells sind durchaus vorzeigbar: Es besitzt wie QWEN Edit auch die Option bspw. Charaktere zu implementieren per Bild Input oder bestehende Bilder per Prompt zu bearbeiten. Der größte Vorteil gegenüber anderen Modellen ist das Prompt-Verständnis aufgrund der Größe: ZIT hat z.B. 6 Milliarden Parameter, während QWEN 20 und FLUX2 32 hat. Größter Nachteil: Es ist auch mit der LORA noch eher auf der langsameren Seite, was die Dauer angeht.

Die benötigten Dateien sind hier zu finden (fp8 text encoder nehmen) und es gibt auch gguf Varianten des Bildmodells ink. eines Vergleichbilds. In der Regel werden wohl 24+GB VRAM User die FP8 Variante als erstes probieren, bei allem darunter bieten sich wsl. eher die kleineren GGUF Varianten an. Aber einfach mal probieren. Noch zu beachten: Mit der Turbo LORA sollte die "guidance-scale" auf 2.5 gesenkt werden bei 8 Steps.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Keuleman und blubberbirne
Scheint auf jeden Fall Text-treu zu sein, wenn man die Zeitung des alten Herren sieht. Das gefällt mir :-) Werde Flux2 mit Turbo Lora definitv noch mal testen. Ergebnisse bisher waren immer super aber mir tatsächlich für das bisschen mehr zu Z Image zu langsam. Bin allerdings auch gerade mit QWEN Image echt zufrieden, das hat auch mächtig zugelegt.

EDIT: bisschen rumprobiert... ja, schneller, aber hat auch wieder die gute alte Flux-Haut. Ich bin mit Z-Image und dem neueren Qwen grad zufriedener.

Flux2_00005_.png
 
Zuletzt bearbeitet:
Zurück
Oben