[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Dennis_BW · 4. Januar 2026

MechanimaL schrieb:
Gerade bei SDXL/Pony/SD1.5 kommt man um einen "Afterdetailer" für's Gesicht häufig nicht rum,

Danke für den sehr detaillierten Input. Ich schaue mir das gerade an und versuche mich zurecht zu finden

Bin ja auf ~~CachyOS~~ Fedora mit ComfyUI unterwegs. ComfyUI auf Windows mit AMD GPU mag bei mir nicht vernünftig laufen.

MechanimaL schrieb:
Bei neueren Modellen (nach SDXL) kann man in ganzen Sätzen Prompts schreiben,

Das Bild war schon ein tolles Ergebnis für so ein "schnell hingeschmierten Prompt". Die Wunde wird am ende wohl mehr in Richtung "ausgepowert sein". Mit fiel nur nix besseres ein in dem Moment.

Keuleman · 4. Januar 2026

@braindamage10k

Du hast mehrere Möglichkeiten: Im ChatGPT Chat, in dem das Bild generiert wurde, sowas fragen wie "Kannst Du mir bitte für ComfyUI, Modell Z Image, aus dem letzten Bild ein Prompt machen?"

Oder in eine LLM das Bild rein packen und (hier isses QWEN3-vl:30b) bitten, das Bild in ein Prompt zu verwandeln. Habe ich mal gemacht:

Hyper-detailed cyberpunk digital painting, cinematic lighting, photorealistic textures, 8k resolution. A tough, tattooed woman with wet, disheveled hair sits cross-legged in a grungy, post-apocalyptic room. She wears a torn, dirty tank top and a dark jacket, holding a blue beer can in one hand and smoking a cigarette (smoke rising). Around her: empty beer cans, an ashtray full of cigarette butts, a laptop displaying code. To her left: a sniper rifle with a scope leaning against the wall. Behind her: a large window reveals a dystopian cityscape with burning skyscrapers, thick smoke, and flying drones/aircraft. Gritty urban decay atmosphere, ultra-detailed textures, cinematic depth, dark moody tones.

zidius · 5. Januar 2026

Hier kommt mein Porsche. zImage + selbst erstellte LoRA

Kennzeichen ist zugegeben schlecht geworden....

Keuleman · 6. Januar 2026

Geht bei mir auch immer so aber mich irritiert: die Spuren sind vor dem Auto. Ist der rückwärts da rein geslided in die Position? Ist bei meinen Bildern auch IMMER so.

blubberbirne · 6. Januar 2026

Das dürfte wohl den Umsatz mit den AI PRO 9700 Karten steigern.

https://blog.comfy.org/p/official-amd-rocm-support-arrives

Keuleman · 6. Januar 2026

Sehr gut, und auch hoffentlich den NVidia Preis drücken (wenn es da im erkorenen Hauptumsatzgebiet abseits der Gaming Sparte endlich Konkurrenz gibt ist das nur gut für alle).

Ergänzung (6. Januar 2026)

@zidius Gerade durch Deine Gallerie gescrollt. Wow! Respekt, tolle Ideen. Und ich habe dabei für mich gedacht "ne, für Deinen Billigkram brauchste keine andere GPU, da tut es eine mit 16 GB". Du hast echt krasse Ideen und top umgesetzt!

zidius · 6. Januar 2026

@Keuleman vielen Dank, das freut mich sehr. Feeback ist immer gern gesehen

Keuleman · 6. Januar 2026

Ich geb auf und fotografier wieder:

;-P

EDIT:

MechanimaL · 7. Januar 2026

Es gibt eine neue Lightning LORA für Qwen Image 2512 mit 8 Steps mit verbesserter Qualität.

blubberbirne · 7. Januar 2026

LTX 2 ist nun frei verfügbar für alle.

Kann nach einen Video schon sagen das ich es lieben werde

Keuleman · 7. Januar 2026

Holy cow. Wie habe ich da drauf gewartet.

blubberbirne · 7. Januar 2026

Aber ich denke Du wirst mit deiner 16GB Karte nicht soviel spaß damit haben.

Keuleman · 7. Januar 2026

Auflösung runter, RAM auslagern... joa, wenn es dann nicht geht bin ich offiziell abgehängt.

blubberbirne · 7. Januar 2026

Oder abwarten und hoffen das GGUF Modelle kommen.

Keuleman · 7. Januar 2026

Uff, najo. Mal testen. Falls es nix wird bin ich halt weiterhin mit Bildern beschäftigt. Video wäre nice to have, bin aber auch bei WAN und so immer wieder bei den Bildern zurück gelandet.

MechanimaL · 7. Januar 2026

Ich habs runtergeladen aber bin noch nicht zum Testen gekommen, macht nen sehr guten Eindruck, auch dass direkt Ton integriert ist gibt einem so viele Möglichkeiten direkt was beeindruckendes oder lustig(eres) zu erschaffen

und alles in einem (keine Extra Modelle für i2v, etc.). In ComfyUI gabs gestern viele Leute mit Probleme, sollte heute aber besser sein. Es gibt auch noch ein anderes Tool für Videos und da hab ich grad zufällig einen Post eines Users mit 16GB gesehen. Könnte also einen Versuch wert sein ^^

@Keuleman
https://github.com/deepbeepmeep/Wan2GP
https://github.com/deepbeepmeep/Wan2GP?tab=readme-ov-file#-quick-start (Installation via Pinokio, sollte sehr einfach sein, empfohlene User Scripts verwenden)

Keuleman · 7. Januar 2026

Ganz ehrlich: Ich bin zuversichtlich, dass es läuft. Dauert die Generierung auch lange: Macht nix, hauptsache, läuft. So ticke ich :-) die GPU läuft eh auf Minimum Power Limit und ich kaufe seit jeher die Stromspar-Hardware :-D

EDIT: auf RTX 4070 mit ihren 12 GB und 64 GB RAM schon mal keine Chance!

Keuleman · 7. Januar 2026

Ja, es ist schlimm. Aber es ist auf einer RTX 4070 entstanden ;-P Schönen Abend, die Herren!

Edit: Noch ein bisschen mehr Kontext. Klar, RAM und VRAM waren gut voll. OOM Errors in Masse, bis ich auf lowvram gegangen bin beim ComfyStart. GPU Speed reicht eigentlich locker, geht echt fix pro Video. WIe immer die Crux der VRAM. Temperaturen bei der RTX 4070 nie ein Problem, heute Abend ein paar Sachen gemacht, Hot Spot nie über 56,1 Grad. Es ist immer! der VRAM. Tscha. Mache ich nix, nur Mini ITX Systeme hier und keine Chance, 2500 oder 5000 Euro für Grafikkarten auszugeben.

Edit 2: Standard-Workflow mit Standard Modellen etc. Ich glaube hart, dass die 64 GB RAM in der Kiste hier helfen. Ich werde gelegentlich alles noch mal auf der Höllenkiste mit RTX 4070 Ti Super und 128 GB RAM testen, da sollte alles dann gut laufen ;-)

MechanimaL · 8. Januar 2026

Es kann sein, dass grade aufgrund des großen Text-Encoder Modells Speicherprobleme entstehen. Da lassen sich aber auch kleinere Varianten verwenden (fp8, bnb4). Generell scheint der LTX-Comfy workflow (von LTX selbst) insb. für kleinere Karten besser zu funktionieren, als der vom ComfyUI-Template.

Der gute Mann von "Ai never sleeps"

sagt, dass sogar 2GB VRAM ausrseichen, sofern der Rest im RAM unterkommen kann. Hier das indepth-Video dazu:

Keuleman · 8. Januar 2026

Ich hatte den LTX Flow genommen. Und.... ich habe das Modell erst mal wieder gelöscht. Ich mache lieber weiterhin Bilder und warte noch mal die Entwicklung ab. Wenn man ehrlich ist reichen meine Grafikkarten einfach nicht und ich kann/werde keine größere bekommen in absehbarer Zukunft. Also zurück zu den Bildern für mich ;-D

[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Cadet 4th Year Pro

Ensign

Lieutenant

Ensign

Lt. Commander

Ensign

Lieutenant

Ensign

Lt. Commander

Lt. Commander

Ensign

Lt. Commander

Ensign

Lt. Commander

Ensign

Lt. Commander

Ensign

Ensign

Lt. Commander

Ensign