[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

MechanimaL schrieb:
Gerade bei SDXL/Pony/SD1.5 kommt man um einen "Afterdetailer" für's Gesicht häufig nicht rum,
Danke für den sehr detaillierten Input. Ich schaue mir das gerade an und versuche mich zurecht zu finden :D

Bin ja auf CachyOS Fedora mit ComfyUI unterwegs. ComfyUI auf Windows mit AMD GPU mag bei mir nicht vernünftig laufen.

MechanimaL schrieb:
Bei neueren Modellen (nach SDXL) kann man in ganzen Sätzen Prompts schreiben,
Das Bild war schon ein tolles Ergebnis für so ein "schnell hingeschmierten Prompt". Die Wunde wird am ende wohl mehr in Richtung "ausgepowert sein". Mit fiel nur nix besseres ein in dem Moment.
 
Zuletzt bearbeitet: (Fedora start CachyOS)
@braindamage10k

Du hast mehrere Möglichkeiten: Im ChatGPT Chat, in dem das Bild generiert wurde, sowas fragen wie "Kannst Du mir bitte für ComfyUI, Modell Z Image, aus dem letzten Bild ein Prompt machen?"

Oder in eine LLM das Bild rein packen und (hier isses QWEN3-vl:30b) bitten, das Bild in ein Prompt zu verwandeln. Habe ich mal gemacht:

Hyper-detailed cyberpunk digital painting, cinematic lighting, photorealistic textures, 8k resolution. A tough, tattooed woman with wet, disheveled hair sits cross-legged in a grungy, post-apocalyptic room. She wears a torn, dirty tank top and a dark jacket, holding a blue beer can in one hand and smoking a cigarette (smoke rising). Around her: empty beer cans, an ashtray full of cigarette butts, a laptop displaying code. To her left: a sniper rifle with a scope leaning against the wall. Behind her: a large window reveals a dystopian cityscape with burning skyscrapers, thick smoke, and flying drones/aircraft. Gritty urban decay atmosphere, ultra-detailed textures, cinematic depth, dark moody tones.

ComfyUI_00004_.png
ComfyUI_00007_.png
Qwen-Image-2512_00036_.png
 
Zuletzt bearbeitet:
Geht bei mir auch immer so aber mich irritiert: die Spuren sind vor dem Auto. Ist der rückwärts da rein geslided in die Position? Ist bei meinen Bildern auch IMMER so.
 
Sehr gut, und auch hoffentlich den NVidia Preis drücken (wenn es da im erkorenen Hauptumsatzgebiet abseits der Gaming Sparte endlich Konkurrenz gibt ist das nur gut für alle).
Ergänzung ()

@zidius Gerade durch Deine Gallerie gescrollt. Wow! Respekt, tolle Ideen. Und ich habe dabei für mich gedacht "ne, für Deinen Billigkram brauchste keine andere GPU, da tut es eine mit 16 GB". Du hast echt krasse Ideen und top umgesetzt!
 
Zuletzt bearbeitet:
Ich geb auf und fotografier wieder:
Qwen-Image-2512_00069_.png
;-P

EDIT:
Flux2_00026_.png
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Dennis_BW und Keuleman
LTX 2 ist nun frei verfügbar für alle.

Kann nach einen Video schon sagen das ich es lieben werde :D

 
  • Gefällt mir
Reaktionen: ChatGehPeeTee, braindamage10k und Keuleman
Aber ich denke Du wirst mit deiner 16GB Karte nicht soviel spaß damit haben.

1767816235255.png
 
Auflösung runter, RAM auslagern... joa, wenn es dann nicht geht bin ich offiziell abgehängt.
 
Oder abwarten und hoffen das GGUF Modelle kommen.
 
Uff, najo. Mal testen. Falls es nix wird bin ich halt weiterhin mit Bildern beschäftigt. Video wäre nice to have, bin aber auch bei WAN und so immer wieder bei den Bildern zurück gelandet.
 
Ich habs runtergeladen aber bin noch nicht zum Testen gekommen, macht nen sehr guten Eindruck, auch dass direkt Ton integriert ist gibt einem so viele Möglichkeiten direkt was beeindruckendes oder lustig(eres) zu erschaffen :) und alles in einem (keine Extra Modelle für i2v, etc.). In ComfyUI gabs gestern viele Leute mit Probleme, sollte heute aber besser sein. Es gibt auch noch ein anderes Tool für Videos und da hab ich grad zufällig einen Post eines Users mit 16GB gesehen. Könnte also einen Versuch wert sein ^^

@Keuleman
https://github.com/deepbeepmeep/Wan2GP
https://github.com/deepbeepmeep/Wan2GP?tab=readme-ov-file#-quick-start (Installation via Pinokio, sollte sehr einfach sein, empfohlene User Scripts verwenden)
1767819435378.png
 
  • Gefällt mir
Reaktionen: ChatGehPeeTee
Ganz ehrlich: Ich bin zuversichtlich, dass es läuft. Dauert die Generierung auch lange: Macht nix, hauptsache, läuft. So ticke ich :-) die GPU läuft eh auf Minimum Power Limit und ich kaufe seit jeher die Stromspar-Hardware :-D

EDIT: auf RTX 4070 mit ihren 12 GB und 64 GB RAM schon mal keine Chance!
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: blubberbirne

Ja, es ist schlimm. Aber es ist auf einer RTX 4070 entstanden ;-P Schönen Abend, die Herren!

Edit: Noch ein bisschen mehr Kontext. Klar, RAM und VRAM waren gut voll. OOM Errors in Masse, bis ich auf lowvram gegangen bin beim ComfyStart. GPU Speed reicht eigentlich locker, geht echt fix pro Video. WIe immer die Crux der VRAM. Temperaturen bei der RTX 4070 nie ein Problem, heute Abend ein paar Sachen gemacht, Hot Spot nie über 56,1 Grad. Es ist immer! der VRAM. Tscha. Mache ich nix, nur Mini ITX Systeme hier und keine Chance, 2500 oder 5000 Euro für Grafikkarten auszugeben.

Edit 2: Standard-Workflow mit Standard Modellen etc. Ich glaube hart, dass die 64 GB RAM in der Kiste hier helfen. Ich werde gelegentlich alles noch mal auf der Höllenkiste mit RTX 4070 Ti Super und 128 GB RAM testen, da sollte alles dann gut laufen ;-)
 
Zuletzt bearbeitet:
Es kann sein, dass grade aufgrund des großen Text-Encoder Modells Speicherprobleme entstehen. Da lassen sich aber auch kleinere Varianten verwenden (fp8, bnb4). Generell scheint der LTX-Comfy workflow (von LTX selbst) insb. für kleinere Karten besser zu funktionieren, als der vom ComfyUI-Template.

Der gute Mann von "Ai never sleeps" ;) sagt, dass sogar 2GB VRAM ausrseichen, sofern der Rest im RAM unterkommen kann. Hier das indepth-Video dazu:
 
  • Gefällt mir
Reaktionen: ChatGehPeeTee
Ich hatte den LTX Flow genommen. Und.... ich habe das Modell erst mal wieder gelöscht. Ich mache lieber weiterhin Bilder und warte noch mal die Entwicklung ab. Wenn man ehrlich ist reichen meine Grafikkarten einfach nicht und ich kann/werde keine größere bekommen in absehbarer Zukunft. Also zurück zu den Bildern für mich ;-D
 
Zurück
Oben