[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Mh das sieht etwas unfertig aus, ich vermute da ist die LORA nicht richtig geladen worden. Kannst du mal einen Screenshot Deiner Settings schicken? Es sollte eher so aussehen, wie im Anhang.
 

Anhänge

  • 1767376714323.png
    1767376714323.png
    4,6 MB · Aufrufe: 59
  • Gefällt mir
Reaktionen: Keuleman
Gerne: Ich vermute, ich habe die Load LoRA Node nicht richtig rein gefummelt:

Screenshot 2026-01-02 194423.png
 
  • Gefällt mir
Reaktionen: ChatGehPeeTee und Keuleman
Schon beeindruckend was ihr hier so kreiert. Ich spiel erst seit ein paar Tagen mit ChatGPT und Bildererstellung rum und es wäre mir ja peinlich meine Versuche hier darzubieten. ^^
 
  • Gefällt mir
Reaktionen: Keuleman
Ach was, Quatsch... hier einer meiner ersten Versuche (lokal erzeugt). Nix peinliches, man lernt halt nach und nach und ich bin auch immer noch nicht am Ende :-)
2025-06-12-20-38-42-1-futuristic_anime_city_colorful_and_vibrant_bright_daylight_detailed_skys...png

Der Output vom Flux 2 ist auch besser geworden, danke für's Nachgucken und die Info, MechanimaL

Flux2_00008_.png
 
Zuletzt bearbeitet:
braindamage10k schrieb:
Schon beeindruckend was ihr hier so kreiert. Ich spiel erst seit ein paar Tagen mit ChatGPT und Bildererstellung rum und es wäre mir ja peinlich meine Versuche hier darzubieten. ^^
Nur keine Scheu :D Wenn Du was schickst gerne noch dabei schreiben mit was es gemacht wurde und wie das Prompt lautet.

@Keuleman OK Problem gelöst :) du kannst auch Bilder damit editieren, Gegenstände/Personen/Hintergründe kombinieren usw.
 
  • Gefällt mir
Reaktionen: Tr8or
MechanimaL schrieb:
wie das Prompt lautet.
Ja! Genau dies!
Wäre toll, wenn bei geposteten Bilder das Prompt auch getextet wird. So kann man auch 1:1 vergleichen, was bei seiner eigenen Software raus kommt.
 
Wenn das Bild direkt aus ComfyUI kommt, kann man es ja in seinen Workflow ziehen, ob das mit den hier geposteten geht kann ich gerade nicht testen.
Fände es auch interessant bei den Bildern hier Prompt und Einstellungen vergleichen zu können.
Ähnlich wie bei Civit, da vergleiche ich das gerne mit Bildern von dort, was bei meiner Hardware rauskommt.
 
High-quality 1970s analog automotive photograph, shot using a 35mm film camera Nikon F2. The image depicts the 911T4rga, parked in a quiet winter landscape. The car is shown in a strong three-quarter front angle, rotated approximately 35 degrees toward the camera, revealing the full side profile, wheelbase, and iconic Targa roofline. It is painted in a period-correct metallic copper/bronze finish, with fine metallic flakes subtly visible. The warm copper tone contrasts beautifully with the cold white snow. Light snow dusts the body and wheel arches. The black vinyl top panel is closed. All windows are closed, with clean reflective glass. The license plate reads “911 Targa” and is clearly readable. Lighting is natural, soft winter daylight from an overcast sky, creating gentle shadows and smooth tonal transitions typical of film. The background features a snow-covered forest and distant mountains, softly out of focus, with faint snowfall in the air.
The image has the visual characteristics of professional 1970s color negative film: slightly muted colors, natural contrast, gentle highlight roll-off, visible but fine film grain, and subtle vignetting. No modern sharpness or digital look. Calm, refined, nostalgic mood. Shot at a low three-quarter angle, medium-wide framing, approximately 50mm lens, moderate depth of field, with the entire car in focus and the background softly separated.
Timeless, elegant, authentic 1970s editorial automotive photography.

Das Bild sollte aussehen, wie in den 70ern geschossen :) Beim Posten auch noch gemerkt, dass das Prompt am Ende nochmal von 50mm redet, also auch beim Prompting gilt, check die KI.. ^^ Das Fenster wollte er übrigens nicht ohne weiteres schließen, zum Glück schneits grade nur sehr leicht :D

1x mit Flux2, Turbo-Lora und der Porsche Targa LORA (gibts auch für andere Modelle wie QWEN und ZIT und "911T4rga" ist das "Trigger Word" für die LORA):
1767452860152.png




ChatGPT 5.2:
1767452399227.png
 
Zuletzt bearbeitet:
Hattest du dein Prompt von Anfang an so „lange“ und detailliert, oder dich rangetastet bis du beim Ergebnis warst?
Ich experimentiere mit einer Person im winterlichem Wald und bin vermutlich zu ungeduldig meine Idee zu beschreiben.
Vielleicht schaffe ich es nachher nochmal. 😬
 
Was für ein Bild möchtest Du denn erstellen, womit und was ist der Zwischenstand?

In dem Fall oben hatte ich ein ChatGPT benutzt, das eigtl. FLUX2-Prompts im JSON-Format ausgibt, aber dann gesagt, schreib es mal als Fließtext, um es auch hier zu posten bzw. zu sehen, ob das überhaupt einen Unterschied macht (bei einfachen Sachen wie hier wahrscheinlich nicht).

Das Motiv, die Farbe usw. hatte ich im Kopf. Man kann sich auch in ComfyUI direkt ein LLM reinsetzen zur Prompthilfe oder lokal eins nutzen (LM Studio und Co.) und dem ein passendes Systemprompt geben. Wenn du schon ’ne sehr konkrete Idee hast, könntest du dir z. B. auch damit helfen, in Deutsch zu schreiben und übersetzen zu lassen, wenn du nicht perfekt fließend Englisch sprichst. Das spart sicher auch Zeit und führt ggf. zu genaueren Ergebnissen.

Oder du hast ein Bild als Vorlage und lässt das analysieren, dann hast du schon mal das als Base-Prompt. Gibt viele Wege – im Grunde macht es aber wsl. am meisten Spaß, sich an das perfekte Prompt von selbst ranzuarbeiten, mit Ideen, die man bekommt, während man die Ergebnisse sieht ^^
 
Zuletzt bearbeitet:
Prompt wie oben...

Hatte auch mal Lust auf den Porsche! Ohne Lora, Flux 2:

Flux2_00015_.png

PS: bei Civtai bin ich immer zu blöd, Loras zu finden und zu QWEN finde ich irgendwie gar keine. Danke für Ihre Aufmerksamkeit ;-D
 
Zuletzt bearbeitet:
Keuleman schrieb:
PS: bei Civtai bin ich immer zu blöd, Loras zu finden und zu QWEN finde ich irgendwie gar keine. Danke für Ihre Aufmerksamkeit ;-D

Models, dann oben rechts bei Filters kannst du alles Mögliche (auch LORA und das Base Model anwählen)
So mache ich es jedenfalls.
Ergänzung ()

male warrior, fog, forest, sword, wounded, tired, full-body front shot, wide angle shot, leather clothing, fur clothing, long grey hair, ponytail,
1024x1024, 40 Steps, cfg 4.0, Euler, simple)
Qwen2512Q4_00008_.png

Meine Unzufriedenheit kam vom PonyRealism_V22,
Die Gesichter waren da immer sehr komisch.
Mit dem Qwen GGUF war der erste Versuch gleich top (1024x1024, 40 Steps, Euler, simple)
z-image_00001_.png

Qwen2512Q4_00009_.png
 

Anhänge

  • Screenshot 2026-01-03 at 22-05-35 Civitai Models Discover Free Stable Diffusion & Flux Models.png
    Screenshot 2026-01-03 at 22-05-35 Civitai Models Discover Free Stable Diffusion & Flux Models.png
    824,1 KB · Aufrufe: 40
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Keuleman
Filter "Time Period" stand auf "Day". patsch Ja, danke :-)
 
  • Gefällt mir
Reaktionen: Dennis_BW
Dennis_BW schrieb:
Meine Unzufriedenheit kam vom PonyRealism_V22,
Die Gesichter waren da immer sehr komisch.

Gerade bei SDXL/Pony/SD1.5 kommt man um einen "Afterdetailer" für's Gesicht häufig nicht rum, außer vll bei einer sehr nahen Aufnahme/Abbildung. Das kann sich aber lohnen, es gibt z.B. für ComfyUI eine Node namens Facedetailer, enthalten im "Impact-Pack" von Ltrdata (derselbe, er auch den custom_node Manager herausbringt). Zusätzlich sollte noch dieses "Sub-Pack" installiert sein. Ein Video dazu.

In SwarmUI ist es etwas einfacher, da kann man einfach per kleinem Befehl im Prompt die Nachbearbeitung eines bestimmten Segments prompten.

Der zugrundeliegende "Trick" ist im Prinzip, dass dann der kleinere Bild-Ausschnitt des Gesichts nochmal in der vollen Auflösung des Modells berechnet wird.

Dennis_BW schrieb:
male warrior, fog, forest, sword, wounded, tired, full-body front shot, wide angle shot, leather clothing, fur clothing, long grey hair, ponytail,
Bei neueren Modellen (nach SDXL) kann man in ganzen Sätzen Prompts schreiben, sie können mehr "verdauen" an Input und du kannst Dir jetzt beispielsweise bei Deinem Prompt zu jedem der verwendeten Wörter eine detailliertere Aussage überlegen und diese locker unterbringen. Das Qwen Bild sieht schon gut aus, nur die Dramatik mit der Wunde kommt nicht so rüber. Beispielsweise, wenn Du Wunde beschreibst usw. könnte es so aussehen (Qwen Image 2512, 40 Steps, 1040x1520, cfg 4) und mit SeedVR2 (sehr zum empfehlender Upscaler) 2x Upscale:

photograph, A male warrior stands facing the camera in a full-body front shot, his posture heavy with fatigue yet resolute, wearing weathered brown leather armor. his long grey hair pulled back into a loose ponytail with strands falling around his stern, battle-worn face, with one hand he is holding a bleeding stomach wound, where blood comes through his fingers and drips down his body. with his other hand he is gripping a scarred sword whose blade bears dried blood and nicks from combat, set deep within a dense, ancient forest shrouded in thick rolling fog that coils around twisted trees and damp moss-covered ground, creating a cold and somber atmosphere, with a cinematic composition using a medium-wide lens.

https://imgur.com/a/wP0kWLH ("Grafik in neuem Tab öffnen" o.ä. für volle Auflösung)
 
  • Gefällt mir
Reaktionen: Dennis_BW
So, hier mal ein Versuch von mir. Benutzt hab ich ganz normal einfach ChatGPT.

Prompt kann ich so nicht sagen, da das Ergebnis eher eine Odyssee von Nachbearbeitung ist (bei 5 Bildern pro Tag zieht sich das).
 

Anhänge

  • fbabfb40-1422-46e6-b73f-e0da7efe877a.png
    fbabfb40-1422-46e6-b73f-e0da7efe877a.png
    2,5 MB · Aufrufe: 55
  • Gefällt mir
Reaktionen: Keuleman
Reich das Prompt mal hier rein, dann könnten wir Dir das mal durch ein anderes Modell jagen :-)

Edit:
Halt... geht ja so gar nicht, ChatGPT. Aber vielleicht magst Du Chattie gelegentlich fragen, ob Du für das aktuell letzte Bild ein Prompt geschrieben bekommst für ComfyUI, gerne mit Negativ-Prompt?
 
braindamage10k schrieb:
So, hier mal ein Versuch von mir.
brauchts denn die Erniedrigung einer Frau - bin verstört ob der Gedanken .... welches des Bild Prompt beinhalten ... bist bestimmt auch ungedient :(
 
ComfyUI_00002_.png
Bild ist schon cool! 80er Warhammer Vibes.

EDIT: Bekommt Chat GPT übrigens immer richtig gut hin, da kommt imo Standard so was "grim dark dirty" raus. Man erkennt oft schon, dass es aus Chat GPT kommen muss :-)

EDIT 2:
ComfyUI_00071_.png
 
Zuletzt bearbeitet:
Keuleman schrieb:
Aber vielleicht magst Du Chattie gelegentlich fragen, ob Du für das aktuell letzte Bild ein Prompt geschrieben bekommst für ComfyUI, gerne mit Negativ-Prompt?
Kann ich das einfach so fragen?

"Erstelle mir ein Negativ-Prompt für ComfyUI."
Ergänzung ()

dms schrieb:
brauchts denn die Erniedrigung einer Frau..
Wenn du das so siehst. Ich seh da keine Erniedrigung.
 
Zurück
Oben