[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Ich mache für WhatsApp Status auch gerne Kaffee-Bilder. Schnell und für den ungeübten KI-Laien "beeindruckend" X-D

Anbei mal so ein Machwerk von mir. Flux1 Schnell weil nur CPU auf der Arbeit...

EDIT: Aber ja, ich habe mich schon gewundert, warum es so ruhig hier war :-D
 

Anhänge

  • ComfyUI_00001_.png
    ComfyUI_00001_.png
    606,3 KB · Aufrufe: 25
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: chr1zZo und qualle
Keuleman schrieb:
EDIT: Aber ja, ich habe mich schon gewundert, warum es so ruhig hier war
Mh irgendwie hat bei mir das Glöckchen garnix angezeigt o_O

Also es sind ja etliche Dinge passiert. U.a. ein paar neue Bild Modelle: Ernie, Hidream o1, Lens und Ideogram v4 (jüngster Release), sowie für Anime: Anima Base und Z-Anime (Z-image Finetune für Anime).

Ideogram4 arbeitet mit json- Prompts und man kann sehr genau bestimmten, was wo im Bild abgebildet sein soll (dafür gibts auch schon ein paar Tools (siehe Video), u.a. zu finden in den KJ Nodes) außerdem kann es (bisher am besten?) Text darstellen, unter den Open Weights/Open Source - Modellen.

Im comfyui workflow ist auch ein Gemma Model in einer Node integriert, um die json Prompts zu erstellen. Die Node von KJ erstellt auch das passende Prompt, anhand des Arrangements, wie man es gemacht hat, in dem Video sieht man die letzte Version davon, wo man auch ein live-preview Bild einschleifen kann (habs in der Form noch nicht getestet, aber der vorherigen).
 

Anhänge

  • chrome_rdaVHopRVZ.mp4
    4 MB
Zuletzt bearbeitet:
Ich hab auch noch gerade was gemacht. Wollte, dass es realistischer aussieht (weniger "verwaschene" Bäume und Sträucher im Hintergrund usw.), aber das hat nicht ganz geklappt...

Leider hab ich mir auch nicht alle Zwischenschritte gemerkt.
 

Anhänge

  • image (6).png
    image (6).png
    1,4 MB · Aufrufe: 19
Guten Morgen!

Zuerst ein Kaffee:

1780736402869.png


A coffee cup on a desk, milk, sugar, a spoon, a beautiful morning setting, photorealistic, realistic, with a lake in the background, gentle sunshine
Negative prompt: People, Bodies, Hands, Border, Frames
Steps: 60, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 1373381348, Size: 512x512, Model hash: 879db523c3, Model: DreamShaper_8_pruned, Version: v1.10.1

Time taken: 6 min. 22.7 sec.

Dann das störende, silberne Objekt unten links entfernen:

1780736505494.png


coffee saucer, shadow, realistic
Negative prompt: Silver object
Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 1369881480, Size: 512x512, Model hash: 879db523c3, Model: DreamShaper_8_pruned, Denoising strength: 0.75, Soft inpainting enabled: True, Soft inpainting schedule bias: 1, Soft inpainting preservation strength: 0.5, Soft inpainting transition contrast boost: 4, Soft inpainting mask influence: 0, Soft inpainting difference threshold: 0.5, Soft inpainting difference contrast: 2, Mask blur: 10, Version: v1.10.1

Time taken: 1 min. 51.3 sec.

Dann noch schärfen und vergrößern:

1780736631763.png


Photorealistic, sharpen, enhance quality
Negative prompt: Blurry, out of focus
Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 4104161990, Size: 512x512, Model hash: 879db523c3, Model: DreamShaper_8_pruned, Denoising strength: 0.15, SD upscale overlap: 64, SD upscale upscaler: ESRGAN_4x, Version: v1.10.1

Time taken: 6 min. 4.1 sec.

... Und schon ist der Kaffee fertig gebrüht. :)

Edit: Für das Schärfen hatte ich Karras verwendet, DDIM sollte aber genau so gut (oder besser) sein.
 
Zuletzt bearbeitet:
Z-Image... meine Güte, echt gutes Ding.
 

Anhänge

  • z-image_00007_.png
    z-image_00007_.png
    3 MB · Aufrufe: 28
  • z-image_00001_.png
    z-image_00001_.png
    4,1 MB · Aufrufe: 24
  • Gefällt mir
Reaktionen: qualle und wrglsgrft
Habe 2-3 Tage mit "Kling AI" (Omni) gearbeitet und bin eigentlich recht zufrieden mit den Ergebnissen. Die sind so realistisch, dass man garnicht erkennen kann, ob das real und nur KI-generiert ist (bis auf wenige Ausnahmen "Glitches")

Nun wollte ich wissen, ob ich das ganze auch selbst offline - also stationär hinbekommen kann, weil die gängigen AI-Tools schon richtig ins Geld gehen

Desweiteren würde mich interessieren, ob man irgendwo unrestricted/uncensored Modelle kostenlos laden kann. Die unrestricted/uncensored Modelle, die ich gefunden habe, sind webbasiert und kosten richtig viel Geld
 
@Casius.A dann brauchst du ne menge GPU Power :) Also ne LLM Maschine. Für Video Power ähnlich zu den Cloud Modellen sollte eine RTX Pro 6000 Pflicht sein, wenn nicht sogar 2. Dann ne menge RAM und ne gute CPU + SSDs.
 
Casius.A schrieb:
Desweiteren würde mich interessieren, ob man irgendwo unrestricted/uncensored Modelle kostenlos laden kann. Die unrestricted/uncensored Modelle, die ich gefunden habe, sind webbasiert und kosten richtig viel Geld
Wenn man auf https://civitai.com/models nach "nude" oder "uncensored" sucht, kommt ein Warnhinweis:

1780864096114.png


Also nein, ich denke, das geht mittlerweile nicht mehr. Zumindest nicht direkt.
 
Kaffee Gang? Guten Morgen <3

Modell: Flux
 

Anhänge

  • krx_still_00034_.png
    krx_still_00034_.png
    904,5 KB · Aufrufe: 9
  • krx_still_00030_.png
    krx_still_00030_.png
    986,3 KB · Aufrufe: 7
  • Gefällt mir
Reaktionen: Keuleman
@qualle jetzt nur noch die Proportionen des Körpers (Sieht aus wie Kinderhände am Menschlichen Körper :D , Augen und der Qualm am Mund ist Strange ^^ Seed Optimieren?
 
chr1zZo schrieb:
jetzt nur noch die Proportionen des Körpers
War noch einer meiner ersten Versuche, ich ändere nix mehr dran ;)

chr1zZo schrieb:
Könnte man machen, oder den positive Prompt anpassen, das wäre glaub ich einfacher

chr1zZo schrieb:
der Qualm am Mund ist Strange
Lass sie doch rauchen, wenn se möchte ;) Allerdings fehlt auch Zigarette/Aschenbecher, etwas unecht
 
Ok, ich habe es noch einmal bearbeitet, und das grüne Logo auf der Tasse (Starbucks?), den Rauch entfernt und den Mund verbessert.

Die Bearbeitung der Unterlippe, sodass es natürlich wirkt, war tatsächlich ein bisschen problematisch. Brauchte ungefähr 20 Versuche. Bin noch nicht so gut in img2img/Inpaint.

An die Hände/Finger hab ich mich aber besser gar nicht gewagt, sehen ja auch schon passabel aus, finde ich.

1. positive: Coffee cup, realistic, light, shadow; negative: Green label
2. positive: background, realistic; negative: smoke
3. positive: lips, mouth, realistic; negative: incomplete, bad anatomy

generiertes_bild.png image (5).png image (6).png image (12).png
 
Zuletzt bearbeitet:
Ah, ok! Auf der Arbeit habe ich das gleiche "Problem". Die SD1.5er Derivate sind super, was auch gut klappt ist Flux 1 Schnell. Vielleicht auch einen Blick wert. Das war auch hier stabil zum Laufen zu bekommen.
 

Anhänge

  • ComfyUI_00006_.png
    ComfyUI_00006_.png
    208,4 KB · Aufrufe: 11
  • Gefällt mir
Reaktionen: chr1zZo und qualle
@Keuleman Flux ist bei Menschen echt nice
 

Anhänge

  • regen_00001_.png
    regen_00001_.png
    1,1 MB · Aufrufe: 11
  • seo_flux_00018_.png
    seo_flux_00018_.png
    998,3 KB · Aufrufe: 11
  • seo_flux_00009_.png
    seo_flux_00009_.png
    1.011,6 KB · Aufrufe: 9
  • seo_flux_00006_.png
    seo_flux_00006_.png
    889,6 KB · Aufrufe: 9
  • seo_flux_00005_.png
    seo_flux_00005_.png
    938,4 KB · Aufrufe: 11
Ich geh lieber zurück zu Kaffee :D (da kann man weniger falsch machen)
Ergänzung ()

@chr1zZo Ich glaube, der kleine Finger ist jeweils zu klein, nicht lang genug:

1780936354137.png
 

Anhänge

  • image (15).png
    image (15).png
    349 KB · Aufrufe: 8
  • Gefällt mir
Reaktionen: chr1zZo
Zurück
Oben