[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Keuleman · Freitag um 13:56

Ich mache für WhatsApp Status auch gerne Kaffee-Bilder. Schnell und für den ungeübten KI-Laien "beeindruckend" X-D

Anbei mal so ein Machwerk von mir. Flux1 Schnell weil nur CPU auf der Arbeit...

EDIT: Aber ja, ich habe mich schon gewundert, warum es so ruhig hier war :-D

MechanimaL · Freitag um 21:53

Keuleman schrieb:
EDIT: Aber ja, ich habe mich schon gewundert, warum es so ruhig hier war

Mh irgendwie hat bei mir das Glöckchen garnix angezeigt o_O

Also es sind ja etliche Dinge passiert. U.a. ein paar neue Bild Modelle: Ernie, Hidream o1, Lens und Ideogram v4 (jüngster Release), sowie für Anime: Anima Base und Z-Anime (Z-image Finetune für Anime).

Ideogram4 arbeitet mit json- Prompts und man kann sehr genau bestimmten, was wo im Bild abgebildet sein soll (dafür gibts auch schon ein paar Tools (siehe Video), u.a. zu finden in den KJ Nodes) außerdem kann es (bisher am besten?) Text darstellen, unter den Open Weights/Open Source - Modellen.

Im comfyui workflow ist auch ein Gemma Model in einer Node integriert, um die json Prompts zu erstellen. Die Node von KJ erstellt auch das passende Prompt, anhand des Arrangements, wie man es gemacht hat, in dem Video sieht man die letzte Version davon, wo man auch ein live-preview Bild einschleifen kann (habs in der Form noch nicht getestet, aber der vorherigen).

qualle · Freitag um 22:02

Ich hab auch noch gerade was gemacht. Wollte, dass es realistischer aussieht (weniger "verwaschene" Bäume und Sträucher im Hintergrund usw.), aber das hat nicht ganz geklappt...

Leider hab ich mir auch nicht alle Zwischenschritte gemerkt.

qualle · Samstag um 11:06

Guten Morgen!

Zuerst ein Kaffee:

A coffee cup on a desk, milk, sugar, a spoon, a beautiful morning setting, photorealistic, realistic, with a lake in the background, gentle sunshine
Negative prompt: People, Bodies, Hands, Border, Frames
Steps: 60, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 1373381348, Size: 512x512, Model hash: 879db523c3, Model: DreamShaper_8_pruned, Version: v1.10.1

Time taken: 6 min. 22.7 sec.

Dann das störende, silberne Objekt unten links entfernen:

coffee saucer, shadow, realistic
Negative prompt: Silver object
Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 1369881480, Size: 512x512, Model hash: 879db523c3, Model: DreamShaper_8_pruned, Denoising strength: 0.75, Soft inpainting enabled: True, Soft inpainting schedule bias: 1, Soft inpainting preservation strength: 0.5, Soft inpainting transition contrast boost: 4, Soft inpainting mask influence: 0, Soft inpainting difference threshold: 0.5, Soft inpainting difference contrast: 2, Mask blur: 10, Version: v1.10.1

Time taken: 1 min. 51.3 sec.

Dann noch schärfen und vergrößern:

Photorealistic, sharpen, enhance quality
Negative prompt: Blurry, out of focus
Steps: 20, Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 4104161990, Size: 512x512, Model hash: 879db523c3, Model: DreamShaper_8_pruned, Denoising strength: 0.15, SD upscale overlap: 64, SD upscale upscaler: ESRGAN_4x, Version: v1.10.1

Time taken: 6 min. 4.1 sec.

... Und schon ist der Kaffee fertig gebrüht.

Edit: Für das Schärfen hatte ich Karras verwendet, DDIM sollte aber genau so gut (oder besser) sein.

Keuleman · Samstag um 23:30

Z-Image... meine Güte, echt gutes Ding.

Casius.A · Sonntag um 15:24

Habe 2-3 Tage mit "Kling AI" (Omni) gearbeitet und bin eigentlich recht zufrieden mit den Ergebnissen. Die sind so realistisch, dass man garnicht erkennen kann, ob das real und nur KI-generiert ist (bis auf wenige Ausnahmen "Glitches")

Nun wollte ich wissen, ob ich das ganze auch selbst offline - also stationär hinbekommen kann, weil die gängigen AI-Tools schon richtig ins Geld gehen

Desweiteren würde mich interessieren, ob man irgendwo unrestricted/uncensored Modelle kostenlos laden kann. Die unrestricted/uncensored Modelle, die ich gefunden habe, sind webbasiert und kosten richtig viel Geld

chr1zZo · Sonntag um 22:28

@Casius.A dann brauchst du ne menge GPU Power

Also ne LLM Maschine. Für Video Power ähnlich zu den Cloud Modellen sollte eine RTX Pro 6000 Pflicht sein, wenn nicht sogar 2. Dann ne menge RAM und ne gute CPU + SSDs.

qualle · Sonntag um 22:29

Casius.A schrieb:
Desweiteren würde mich interessieren, ob man irgendwo unrestricted/uncensored Modelle kostenlos laden kann. Die unrestricted/uncensored Modelle, die ich gefunden habe, sind webbasiert und kosten richtig viel Geld

Wenn man auf https://civitai.com/models nach "nude" oder "uncensored" sucht, kommt ein Warnhinweis:

Also nein, ich denke, das geht mittlerweile nicht mehr. Zumindest nicht direkt.

chr1zZo · Montag um 08:04

Kaffee Gang? Guten Morgen <3

Modell: Flux

qualle · Montag um 09:59

chr1zZo schrieb:
Kaffee Gang?

Moin... 😅

Model: Stable Diffusion v1.5

chr1zZo · Montag um 10:06

@qualle jetzt nur noch die Proportionen des Körpers (Sieht aus wie Kinderhände am Menschlichen Körper

, Augen und der Qualm am Mund ist Strange ^^ Seed Optimieren?

qualle · Montag um 10:24

chr1zZo schrieb:
jetzt nur noch die Proportionen des Körpers

War noch einer meiner ersten Versuche, ich ändere nix mehr dran

chr1zZo schrieb:
Seed Optimieren?

Könnte man machen, oder den positive Prompt anpassen, das wäre glaub ich einfacher

chr1zZo schrieb:
der Qualm am Mund ist Strange

Lass sie doch rauchen, wenn se möchte

Allerdings fehlt auch Zigarette/Aschenbecher, etwas unecht

qualle · Montag um 11:56

Ok, ich habe es noch einmal bearbeitet, und das grüne Logo auf der Tasse (Starbucks?), den Rauch entfernt und den Mund verbessert.

Die Bearbeitung der Unterlippe, sodass es natürlich wirkt, war tatsächlich ein bisschen problematisch. Brauchte ungefähr 20 Versuche. Bin noch nicht so gut in img2img/Inpaint.

An die Hände/Finger hab ich mich aber besser gar nicht gewagt, sehen ja auch schon passabel aus, finde ich.

1. positive: Coffee cup, realistic, light, shadow; negative: Green label
2. positive: background, realistic; negative: smoke
3. positive: lips, mouth, realistic; negative: incomplete, bad anatomy

Keuleman · Montag um 11:57

SD1.5. Dafür war es schon sehr gut!

qualle · Montag um 14:57

Keuleman schrieb:
SD1.5

Eigentlich wars DreamShaper 8

... auch schon über ein Jahr her.

Keuleman · Montag um 14:58

Ist doch nen destilled SD1.5er (im Herzen :-D). Aber ja, hast recht.

qualle · Montag um 15:01

Etwas anderes läuft auf meiner CPU (ohne GraKa) auch nicht... in annehmbarer Zeit.

Keuleman · Montag um 15:05

Ah, ok! Auf der Arbeit habe ich das gleiche "Problem". Die SD1.5er Derivate sind super, was auch gut klappt ist Flux 1 Schnell. Vielleicht auch einen Blick wert. Das war auch hier stabil zum Laufen zu bekommen.

chr1zZo · Montag um 17:18

@Keuleman Flux ist bei Menschen echt nice

qualle · Montag um 18:29

Ich geh lieber zurück zu Kaffee

(da kann man weniger falsch machen)

Ergänzung (Montag um 18:33)

@chr1zZo Ich glaube, der kleine Finger ist jeweils zu klein, nicht lang genug:

[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Lt. Junior Grade

Anhänge

Lt. Commander

Anhänge

Cadet 3rd Year

Anhänge

Cadet 3rd Year

Lt. Junior Grade

Anhänge

Cadet 1st Year

Commodore

Cadet 3rd Year

Commodore

Anhänge

Cadet 3rd Year

Commodore

Cadet 3rd Year

Cadet 3rd Year

Lt. Junior Grade

Cadet 3rd Year

Lt. Junior Grade

Cadet 3rd Year

Lt. Junior Grade

Anhänge

Commodore

Anhänge

Cadet 3rd Year

Anhänge