[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

MechanimaL · Gestern um 23:16

Also zur Steigerung der Qualität (mit fp8-non distilled) Modell:

hab ich bisher tatsächlich hauptsächlich die verwendete Auflösung ausmachen können und
ggf. ein wenig der/die sampler (ltx verwendet res_2_s).
Steps/sigmas erhöhen hat nichts gebracht, wobei ich bei den Sigmas (=steps im 2. Sampler) wissen müsste, welche besser wären, als die vorgegebenen (hier ist insgesamt noch testing ground).
FPS erhöhen kann bei Action mäßigen Sachen auf jedenfall was bringen, aber bei langsameren Szenen zu anderen unerwünschten Nebeneffekten führen.
Distilled Lora von 1 auf 0.6 im comfyu worfklow würde ich empfehlen, verringert Fehler

Keuleman · Gestern um 23:36

Ich bin jetzt mal so frei und poste das hier so, habe ich heute zusammen gebastelt:
It's all in the prompt.

Tr8or · Heute um 08:48

Keuleman schrieb:
20 Sekunden, 720x480, fett, ngl. Wieder der RTX 4070 Rechner.

Und du kannst mir mal genau sagen was du runtergeladen hast

Meine Versuche mit Videos sind absolutes Versagen. Bisher mit wan2.1_t2v_14B_fp8_scaled getestet, allerdings fehlen die ganzen Einstellungen unter "Video".
Und InPaint suche ich auch noch vergeblich

Schon ein Umstieg...

Keuleman · Heute um 09:03

ComfyUI, da ltx-2-19b-distilled-fp8, sogar als safetensors. Als Text Encoder den gemma_3_12B_it_fp8_scaled. Das dann in den Standard Workflow rein. Und alles, was geht, auf CPU. Nach dem Laden der Modelle etc für 10 Sekunden Video übrigens ziemlich exakt eine Minute. Wie gesagt, auf sehr im Schonmodus arbeitender Hardware.

Dennis_BW · Heute um 10:45

@Keuleman wenn ich dein video sehe und mit welchem Einstellungen in deinem System du arbeitest, besteht ja auch bei mir noch Hoffnung brauchbare kurze Videos zu erstellen. Trotz AMD Nachteil.

Keuleman · Heute um 10:54

Ja, ist Testerei, die beiden haben gut bei mir funktioniert. Rest vom Flow ist geblieben, halt alles, was geht, ab in den RAM geschoben.

MechanimaL · Heute um 11:15

@Keuleman Das könnte eine Werbung für einen Prompt Generator sein

@Tr8or ich schreibe Dir gleich mal ein paar Tipps dazu. Wenn du im comfyui workflow Bereich mit workflows von außerhalb oder Templates arbeiten möchtest, ist noch zu beachten, dass du entweder in comfyui oder swarmui das Modell-Verzeichnis anpasst, damit entweder die Modelle schon comfyui konform liegen oder comfyui zusätzlich im swarm-verzeichnis die Modelle sieht (kann dir das gerne auch genau erklären).

Wenn Du zb das ComfyUI Modell Verzeichnis benutzt, dann kannst Du es in SwarmUI wie auf dem Screenshot einstellen (comfyui Verzeichnis anpasse, wo es auf Deinem PC liegt), danach sieht sowohl SwarmUI alles, was es braucht, als auch die Workflows in ComfyUI (/-Bereich):

Inpainting ist einfach. Du wählst ein Bild aus (entweder aus History oder was grade erstellt wurde, dann gehst Du auf "Edit image"). Dann öffnet sich eine Arbeitsfläche mit dem Bild und Tools, wie einem Pinsel, mit dem Du den Bereich markieren kannst.

Auf der linken Seite unter 1: Kannst Du das Denoising einstellen, hier genannt Creativity und unter 2 die Option ist das, was in anderen Tools häufig "inpaint masked only" oder ähnlich heißt, dann schaut sich das Modell nur den Markierten Bereich in der vollen Auflösung an. Kann besser sein, aber kann auch wegen fehlendem Kontext nochmal herausfordernd sein. Praktisch dabei: Du hast einen Wert, mit dem Du den BIldauschnitt, der betrachtet wird so anpassen kannst, das genügend Kontext da ist, und trotzdem mit höherer Auflösung in dem Bereich gearbeitet werden kann. (Du siehst im Preview, bei der Bearbeitung auch welcher Bereich um die Maske herum betrachtet wird.)

SwarmUI ist nicht primär auf Video ausgelegt, aber unterstützt es häufig. Es ist ein Tool für die vereinfachte Anwendung von Bilderstellung/-bearbeitung und Verwaltung der Modelle/Bilder usw. mit Hilfe von ComfyUI als Backend. Ich selbst wechsele für Video in den comfyui-workflow Bereich.

Diese Seiten für Modelle in SwarmUI am besten bookmarken, da steht welche Werte empfohlen sind, wie die Anwendung erfolgt, welche Dateien benötigt werden pro Modell: Bild und Video.

Keuleman · Heute um 11:28

@MechanimaL Genau dafür isses gedacht :-) Übung für "brand" Bildgenerierung mit ComfyUI. So Kurs-mäßig, ganz basic gehalten: was kann man machen (Einfärben, generieren, verändern) und dann den "Wow-Effekt" zeigen :-) "It's all in the prompt" so als "Du hast es in der Hand".

Ja, ist Spielerei von mir :-P

Tr8or · Heute um 16:19

Dank Euch beiden.
Ich habe es erstmal aufgegeben und werde die Tage wieder frisch rangehen.
ltx-2-19b-distilled-fp8 konnte nicht geladen werden, da die Datei nicht existiert. Aber sie liegt da wo sie sein soll.

ChatGehPeeTee · Heute um 16:31

Keuleman schrieb:
20 Sekunden, 720x480, fett, ngl. Wieder der RTX 4070 Rechner.

@MechanimaL

346 Sekunden mit Gedönz laden.

Welche Software braucht man dafür alles? 😅
Gibt’s dafür „easy“ installer?

Edit: Ah ok

Suche

[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

MechanimaL

Lt. Commander

Keuleman

Ensign

Tr8or

Commander

Keuleman

Ensign

Dennis_BW

Cadet 4th Year Pro

Keuleman

Ensign

MechanimaL

Lt. Commander

Keuleman

Ensign

Tr8or

Commander

ChatGehPeeTee

Lieutenant