[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

MechanimaL · 7. März 2026

Ja ich dachte auch, weil das sieht besser aus als die Vorgängerversion nicht schlechter ^^

@samuelclemens https://huggingface.co/RuneXX/LTX-2.3-Workflows da findest du - Falls fp8 bei dir schon OOM verursacht - einen gguf workflow und aud die GGUF Modelle nochmal verlinkt (inkl. Infos).

Keuleman · 7. März 2026

Ich glaube, ich verwende erst mal weiter mein 2.0er Gedönz. mit 2.3 nicht so wirklich zufrieden.

Edit: grad noch mal letzten Versuch Bild/Audio zu Video mit LTX 2.3 gestartet, ne, hat gar keinen Zweck. Furchtbare Ergebnisse. Bummer.

Für Text to Video werde ich 2.3 aber weiter testen.

blubberbirne · 7. März 2026

Habe Brauchbware Workflows gefunden: https://huggingface.co/RuneXX/LTX-2.3-Workflows
Die sind echt gut aufgebaut.

MechanimaL · 7. März 2026

Ja, Habe ich schon 2x verlinkt, aber schadet ja nicht ^^ @Keuleman schau mal, dort ist auch einer mit audio input dabei (und halt mit diesen einzelnen kj Dateien). Hier sind ein paar Beispiele davon mit Audio Input:
https://huggingface.co/Kijai/LTX2.3_comfy/discussions/18

falls jemand mit distilled-LORA arbeitet und Platz sparen muss, gibts von KJ jetzt auch eine kleinere Variante: https://huggingface.co/Kijai/LTX2.3_comfy/tree/main/loras

Keuleman · 7. März 2026

@MechanimaL kurz rein geguckt aber mir ehrlich gesagt momentan zu kompliziert, habe gerade einen gut laufenden 2.0er Flow, bei dem bleibe ich für Image und Audio zu Video. Text to Video gucke ich mir noch mal weiter an, das kriegt man ja relativ unkompliziert ans Laufen. Bin ja auch ohne Manager momentan, da ist mir das zu aufwändig, alles an Nodes zu insten in dem 2.3er Flow ;-D

blubberbirne · 7. März 2026

MechanimaL schrieb:
Ja, Habe ich schon 2x verlinkt, aber schadet ja nicht ^^

Echt? Das kommt dabei rum wenn man immer nur rumprobieren ist.

Bei Problemen mit LTX2.3 Prompting hilft wie immer ChatGPT mit folgenden Startprompt:

Lerne von https://docs.ltx.video/api-documentation/prompting-guide wie man LTX 2.3 Prompts richtig erstellt.

Danach ein Bild hochlanden und beschreieben was passieren soll. Das funktioniert wirklich sehr gut. Besser als noch bei LTX2

Keuleman · 8. März 2026

Lange Videos gehen aber muss ja auch was kurzes für die Generation Insta bereit halten.

blubberbirne · 9. März 2026

Ich denke ich werde aus Maik (mit AI) eine KI Meme machen

Keuleman · 9. März 2026

Comedy geht gut, ich hab über ein ähnliches Format nachgedacht. Aber nicht MAIk. Der ist genial!

blubberbirne · 9. März 2026

Keuleman · 9. März 2026

Die Versuche waren da... :-D

Dennis_BW · 10. März 2026

Was ist bei mAIk anders mit der Stimme, dass die nicht direkt nach KI klingt? Finde auch die Mimik nicht so überdeutlich als es öfters bei den KI Videos ist.

Gefällt mir sehr gut 👍

blubberbirne · 10. März 2026

mAIk kommt komplett aus LTX2.3
Die Deutsch Sprache und die Mimik hat sich gegenüber LTX2 stark verbessert.

Keuleman · 10. März 2026

Jetzt die Pointe. Ist nicht KI, @blubberbirne hat sich selbst vor's Mikro gestellt

blubberbirne · 10. März 2026

@Keuleman Das würde ich glatt machen wenn es eine TTS Engine geben würde die Emotionen besser vermittelt. Da habe ich leider noch nichts gescheites gefunden. Wenn da jemand einen Tipp hat, gerne her damit.

Keuleman · 10. März 2026

Da gibt's wohl noch nix. Mich schon mal schlau gelesen... das von Microsoft war wohl am Besten, ist aber wieder zurück gezogen worden. Name entfallen. Gab ein dickes und ein kleines Modell... das kleine gibt's wohl noch, das andere ist in den Tiefen verschwunden.

Hab mich mit "Win Pyvideotrans" für den Moment begnügt. Ist aber auch reine Sprachsynthese mit vorgegebenen Stimmen. Stimmtransfer nein.

samuelclemens · 10. März 2026

Mich würde mal interessieren wie sicher in Bezug auf Datenschutz Comfy & CO sind!?
Klar, man kann einfach die Internetverbindung kappen während man sie benutzt. Aber wer sagt denn das die benutzten offline Modelle nicht doch hintenrum vom Material lernen oder daten zwischengespeichert werden um sie bei Gelegeheit online nach hause zu schicken?

blubberbirne · 10. März 2026

Das wäre schon längst bekannt geworden.

MAIk hat größeres vor:

Keuleman · 10. März 2026

@blubberbirne Hat sich bewährt, von einer Person mit Qwen Image Edit verschiedene "Startposen" zu machen -> dann wirkt jedes Ergebnis noch lebendiger.

Beispiele aktuelles Projekt bei mir:

blubberbirne · 10. März 2026

Das kommt noch

Ich habe einen passenden Workflow den ich eben für einen Mann angepasst habe. Auch hier wieder dank ChatGPT schnell erledigt. Hatte nur einen Prompt übersehen. Deswegen hatte MAIk eben Brüste

[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

Lt. Commander

Lt. Junior Grade

Lt. Commander

Lt. Commander

Lt. Junior Grade

Lt. Commander

Lt. Junior Grade

Anhänge

Lt. Commander

Lt. Junior Grade

Anhänge

Lt. Commander

Lt. Junior Grade

Anhänge

Cadet 4th Year Pro

Lt. Commander

Lt. Junior Grade

Lt. Commander

Lt. Junior Grade

Lt. Commander

Lt. Commander

Lt. Junior Grade

Lt. Commander