Welches Modell, um alten Comic-Stil "wiederzubeleben"?

Vorkosigan

Cadet 3rd Year
Registriert
Nov. 2022
BeitrÀge
58
Hallo allerseits, ich probiere jetzt schon seit Wochen immer mal wieder mit verschiedenen Bild-KIs herum.

Mein Problem: Ich habe zwar ein Anliegen - aber leider viel zu wenig Ahnung von dem Thema 😔


Ich habe einen großen Fundus an handgezeichneten einfachen Objekt und Bildern in einem einfachen Comic-Stil mit klaren Linien und Konturen. Diese Zeichnungen habe ich vor vielen Jahren bei einem Illustrator in Auftrag gegeben und mitsamt sĂ€mtlicher Rechte erworben.

Jetzt bin ich auf die Idee gekommen, mit diesen alten Bildern noch mal ein Projekt zu machen - wahrscheinlich ein kleines Buch fĂŒr meine Kids in der Schule.

Dabei gibt es drei Probleme:

1. viele der damals digitalisierten Zeichnungen haben eine - fĂŒr heute - viel zu geringe Auflösung.
2. manche Objekte odere Bilder, die ich heute brauchen wĂŒrde, gibt es in meiner Sammlung gar nicht.
3. der damalige Illustrator lebt nicht mehr oder arbeitet nicht mehr - oder ich kann ihn auf jeden Fall nicht erreichen.

Meine Idee war nun: Ich gebe einem KI-Tool die Originale als Vorlage und lass mir auf dieser Grundlage neue und/oder höher aufgelöste Bilder erzeugen.

Nur, wie mache ich das am besten? Oder mit welchem Modell wĂŒrde das am besten funktionieren?
Irgendwie weiß ich aktuell gar nicht, wo oder womit ich da anfangen sollte.

Wenn ihr da ein paar gute Tipps fĂŒr mich hĂ€ttet, wĂŒrde mir das sicher helfen. 😀
 
Vorkosigan schrieb:
einfachen Comic-Stil mit klaren Linien und Konturen
Klingt als könnten Vektorgrafiken hier einen guten Einsatz finden. Hast du dich damit schon mal beschÀftigt?
Gibt ja bspw. Onlinekonverter die deine Pixelgrafiken in Vektor umwandeln. Klingt fĂŒr mich erstmal vielversprechender und einfacher als "KI".
 
  • GefĂ€llt mir
Reaktionen: Vorkosigan
Bzgl. KI-Lösung, kurz gefasst:

Online: Nano Banana Pro
Offline: Qwen Image Edit 2509

Upscaling vorhandener Bilder (mit oben genannten Modellen oder auch anderen KI Upscalern) sollte kein Problem sein. Den Stil fĂŒr neue Bilder zu verwenden sollte auch machbar sein, mĂŒsste man testen. Ich tippe es geht mit dem genannten online-Modell ohne weiteres, offline könnte es auch funktionieren.

Wenn Du möchtest, poste im Sammelthread mal ein Beispiel, dann können wir mal probieren ;)
 
  • GefĂ€llt mir
Reaktionen: Vorkosigan
... vielen Dank fĂŒr eure Antworten. Ich bin jetzt erst mal ein paar Tage weg vom Computer.

Danach werde ich testen. Mit ChatGPT habe ich auch schon ein bisschen rumprobiert. Aber es gibt ja sicher Tools, die da spezialisierter und bei so einem Thema dann besser aufgestellt sind.

Ich habe auch mal "Draw Things" installiert und versucht, mich da reinzuarbeiten. Aber da fehlt mir ganz viel Basiswissen - aber das kommt vielleicht im Laufe der Zeit noch. Der Winter hat ja gerade erst begonnen 😀
 
Kurze Zwischen-RĂŒckmeldung: Der Tipp von @MechanimaL war bisher am zielfĂŒhrendsten.

Nano Banana eigenet ich sich sehr gut dafĂŒr. Da hab ich schon ganz schöne Ergebnisse erzielt. Meist ein bisschen zu "glatt" und zu "perfekt" - aber nur ein bisschen! In DrawThings habe ich auch ein Modell "trainiert" (also mit meinem bescheidenen Wissen diesbezĂŒglich), und auch da bekommt man im Laufe der Zeit manche Dinge gut hin. Ist allerdings im Vergleich zu einer "aus-der-TĂŒte"-Lösung, wie Nano Banana sehr mĂŒhselig.

Aber ich bleibe dran und experimentiere weiter. Ich denke, das lohnt sich, weil man bei dieser Arbeit nicht dĂŒmmer wird, sondern im Gegenteil jeden Tag was Neues lernt. 😀
 
Technisch gesehen ist das ein Use-Case fĂŒr eine Style-LORA Training auf Basis einen aktuellen Bild-Generierungsmodells.

Man wirft dem Modell eine Reihe von Beispielen hin (512x512 px bis 1024x1024 px reichen als Grundlage) sowie eine Caption, die beschreibt, was das Bild zeigt....damit trainiert man dann die LORA.....dieses Modell lernt dann, den Stil auf einen allgemeinen Use-Case anzuwenden.

Geht auch lokal, hier mal ein Video was es anschaulich zeigt:

 
  • GefĂ€llt mir
Reaktionen: Vorkosigan
Vielen Dank fĂŒr deine Antwort. Die selbst-trainierten Modellen (mit DrawThings) sind prinzipiell schon gar nicht sooo schlecht. Da könnte ich ziemlich sicher mit Einsatz von viel Lernarbeit und Zeit ganz brauchbare Ergebnisse mit erzeugen.

Leider leiden bisher alle meine - wie gesagt, ich bin blutiger AnfĂ€nger! - Versuche unter den frĂŒher typischen "Fehlern" in den Bildern. Insbesondere HĂ€nde sind nach wie vor ein Problem. Die sehen oft ziemlich seltsam aus und haben hĂ€ufig mehr oder weniger als 5 Finger an jeder Hand. :confused_alt:

Ein anderes Problem sind - nicht ganz so hĂ€ufig - doppelte oder dreifache Köpfe von dargestellten Charakteren. DafĂŒr hĂ€tte ich - außer fĂŒr einen Monkey Island - Clone - leider keine Verwendung ;)

Da das immer wieder vorkommt, nehme ich an(!), dass das vielleicht an der zugrunde liegenden Technik liegt.

Auf der anderen Seite kommt so etwas zum Beispiel bei NanoBanana so gut wie nie vor. Das stammt offenbar von Menschen, die das VIEL besser beherrschen als ich. 👍

Das Video schaue ich mir heute Abend mal in Ruhe an - leider muss ich zwischenzeitlich auch mal an Projekten arbeiten, die fĂŒr die Bezahlung meiner Miete notwendig sind ...
 
Hmm man kann doch wie hier auch bereits gesagt z.b. in Gemini Pro ein Bild hochladen und sagen erzeuge mir im Stil dieses Bildes folgendes..... das funktioniert meist echt gut.

z.B. ich hab Bild 1 hochgeladen und gesagt "can you make a picture in the style of the uploaded picture where sheep are playing soccer " Und Bild 2 wurde erzeugt.

Wenn das hochgeladene Bild z.b. aus mehreren Bildern ist - einfach zu einem grösseren zusammenkopiert glaube ich funktioniert das relativ gut daraus neue Bilder zu generieren - das war jetzt nur ganz schnell mal.
 

AnhÀnge

  • 1768377871809.png
    1768377871809.png
    42,1 KB · Aufrufe: 14
  • 1768377938966.png
    1768377938966.png
    1,1 MB · Aufrufe: 11
Zuletzt bearbeitet:
  • GefĂ€llt mir
Reaktionen: Vorkosigan
Wie sieht es eigentlich inzwischen mit der KontinuitÀt bei den Bildgeneratoren aus?
Vor einem Jahr war es mir noch unmöglich trotz Wochenlanger Experimente auch nur eine Handvoll zueinander passender Bilder zu generieren fĂŒr ein Spiel mit Story im Comicstil.
Auch wenn der Stil an sich einigermaßen beibehalten werden konnte war es schier unmöglich Charaktere, Locations usw beizubehalten.
Interessieren wĂŒrde mich vor allem eine KI die auch grobe Skizzen in ein vorbestimmten Stil umwandeln kann und auch "neue" Stile erlernen könnte die man vorsetzt zb von eigenen Zeichnungen.
 
  • GefĂ€llt mir
Reaktionen: Vorkosigan
ZurĂŒck
Oben