Text to Picture AIs

Status
Für weitere Antworten geschlossen.
Ich fände es gut, wenn es dazu auch in Computerbase ein eigenes Unterforum "Künstliche Intelligenz" geben könnte. Die Community rund um KI / AI ist ja inzwischen recht groß und es geht ja nicht nur um künstliche Bilderzeugung.

Künstliche Bilderzeugung:
siehe der Thread hier. Ich gebe einen Text ein und die KI erzeugt mir ein Bild dazu. Oder sie zeichnet ein Bild an den Rändern weiter, oder sie skaliert es hoch (mit krass guten Ergebnissen!)
Software: Stable Diffusion (lokal), Dall E (Cloud), Midjourney (Cloud)

Künstliche Videoerzeugung:
Statt Einzelbilder erzeugt die KI ein Video zu einem Textprompt. Seien es Animationen eines Bildes mit Veränderungen oder ganze Geschichten. Habe ich mich in der Tiefe noch nicht mit beschäftigt.
Hier mal eine nette Animation zur menschlichen Evolution, alles komplett durch eine AI erzeugt: https://www.reddit.com/r/StableDiffusion/comments/xultoj/human_evolution_where_are_we_going/

Erzeugung von Geschichten:
Neben der künstlichen Bilderzeugung ist gerade ein stark wachsender Bereich der, der künstlichen Texterzeugung. Ich schreibe 3-5 Sätze einer Geschichte und die KI schreibt dann 5 Sätze dazu. Und die sind richtig gut und passen.
Sofware: KoboldAI (lokal), Novel AI (Cloud), Holo AI (Cloud)

Erzeugung von Textadventures:
Ähnlich der Texterzeugung, nur generiert die AI on the fly ein Textadventure. Man tippt einfach ein paar Sätze ein, die man macht und die KI generiert, wie die Geschichte weitergeht. Man kann vorher Regeln definieren, zum Beispiel, ob es sich um ein klassisches Mittelalter-Rollenspiel handelt, oder man ein Superheld ist oder im Star Wars Universum spielen will.
Software: KoboldAI (lokal), Novel AI (Cloud), Ai Dungen (Cloud).

Und sicher demnächst noch viele weitere Bereiche. Das Spannende an diesem Bereich ist, dass man dafür High-End Grafikkarten braucht. AI braucht VRAM ohne Ende. 16GB VRAM reichen bei KoboldAI gerade mal für das gute 6B Model (6B heißt, dass das Modell 6 Billionen Parameter berücksichtigt). Ein sehr gutes 13B Modell braucht schon fast 30 GB VRAM. Das kann im Moment noch keine (einzelne) Consumer Karte. Es werden aber mehrere Karten in einem System unterstützt, deren VRAM sich dann addiert, oder man kann Clouddienste nutzen, wo man sich Systeme mit mehreren NVidia 3090 oder RTX6000 minutenweise mieten kann.
 
  • Gefällt mir
Reaktionen: MechanimaL und Der Kabelbinder
Alles was du ansprichst ist auch wieder nur ein Teilbereich der KI, der des Generierens, häufig mit GANs gelöst ;) Daneben gibt es ja noch so Sachen wie Mustererkennung, Vorhersagen treffen, etc.
 
Wir werden zumindest schon bald einen allgemeinen Sammler für text-to-image Modelle haben. @MechanimaL hat dahingehend schon etwas vorbereitet.

Stay tuned. :)

Ob sich mit der Zeit auch weitere Bereiche anschließen werden, wird sich zeigen. Das hängt von der Nachfrage in der Community und dem technischen Bezug ab.
 
  • Gefällt mir
Reaktionen: Maviapril2
Maviapril2 schrieb:
Alles was du ansprichst ist auch wieder nur ein Teilbereich der KI, der des Generierens, häufig mit GANs gelöst ;) Daneben gibt es ja noch so Sachen wie Mustererkennung, Vorhersagen treffen, etc.
Ja, aber das sind die Teilbereiche, die auch inzwischen im Consumerbereich genutzt werden. Die anderen Bereiche werden ja eher ausschließlich im Unternehmens-/Forschungsbereich eingesetzt.
 
Gut aus dem Kontext komme ich auch eher, denke aber auch, dass ich da nicht der einzige bin ;) Wenn man es nur auf den Consumerbereich beschränkt, ist es wohl wieder etwas weniger.

@Der Kabelbinder @MechanimaL sehr cool, bin schon gespannt ;)
 
  • Gefällt mir
Reaktionen: Pyrukar, Der Kabelbinder und Maviapril2
hallo zusammen,
da dieses Thema wohl bereits mal erstellt wurde, hier eine aktualisierte Frage an euch. Die Frage bei Google, welcher AI Picture Generator derzeit als Freeware, also wie Chat GPT, der "beste" ist liefert mir keine wirklich verwertbare Antwort.
Eure Meinung/Empfehlung? Ich würde gerne eine Einladungskarte in einem Popup Design erstellen und deswegen mal so ausprobieren was es gibt :)
Dankeschön
 
Status
Für weitere Antworten geschlossen.
Zurück
Oben