Beste (oder zumindest gute) KI für realistische Bildgenerierung

MrTony

Lieutenant
Registriert
Feb. 2015
Beiträge
583
Hallo miteinander!

Ich habe heute mal ein paar Credits gekauft für Dalle2.
Das Ziel war ein paar "Fotos" generieren zu lassen von unterschiedlichsten Motiven.
Ich habe ein Stündchen mit den Prompts herumgespiel, habe versucht mal sehr detailiert zu sein, mal relativ allgemein.

Die Ergebnisse waren aber immer absolut katastropal.
Wenn ich z.B. sage ich möchte ein Foto von George Clooney auf einem Longboard am Times square, sieht die Person weder nach George Clooney aus, noch nach sonst einem richtigen Menschen. Das Longboard erenne ich nur als solches, weil ich weiß, dass es eins sein soll und der Times Square sieht aus wie das Uncanny Valley höchst persönlich.

Ich habe dann versucht einfachere Landschaften/Hintergründe zu nehmen, eine person auf einem longoard mal sehr generisch, mal sehr detailliert zu beschreiben, aber egal, was ich da eingegeben habe, die Bilder waren wirklich immer absolut katastrophal.

Hat jemand von euch das Tool und/oder ähnliche Tools mal verwendet um ein realistisches Bild generieren zu lassen?
Hattet ihr Erfolg? Und falls ja, wie sah euer Prompt aus bzw. welche KI haben ihr verwendet?

Beste Grüße!
 
Ich habe bisher mit Midjourney die besten Ergebnisse hinbekommen.
 
Mh.. Also ich hab Dall-E (2) nie verwendet, aber weiß, dass es rein von der technischen Seite her eine weit-entwickelte Bild-KI ist, von daher ist mir das etwas rätselhaft, warum Du nur Schrott erhalten hast. Was war denn Dein Prompt genau und in welcher Auflösung hast Du gearbeitet?

Models sind auf bestimmte Größen trainiert und weicht man davon ab, gibt's ein Mutationsfest ^^, was allerdings geht und auch zwingend nötig ist, für sehr detaillierte Bilder ist in Upscale-Prozess, allerdings muss das Ausgangsbild in einer dem Model genehmen Auflösung berechnet werden. Dann wird auf Basis dieses Bildes hochskaliert und zugleich durch Denoising werden Details gezeichnet, die vorher nicht da waren, bzw auch Dinge "repariert".

Wenn Du ein 512x512 Bild mit einem Subjekt bspw. Clooney berechnen lässt, ist das erstmal nicht in der Qualität eines guten Bildes, das auf diese Größe reduziert wurde, es ist vielmehr ein Rohling der weiter-berechnet werden muss um Details zu bekommen, die in der kleinen Auflösung (und der kleinen Abbildungsgröße bspw. des Gesichts innerhalb dieser) garnicht möglich sind.

Also du müsstest Dort mal nach einer Upscale/Enhance Funktion schauen.
Wenn Du online mit simplen Prompts gute Ergebnisse haben willst, dann probiere Midjourney, wie @NJay bereits geschrieben hat.

Für die Offline Verwendung (ab ca 6GB Grafikkartenspeicher) empfehle ich Stable Diffusion. Ein damit auf die Schnelle erstelltes BIld ohne weitere Nachberarbeitung (die ohne weiteres möglich wäre um z.B Hände zu "reparieren"):
1690815686279.png


Bei Interesse komm in den Sammelthread.
 

Anhänge

  • 1690813206533.png
    1690813206533.png
    3,9 MB · Aufrufe: 72
  • Gefällt mir
Reaktionen: HisN
MechanimaL schrieb:
Wenn Du online mit simplen Prompts gute Ergebnisse haben willst, dann probiere Midjourney, wie @NJay bereits geschrieben hat.
Wobei ich hier tatsaechlich das Modell als solches meine, das kann man genau wie stable diffusion lokal nutzen.
 
midjourney kann man nur online verwenden, es mag models geben, die sich midjourney (-style xy) nennen und evtl mit midjourney content trainiert wurden, um ähnlich auszusehen, aber mir wäre neu, dass es eine lokale mj version gibt ^^
 
@MechanimaL

"large picture of george clooney riding a longboard on times square"

Keine Ahnung, was ich genau falsch mache,
Ich habe auch die adjektive "realistic" oder "ultra realistic" versucht, aber da wurde es sogar noch schlimmer...
 

Anhänge

  • DALL·E 2023-08-18 16.51.24 - large picture of george clooney riding a longboard on times square.png
    DALL·E 2023-08-18 16.51.24 - large picture of george clooney riding a longboard on times square.png
    1,6 MB · Aufrufe: 97
Mh ich glaub das liegt einfach an dall-e.. Entweder kaufen: Midjourney oder for free lokal oder (weniger Optionen und meistens zensiert: online) Stable-Diffusion probieren.
 
Ich hab jetzt auf die Schnelle mal Stable-Diffusion ausprobiert, die hatten einen Playground.

Siehe Anhang. Also mindestens genau so katastrophal wie Dall E.
Ich werde nochmal bei Midjourney schauen, aber wo ich es gerade testen wollte, schien das nur via Discord zu funktionieren und ich konnte auch keine Probe Bilder generieren lassen sondern hätte gleich was kaufen müssen soweit ich das verstanden habe.
Wenn die Ergebnisse da ähnlich sie die bei Dall E und Midjourney, dann würde ich mich aber massiv ärgern da was für bezahlt zu haben.

Grundsätzlich wundere ich mich aber, was ich "Falsch" mache.
Es gibt ja genug Beispielbilder, auch aus der Community, die extrem gut und realistisch aussehen. Die Beispiele reichen von realistischen Promibildern über diverse Kunstrichtungen bist zu 3D Animationen etc.
Und da sind die Promts ja dabei und teilweise auch einfache Einzeiler. Und die Ergebnisse sind ja um welten besser als das, was ich hier bekomme.
 

Anhänge

  • clooney.jpg
    clooney.jpg
    66,2 KB · Aufrufe: 82
1692450191917.jpeg

von der offiziellen SD (SDXL) Testseite: https://clipdrop.co/stable-diffusion
george clooney riding a longboard at new your times square
hab mich sogar noch vertippt gehabt :D

Bei SD 1.5 braucht man bessere Models, als das ursprüngliche + Upscale Möglichkeiten (in der Regel), dann kann man aber sehr gute Bilder erhalten. Beispiel für ein gutes 1.5er Community-Model (Bilder unten mal nach Reaktionen sortieren). Es gibt Websiten, die dir gegen Geld bessere Models anbieten und mehr Optionen, aber am besten ist die lokale Nutzung. Zwischenlösung mit online Rechenpower (GPU) und bei dir lokal laufenden GUIs gibt's auch, kann Dir aber in den Bereichen jetzt nicht direkt die besten Infos geben, da ich das selbst nie benutzt habe.

Da kannst Du auch nach Registrieruntg mit dem base SDXL Model (schon deutlich besser als Base 1.5) Bilder machen und auch weiter bearbeiten, soweit ich das sehe: https://playgroundai.com

Ansonsten im Netz suchen, unter Berücksichtigung der obigen Info bzg. 1.5 /SDXL https://motricialy.com/sites/stable-diffusion-websites/
 
Zuletzt bearbeitet:
StuttHomeHallo schrieb:
Hallo,
mit dem kostenlosen online Dienst https://dezgo.com/text2image/sdxl habe ich eben zwei Bilder erstellt und dann hochskaliert mit (lokal installiert) Upscayl. Negativ promt habe ich weggelassen. Der Promt steht als Dateiname. Bis auf die Hände ganz

okay.
Moin,

sieht noch nicht nach einem realistischen Foto aus, aber definitiv um Welten besser als das, was mir DallE da angeboten hatte.
Danke für den Tipp!
 
Zurück
Oben