News Visuelle Erweiterung: ChatGPT kann Bilder mit Dall-E 3 generieren

Also das da vieles geblockt wird bei DALL-E 3 ist mir auch aufgefallen. Aber so ganz richtig scheint das nicht zu funktionieren oder ich hab einfach die falschen Beschreibungen benutzt. "Anatomie der Frau Oberkörper" = geblockt. "nackte Brüste einer Frau" = geblockt. Zwei Männer die fliegen und sich dabei küssen = ist ok. Genau wie zwei männer am strand mit einem weiblichen alien die gerade karten spielen = auch ok. Karikatur von Bill Gates wiederum geblockt. Gibt es keine Möglichkeit diese Einschränkungen zu umgehen?
 
Midjourney (5.1 und neuer) hat noch einen Vorsprung hinsichtlich der Generierung von Gesichtern, zumindest ist das mein Ergebnis nach einigen Tests heute. Ich werde beides benutzen.
 
Ich lasse KI-Modelle lieber lokal laufen, bei ChatGPT kommt es einem mittlerweile vor als würde man mit dem Gleichstellungsbeauftragen der Grünen Jugend reden.
 
  • Gefällt mir
Reaktionen: bl4ckbird, Zhan, chivas91 und 5 andere
Habe mal eine junge Dame erstellt. ChatGPT bzw DALLE hat ihr eine Oberweite jenseits von gut und böse verpasst. Als ich diese dann „medium“ oder „small“ generieren wollte, wurde mir das aufgrund von Inhaltsbeschränkungen verwehrt. Aber die aus der Bluse rausspringenden Ballons waren ok…
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Rickmer, PERKELE, Schneee und eine weitere Person
Schön wäre es, wenn man eigene Bilder hochladen könnte. Z.B. eine Skizze, die die KI dann colorieren soll.
 
@Andy
Nicht ganz passend zu dem Thema hier, aber DS Automobile integriert in einem 6 monatigen Pilot ChatGPT in die Sprachsteuerung im Auto (DS Iris System).

Zitat aus der Mail:

„Guten Tag xxxxxxx

DS Automobiles ist die erste Automobilmarke in Europa, die SoundHound Artificial Intelligence powered by ChatGPT API1 in ihren Fahrzeugen integriert.
Ab sofort verfügt Ihr DS IRIS SYSTEM über diese innovative Funktion, die Ihnen einen intelligenten Reisebegleiter bietet und damit jede Fahrt noch angenehmer macht.

Nehmen Sie bis Februar 2024 an unserem Pilotprogramm teil. Wenn Sie zu den ersten 20.000 Abonnenten gehören, können Sie ChatGPT in Ihrem DS für bis zu 6 Monate kostenlos testen.

Mit freundlichen Grüßen

DS Automobiles Deutschland“


ENTDECKEN SIE CHATGPT​
Sprechen Sie mit Ihrem virtuellen Reiseassistenten ganz normal, wie mit einem menschlichen Gegenüber, und formulieren Sie klare Fragen und Anweisungen.

Sie könnten beispielsweise sagen: "OK IRIS, gib mir Vorschläge für die besten Sehenswürdigkeiten, die man während einer dreistündigen Tour durch Paris besuchen sollte."​
 
  • Gefällt mir
Reaktionen: Andy
  • Gefällt mir
Reaktionen: Mika46
Raucherdackel! schrieb:
Langsam aber stetig fällt der Pionier ChatGPT immer weiter zurück.

Schau dir erstmal an was DALL-E 3 kann. Da kann VIELLEICHT Midjourney gerade noch so mithalten. Gegenüber Stable Diffusion ist DALL-E 3 um mindestens eine, wenn nicht zwei Generationen voraus. Die Kombination aus GPT4 (Interpretation und Prompt erstellung) und DALL-E 3 (Erstellung des Bildes) ist wirklich, WIRKLICH gut mittlerweile.
 
  • Gefällt mir
Reaktionen: emerald
Silencium schrieb:
Ich halte von MS nichts.
OpenAI sollte mal Paypal als Bezahloption anbieten. Immer dieses nervige bezahlen mit CC - wer macht das freiwillig?

Ansonsten nutze ich ChatGPT wirklich sehr gerne. Bilder sind nicht meine Domäne, werde es jedoch in absehbarer Zukunft auch einmal ausprobieren.

Es gibt auch Prepaid CC's. Kann man für sowas ganz gut nutzen.

lg
 
  • Gefällt mir
Reaktionen: PERKELE und Silencium
Ich finde die immer stärker werdende Zensur bei all den KI-Systemen mittlerweile auch eher nervig und hinderlich. Es muss ja kein NSFW oder Gewalt sein, es reichen ja schon harmlose Sachen. ChatGPT wollte mal keine Geburtstagskarte mit dem Schlagwort "saufen" erstellen, "weil das für den Anlass unangemessen sei". :rolleyes: Witze sind mittlerweile auch kaum noch möglich, "es könnte sich jemand dabei unwohl fühlen". Photoshop hat schon Generierungen geblockt, als ich z.B. ein Bild mit drei Frauen links und rechts erweitern wollte (Gesichter dann mit nem schwarzen Rechteck in ner neuen Ebene übermalt, schon gings). Waffen sind auch gerne verboten, selbst wenn man ein Stockfoto von nem Jäger mit Gewehr darstellen will.

Das ist ein Werkzeug, das soll mir nicht vorschreiben, was ich erstellen kann und was nicht. Macht meine Kamera ja auch nicht. Und meine Festplatte beschwert sich auch nicht über "unangemessene Daten".
 
  • Gefällt mir
Reaktionen: piccolo85, chivas91, Schneee und 2 andere
DALL-E weigerte sich auch Strickt einen Prompt zu akzeptieren in dem "Bier" vorkam. So gut das Teil auch ist, die Einschränkungen sind schon am Rande des lächerlichen.
 
Hab Dall-E 3 auch mal direkt ausprobiert als es bei Bing angeboten wurden. Hab jedes Familienmitglied aus Spaß und zum Testen nach 3 Prompts für Bilder gefragt und denen dann die Ergebnisse dazu geschickt. 50%(!) der Prompts wurden geblockt.



:freak:
 
GeleeBlau schrieb:
Bei Bing stehen schon Worte wie "attractive" auf der Liste wenn es sich auf Personen bezieht.
Reglohln schrieb:
Was schon aus dem absolut subjektiven Charakter des Wortes hervorgeht. Das ist keine "Beschreibung des Körpers".
Das mag man im ersten Moment denken, ist aber tatsächlich weitaus weniger subjektiv, als angenommen.

Es gibt bestimmte kulturelle Unterschiede aber sogar inter-kulturelle Übereinstimmungen.

Man sieht das z.B. auch bei Experimenten, wo man viele Probanden die Attraktivität von Menschen rein Anhand von Einzelbildern entweder binär in "ja/nein" oder auf einer Skala bewerten lässt. Da kommen tatsächlich in jedem Datensatz, den ich bisher gesehen habe, signifikante Cluster heraus.

Natürlich, wie gesagt, gibt es bestimmte Kulturen die bestimmte Merkmale unterschiedlich bewerten, aber generell gibt es tatsächlich mehr Übereinstimmungen als Gegensätze.

Auch psychologisch betrachtet gibt es ja durchaus Forschung, dass wir instinktiv Menschen bevorzugen / als attraktiv ansehen, die über biologische Merkmale verfügen, die uns gesunden Nachwuchs versprechen.

Also ja, das hat natürlich gewisse Grenzen und bestimmte Ausprägungen, die subjektiv sind aber generalisiert betrachtet gibt es da durchaus auch jede Menge Faktoren, die man objektiv betrachten kann und die die Mehrheit von Probanden auch reproduzierbar in Experimenten so sieht.
 
  • Gefällt mir
Reaktionen: bl4ckbird
FrAGgi schrieb:
So ziemlich die gesamte Welt. 🤷‍♂️ Nur Deutschland hat irgendwie ein Problem mit Kreditkarten.
Ich zahle so ziemlich alles mit der Kreditkarte. Vom Brötchen beim Bäcker, bis zum Wocheneinkauf oder dem Bier in der Kneipe bishin zu ChatGPT Plus. Sehe da jetzt keinen Nachteil. Schon gar nicht gegenüber PayPal.
Datenschutz?

Ich zahle auch vieles seit über 10 Jahren mit Kreditkarte. Dennoch bleibt der Punkt, dass dann alles was du wann, wo kaufst, mit der Karte verknüpft wird. Sprich, ein Bewegungsprofil erstellt wird, dass mittels Datenbanken und intelligenter Algorithmen mehr über dich aussagt, als du von dir selbst weist.

Deswegen mag ich auch keine Accountbindung. Da werden viel zu viele Daten gesammelt, die vor allem in Verbindung mit ChatGPT bei den meisten unbedarften Anwendern in viel zu sensible Gefilde eindringen. IT-Verständniss ist ja das eine, Datenschutzverständniss das andere. Viele bringen beides leider irgendwie nie zusammen. Ich nutze ChatGPT nur in der Anmeldungsfreien kostenlosen Version. Dann ist es eben nur 3.5. Wenn ich mal auf Pro wechsle, werde ich mich hüten, damit etwas anzustellen, was thematisch ausserhalb meiner Arbeit liegt.

Auch ein Grund warum ich niemals einen Youtubeaccount haben werde. Das geht google einfach nichts an, welche Themen ich mir zu welcher Zeit anschaue und welche Inhalte ich mir wiederholt oder mal nicht in 2facher Geschwindigkeit anschaue, weils besonderer Aufmerksamkeit bedarf. Daten die mir viel zu sensibel sind, als dass sie über einen Account jahrelang dauerhaft mit meiner Person (z.B. bezahlter ProAccount) für immer verknüpft werden. Irgendein zweiter Hitler wird die Daten die heute gespeichert werden in Zukunft mittels AI automatisiert auszunutzen wissen.
 
Zuletzt bearbeitet:
Jakxx schrieb:
Schau dir erstmal an was DALL-E 3 kann. Da kann VIELLEICHT Midjourney gerade noch so mithalten. Gegenüber Stable Diffusion ist DALL-E 3 um mindestens eine, wenn nicht zwei Generationen voraus. Die Kombination aus GPT4 (Interpretation und Prompt erstellung) und DALL-E 3 (Erstellung des Bildes) ist wirklich, WIRKLICH gut mittlerweile.
Ich hatte vorhin nochmal etwas damit rumgespielt und war ehrlich gesagt etwas ernüchtert.
Wenn man etwas sehr spezifisches will ist dann Stable Diffusion mit Addons dann doch wieder die einzigste wirkliche Möglichkeit. Dafür muss man natürlich auch bereit sein, mehr als nur ein paar Minuten zu investieren.

Ich hatte es im anderen Thread schon geschrieben:

Rickmer schrieb:
Ich habe heute festgestellt, dass Dall-E 3 auch ziemlich harte Grenzen der Fähigkeiten hat, indem ich versucht habe, dieses Bild, dass ich in A1111 erstellt hatte, nachzubilden:

closeup of a single female human face, digital art, glow effects, Hand drawn, render, illustrative, octane render, cinema 4d, blender, Vivid colors, professional majestic oil painting by Ed Blinkey, Atey Ghailan, Studio Ghibli, by Jeremy Mann, Greg Manchess, Antonio Moro, trending on ArtStation, trending on CGSociety, photorealistic painting art by midjourney and greg rutkowski, ADDCOMM
(left half of a female human face, red-haired green-eyed irish gal with (freckles:1.4), straight long hair:1.5) ADDCOL
(right half of a female human face, african princess with (black skin:2.5) and (brown eyes:1.4), short curly hair:1.5),
Negative prompt: (worst quality, low quality:1.4), (deformed, distorted, disfigured:1.3), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, (mutated hands and fingers:1.4), disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation, tattoo, watermark, text

Erstellt mit dem neuen thinkdiffusionxl Modell und Verwendung von der RegionalPrompter Erweiterung für A1111

00013-1021627094.png



Diese Anfrage hat es garnicht erst angenommen:
paint me a stylistic oil painting of a female face with the left half irish with green eyes, freckles and long red hair and the right half african with black skin and very short curly hair.
Darauf gab es diese Antwort:
I’m sorry, but I am not able to generate images with such specific details. However, I can suggest some famous paintings of women that you might find interesting:
[...]

Bei einer einfacheren Anfrage und dann mehreren Modifikationen kamen Bilder wie dieses bei raus:

Initiale Anfrage schrieb:
paint me a picture of a female face with the left half irish with long red hair and the right half african with short curly hair
Erste Modifikation schrieb:
please make it a more stylistic oil painting and the irish half have green eyes and freckles
Zweite Modifikation schrieb:
please make it a more smooth transition between the halves of the image

1698091599986.png1698091725397.png1698091750482.png

1698091672302.png



Okay, schonmal nicht schlecht, aber:
  • größtenteils weder stylistisch noch ölartig
  • die Details werden durcheinander geworfen und für beide Seiten des Bildes oder garnicht angewendet...

Dafür, dass explizit mit der Genauigkeit des Prompting geworben wurde finde ich das schon etwas enttäuschend.
Positiv: Es hatte immerhin zu 100% geschafft, den beschriebenen Bilder-Split zu machen. Das hat Stable Diffusion (egal ob SD1.5 oder SDXL) selbst mit Hilfe des Regional Prompter nur Teil der Zeit hinbekommen.
 
Was genau bringt das jetzt? Eroberung des Kunstmarktes? Wohl kaum. Hübsche leichtbekleidete Frauen generieren lassen ist auch verboten. Wie langweilig und prüde. Das wäre für die Pornoindustrie doch endlich mal was Neues und echte Frauen müssten dafür nicht mehr herhalten. Aber nee das geht nicht. Aber ja gibts jetzt irgendeinen Sinn außer Spielerei? Was habe ich z.B. von einem computergenerierten Garten den ich nie betreten habe? Sieht einfach cool aus? Okay.
 
Whitehorse1979 schrieb:
Hübsche leichtbekleidete Frauen generieren lassen ist auch verboten. Wie langweilig und prüde. Das wäre für die Pornoindustrie doch endlich mal was Neues und echte Frauen müssten dafür nicht mehr herhalten.
U.A. pornpen.ai? Da gibts auch schon Animationen. Diese Industrie hat ihre eigenen Algorithmen und Server längst in Betrieb und am Lernen. Da braucht man nicht drauf warten.


Whitehorse1979 schrieb:
Aber ja gibts jetzt irgendeinen Sinn außer Spielerei? Was habe ich z.B. von einem computergenerierten Garten den ich nie betreten habe? Sieht einfach cool aus? Okay.
Inspiration für den eigenen Garten?
Träumen? Warum schauen Menschen Filme oder spielen Videospiele? Vieles was dort zu sehen ist, gibt es so auch nicht in Echt. Vielleicht gehörst du nur nicht zur Zielgruppe.
 
Zurück
Oben