News ChatGPT Images 2.0: Neuer Bildgenerator setzt vor allem auf besseres Verständnis

BrollyLSSJ · 22. April 2026

supermanlovers schrieb:
Gemini Pro (Nano Banana 2)

Also da finde ich die Blokade der Autos nicht so schön.

petunientopf schrieb:
Gemini pro.

Oja, die Haare sind sehr wild.

0range schrieb:
non-pro

DA sind doch Autos, nur eben auf der Straße und weiter weg

Lamkiller · 22. April 2026

silentdragon95 schrieb:
Es bleibt dabei: KI-Generierte Bilder lassen sich mittlerweile wenn überhaupt nur noch durch die gründliche Suche nach unstimmigen Details erkennen

Ich würde sagen, dass das "wenn überhaupt" immer überwiegender wird. Dazu kommt dann noch, dass selbst "echte" Bilder im Zweifelsfall durch einen AI-Upscaler oder Filter gejagt werden und dann auch ein ursprünglich "echtes" Bild irgendwelche Artefakte aufweisen kann.

cbforum.scooter · 22. April 2026

Kann das Modell jetzt endlich wirklich nur Details in einem generieren Bild verändern, ohne gleich jedes Mal ein komplett anderes Bild zu generieren?

silentdragon95 · 22. April 2026

@Lamkiller stimmt, ich meinte auch tatsächlich eher Details wie z.B. ein nicht zu 100% passendes Nummernschild (z.B. ungültiger Landkreis) oder gerade bei detaillierteren Umgebungen (in der Regel Innenräumen) irgendwelche Gegenstände, die an diesem Ort keinen Sinn ergeben. Ersteres dürfte aber durch etwas geschicktes Prompting leicht vermeidbar sein, und letzteres ist oft auch nur ein Indiz und kein Beweis, weil vielleicht habe ich ja warum auch immer z.B. meinen Ketchup im Bücherregal stehen.

Der Stil des Bilds selbst kann wie du geschrieben hast genau so gut von einem Upscaler, nachträglicher Bearbeitung (man dreht ja immer gerne an der Brillianz der Farben) oder (sehr oft) einem Filter kommen.

Kaufmannsladen · 22. April 2026

Wieso redet der Fahrer mit sich selbst?

herbiW · 22. April 2026

Im nächsten Bild geht es ja auch um "we". D.h. vielleicht ist die erste Sprechblase von einer Person die grade eine gebückte Haltung hat?

Kuristina · 22. April 2026

Kaufmannsladen schrieb:
Wieso redet der Fahrer mit sich selbst?

Das Auto hat eine eigene KI.

Mit Bildschirm.

0range · 22. April 2026

BrollyLSSJ schrieb:
Also da finde ich die Blokade der Autos nicht so schön.

Oja, die Haare sind sehr wild.

DA sind doch Autos, nur eben auf der Straße und weiter weg

dafür hat non-pro eine dreckige hose

oliu · 22. April 2026

...shot on 35mm film. Natural imperfect framing, visible grain, ambient light, muted colors...

Gerade diesen Teil des Prompts setzt ChatGPT deutlich besser um. 3:2 Format, glaubwürdigere Körnung, tatsächlich blassere Farben und dieses typische roll-off der Highlights. Gemini sieht zu sehr nach HDR aus, Breitbild, zu scharf/zu wenig Filmkorn, WB zu perfekt, Unschärfen sehen verschmiert aus. In deren Trainingsdaten sind vermutlich wenig echte 35mm-Scans...

chris. · 22. April 2026

DaysShadow · 22. April 2026

Es bekommt aber immer noch keine 4 Frames für eine Geh-Animation einer Person von der Seite gesehen in Pixel Art gemalt

Das Ding geht daran seit mittlerweile 3 oder 4 Generationen der Bildgenerierung kaputt.

Wobei der Pixel Art Aspekt dabei wohl nicht das ist was es kaputt macht. Habe es jetzt zwar nicht getestet, aber beim letzten Mal konnte es das auch nicht mit realistisch aussehenden Personen zeichnen.

DX8 · 22. April 2026

Neulich mal mehr mit meinem Favorisierten Frontend beschäftigt. Was damit bereits jetzt alles schon möglich ist. Völlig kostenlos, unzensiert, anonym und schnell noch dazu. Das ersetzt tatsächlich sämtliche Künstler. Dabei erkennt kaum eine Sau, dass es aus KI stammt (natürlich mit den richtigen promt, etliches durchrollen und kleinere schnelle Adjustments)

Bin schon dabei zu prüfen ob es sich lohnt ,selbst tätig zu werden. Sind diese "Produkte" aus Generatoren die ja offensichtlich von den Firmen mit kopiergeschützten Werken gefüttert wurden, eigentlich selbst irgendwo geschützt? Fällt das unter CC? Würde mich mal interessieren, wie ein Erfahrener Jurist das genau einschätzt.

Fluch und Segen zugleich. In ein Paar Jahren werden Aufnahmen jeglicher Art, kein Beweismittel mehr sein. Experten werden da so die Köpfe rauchen, das ist brutal. Das Potenzial, das dahinter steckt für positive sowie negative Wege ist so unfassbar enorm.

Aktuell geht das ganze ja noch in Richtung Vektoren, wenn das ganze dann erst richtig rastern kann, werden auch reale Personen from the scratch keine Probleme mehr sein für die KI. Aktgel fehlt noch die Brücke, die Programmierer nicht hinbekommen als Algorithmus zu implementieren.

Was Intelligenz ausmacht, ist die Fähigkeit selbstständig zu denken, nicht nur einfach Informationen abzufufen und auf dieser diese zuverarbeiten. Von Firmen kommen gerne mal so Sclagwörter wie "Reasoning", das hat aber mit der Bedeutung des Wortes aber wenig zu tun. Was genau ich meine, kann aber wohl auch ein Hirnforscher besser erklären...

Micha- · 22. April 2026

mich haut es nicht vom Hocker

DX8 · 23. April 2026

Micha- schrieb:
mich haut es nicht vom Hocker

TBF, die Kleinigkeiten fallen zunächst erst noch garnicht auf. Für nen Casual auf Instagram das mit Handys angeschaut wird, würde das schon reichen. Aber auch hier fällt auf, dass "verstehen" nicht stattfindet. Die KI hat keine Ahnung wie z.B. ein Haus normal aussehen würde, sie "denkt nicht nach". da wird einfach was zusammen kopiert, das Nahe kommt, auf dem Wissen wie verschiedene Bilder von Häusern aussehen.

FlashBFE · 23. April 2026

DX8 schrieb:
Fluch und Segen zugleich. In ein Paar Jahren werden Aufnahmen jeglicher Art, kein Beweismittel mehr sein. Experten werden da so die Köpfe rauchen, das ist brutal. Das Potenzial, das dahinter steckt für positive sowie negative Wege ist so unfassbar enorm.

Das muss ich mal entschärfen, denn die Lösung gibt es schon. In teureren Kameras können die Fotos schon mit Signatur versehen werden. Auch der Fotograf/Agentur kann sich im Menü in die fälschungssicheren Metadaten eintragen. Wenn die Kette eingehalten wird, können auch leichte Nachbearbeitungen voll transparent nachvollzogen werden. Sowas müsste sich nur schneller durchsetzen. Die KI wird so schnell besser, dass solche Gegenmaßnahmen mit höherer Priorität und breitflächig ausgerollt werden müssen. Dazu gehört auch, dass Browser von sich aus bei signierten Fotos dann entsprechend einen Vermerk einblenden, was für die Onlinepresse zu einem Qualitätskriterium werden muss.

kampion · 25. April 2026

Gemini 3: weiße Gischt sieht hier irgendwie so aus als wärs in der Nähe statt weit unten. Aber Golf II feier ich

Gravlens · Montag um 19:16

Ganz toll, viele Spieler werden es als Texturen in Spielen noch mehr feiern ohne es zu merken, ich meine, ist ja auch vollkommen normal das in Fantasy-Settings die Inneneinrichtung von Schlössern so ungenutzt und neu aussieht als wäre sie aus dem Otto-Katalog bestellt worden...

hust Crimson Desert hust

kampion · Mittwoch um 00:04

Hab vorhin spontan was zu meinem Lieblingstier probiert: "Infografik-Poster über Luchse"

Schon beeindruckend!
Trotzdem immer noch nicht perfekt und mit verm. Fehlern: oben rechts "eine Sichtung" und bei Merkmale "Pinselohren". Und in Nordamerika gibts die ja auch!
Seht ihr sonst noch was?

Trotzdem: wenn man bedenkt wie lang es dauern würde so was selbst zu kreieren!

ChatGPT Image 29. Apr. 2026, 00_00_13.png

Goldilox · Mittwoch um 00:49

DX8 · Mittwoch um 00:50

kampion schrieb:
Trotzdem immer noch nicht perfekt und mit verm. Fehlern:

So wirkt es realistisch, "hat sich Jemand vertippt". 👍
Tja will nicht wissen wieviele Kids so ihre Hausaufgaben machen.
Oder gar Studenten ihre Arbeit.. die Leute lernen gar nichts mehr...

Wo das alles noch hinführt?...

News ChatGPT Images 2.0: Neuer Bildgenerator setzt vor allem auf besseres Verständ­nis

Admiral Pro

Lt. Junior Grade

Cadet 4th Year

Commander Pro

Lt. Commander

Ensign

Vice Admiral Pro

Lt. Junior Grade Pro

Lieutenant

Commander Pro

Admiral

Ensign

Captain

Ensign

Cadet 4th Year Pro

Rear Admiral

Commander Pro

Rear Admiral

Lieutenant Pro

Ensign

News ChatGPT Images 2.0: Neuer Bildgenerator setzt vor allem auf besseres Verständnis