Benchmarking 1

News ChatGPT Images 2.0: Neuer Bildgenerator setzt vor allem auf besseres Verständ­nis

  • Gefällt mir
Reaktionen: stevefrogs und 0range
silentdragon95 schrieb:
Es bleibt dabei: KI-Generierte Bilder lassen sich mittlerweile wenn überhaupt nur noch durch die gründliche Suche nach unstimmigen Details erkennen

Ich würde sagen, dass das "wenn überhaupt" immer überwiegender wird. Dazu kommt dann noch, dass selbst "echte" Bilder im Zweifelsfall durch einen AI-Upscaler oder Filter gejagt werden und dann auch ein ursprünglich "echtes" Bild irgendwelche Artefakte aufweisen kann.
 
Kann das Modell jetzt endlich wirklich nur Details in einem generieren Bild verändern, ohne gleich jedes Mal ein komplett anderes Bild zu generieren?
 
@Lamkiller stimmt, ich meinte auch tatsächlich eher Details wie z.B. ein nicht zu 100% passendes Nummernschild (z.B. ungültiger Landkreis) oder gerade bei detaillierteren Umgebungen (in der Regel Innenräumen) irgendwelche Gegenstände, die an diesem Ort keinen Sinn ergeben. Ersteres dürfte aber durch etwas geschicktes Prompting leicht vermeidbar sein, und letzteres ist oft auch nur ein Indiz und kein Beweis, weil vielleicht habe ich ja warum auch immer z.B. meinen Ketchup im Bücherregal stehen.

Der Stil des Bilds selbst kann wie du geschrieben hast genau so gut von einem Upscaler, nachträglicher Bearbeitung (man dreht ja immer gerne an der Brillianz der Farben) oder (sehr oft) einem Filter kommen.
 
1776860230011.png


Wieso redet der Fahrer mit sich selbst?
 
  • Gefällt mir
Reaktionen: the_IT_Guy, kampion, VYPA und eine weitere Person
Im nächsten Bild geht es ja auch um "we". D.h. vielleicht ist die erste Sprechblase von einer Person die grade eine gebückte Haltung hat?
 
  • Gefällt mir
Reaktionen: stevefrogs und Kaufmannsladen
BrollyLSSJ schrieb:
Also da finde ich die Blokade der Autos nicht so schön.


Oja, die Haare sind sehr wild.


DA sind doch Autos, nur eben auf der Straße und weiter weg :)
dafür hat non-pro eine dreckige hose :D
 
  • Gefällt mir
Reaktionen: BrollyLSSJ und Kuristina
...shot on 35mm film. Natural imperfect framing, visible grain, ambient light, muted colors...
Gerade diesen Teil des Prompts setzt ChatGPT deutlich besser um. 3:2 Format, glaubwürdigere Körnung, tatsächlich blassere Farben und dieses typische roll-off der Highlights. Gemini sieht zu sehr nach HDR aus, Breitbild, zu scharf/zu wenig Filmkorn, WB zu perfekt, Unschärfen sehen verschmiert aus. In deren Trainingsdaten sind vermutlich wenig echte 35mm-Scans...
 
  • Gefällt mir
Reaktionen: Timb000 und stevefrogs
Es bekommt aber immer noch keine 4 Frames für eine Geh-Animation einer Person von der Seite gesehen in Pixel Art gemalt :D Das Ding geht daran seit mittlerweile 3 oder 4 Generationen der Bildgenerierung kaputt.

Wobei der Pixel Art Aspekt dabei wohl nicht das ist was es kaputt macht. Habe es jetzt zwar nicht getestet, aber beim letzten Mal konnte es das auch nicht mit realistisch aussehenden Personen zeichnen.
 
Neulich mal mehr mit meinem Favorisierten Frontend beschäftigt. Was damit bereits jetzt alles schon möglich ist. Völlig kostenlos, unzensiert, anonym und schnell noch dazu. Das ersetzt tatsächlich sämtliche Künstler. Dabei erkennt kaum eine Sau, dass es aus KI stammt (natürlich mit den richtigen promt, etliches durchrollen und kleinere schnelle Adjustments)

Bin schon dabei zu prüfen ob es sich lohnt ,selbst tätig zu werden. Sind diese "Produkte" aus Generatoren die ja offensichtlich von den Firmen mit kopiergeschützten Werken gefüttert wurden, eigentlich selbst irgendwo geschützt? Fällt das unter CC? Würde mich mal interessieren, wie ein Erfahrener Jurist das genau einschätzt.

Fluch und Segen zugleich. In ein Paar Jahren werden Aufnahmen jeglicher Art, kein Beweismittel mehr sein. Experten werden da so die Köpfe rauchen, das ist brutal. Das Potenzial, das dahinter steckt für positive sowie negative Wege ist so unfassbar enorm.

Aktuell geht das ganze ja noch in Richtung Vektoren, wenn das ganze dann erst richtig rastern kann, werden auch reale Personen from the scratch keine Probleme mehr sein für die KI. Aktgel fehlt noch die Brücke, die Programmierer nicht hinbekommen als Algorithmus zu implementieren.

Was Intelligenz ausmacht, ist die Fähigkeit selbstständig zu denken, nicht nur einfach Informationen abzufufen und auf dieser diese zuverarbeiten. Von Firmen kommen gerne mal so Sclagwörter wie "Reasoning", das hat aber mit der Bedeutung des Wortes aber wenig zu tun. Was genau ich meine, kann aber wohl auch ein Hirnforscher besser erklären...
 
1776876958941.png

mich haut es nicht vom Hocker
 
Micha- schrieb:
mich haut es nicht vom Hocker
TBF, die Kleinigkeiten fallen zunächst erst noch garnicht auf. Für nen Casual auf Instagram das mit Handys angeschaut wird, würde das schon reichen. Aber auch hier fällt auf, dass "verstehen" nicht stattfindet. Die KI hat keine Ahnung wie z.B. ein Haus normal aussehen würde, sie "denkt nicht nach". da wird einfach was zusammen kopiert, das Nahe kommt, auf dem Wissen wie verschiedene Bilder von Häusern aussehen.
 
DX8 schrieb:
Fluch und Segen zugleich. In ein Paar Jahren werden Aufnahmen jeglicher Art, kein Beweismittel mehr sein. Experten werden da so die Köpfe rauchen, das ist brutal. Das Potenzial, das dahinter steckt für positive sowie negative Wege ist so unfassbar enorm.
Das muss ich mal entschärfen, denn die Lösung gibt es schon. In teureren Kameras können die Fotos schon mit Signatur versehen werden. Auch der Fotograf/Agentur kann sich im Menü in die fälschungssicheren Metadaten eintragen. Wenn die Kette eingehalten wird, können auch leichte Nachbearbeitungen voll transparent nachvollzogen werden. Sowas müsste sich nur schneller durchsetzen. Die KI wird so schnell besser, dass solche Gegenmaßnahmen mit höherer Priorität und breitflächig ausgerollt werden müssen. Dazu gehört auch, dass Browser von sich aus bei signierten Fotos dann entsprechend einen Vermerk einblenden, was für die Onlinepresse zu einem Qualitätskriterium werden muss.
 
Ganz toll, viele Spieler werden es als Texturen in Spielen noch mehr feiern ohne es zu merken, ich meine, ist ja auch vollkommen normal das in Fantasy-Settings die Inneneinrichtung von Schlössern so ungenutzt und neu aussieht als wäre sie aus dem Otto-Katalog bestellt worden...
hust Crimson Desert hust
 
Zuletzt bearbeitet:
Hab vorhin spontan was zu meinem Lieblingstier probiert: "Infografik-Poster über Luchse"

Schon beeindruckend!
Trotzdem immer noch nicht perfekt und mit verm. Fehlern: oben rechts "eine Sichtung" und bei Merkmale "Pinselohren". Und in Nordamerika gibts die ja auch!
Seht ihr sonst noch was?

Trotzdem: wenn man bedenkt wie lang es dauern würde so was selbst zu kreieren!

ChatGPT Image 29. Apr. 2026, 00_00_13.png
 
Zuletzt bearbeitet:
kampion schrieb:
Trotzdem immer noch nicht perfekt und mit verm. Fehlern:
So wirkt es realistisch, "hat sich Jemand vertippt". 👍
Tja will nicht wissen wieviele Kids so ihre Hausaufgaben machen.
Oder gar Studenten ihre Arbeit.. die Leute lernen gar nichts mehr...

Wo das alles noch hinführt?...
 
Zurück
Oben