News OpenAI: Sora generiert Videos in bis zu Full-HD-Auflösung

nlr

Redakteur
Teammitglied
Registriert
Sep. 2005
Beiträge
9.982
OpenAI kann mit Sora jetzt auch hochauflösende Videos auf Basis der Texteingabe eines Anwenders erzeugen. Das KI-Modell folgt auf andere Modelle wie das aktuelle GPT-4 und DALL·E 3, die Text und Bilder generieren können. Sora befindet sich zunächst noch in einer Erprobungsphase und soll von Experten auf Schwächen geprüft werden.

Zur News: OpenAI: Sora generiert Videos in bis zu Full-HD-Auflösung
 
  • Gefällt mir
Reaktionen: flo.murr, ComputerJunge, Xood und 4 andere
Die Videos sind phänomenal. Ich hätte nicht so schnell mit solchen Ergebnissen gerechnet. 10-15 Jahre hab ich erwartet, das überrascht mich jetzt doch sehr.

Das Video bei dem ein Stuhl ausgegraben wird ist wild. Ich sehe noch eine verrückte Zukunft auf uns zu kommen. Die Qualität dieser Videos ist häufig nicht mehr als AI wahrnehmbar, ganz im Gegenteil. Das ist aufregend und angsteinflösend gleichzeitig.

Auf X postet Sam Altman seit gestern auch Video-Antworten auf Prompts von Usern, sehr unterhaltsam:
https://twitter.com/sama/status/1758220311735181384
https://twitter.com/sama/status/1758218820542763012
https://twitter.com/sama/status/1758218059716939853
 
  • Gefällt mir
Reaktionen: flo.murr, nyster, nobody360 und 22 andere
Ich glaube die FSK18 Branche kriegt jetzt richtig weiche Knie.
 
  • Gefällt mir
Reaktionen: flo.murr, nyster, IgorGlock und 52 andere
Netflix & Co haben den Chat verlassen.
 
  • Gefällt mir
Reaktionen: nyster, dualcore_nooby, Aliosy und 26 andere
Hätte wirklich nicht gedacht, dass wir schon so weit sind. Auf Twitter wird gemunkelt, dass ein Teil der Trainingsdaten aus Unreal Engine 5 stammen, wodurch fast jede denkbare Situation abgebildet werden kann.

Freue mich schon auf die kommenden Desinformationskampagnen :love:
 
  • Gefällt mir
Reaktionen: nyster, qappVI, Zenschy und 2 andere
Das ist schon echt gruselig. Ich bin mir echt nicht sicher ob sich die Menschheit mit der künstlichen Intelligenz einen gefallen tut... Es ist ja jetzt im Internet schon schwer einen KI-Beitrag zu enttarnen. Und für Propaganda tun sich hier ganz neue Wege auf.
 
  • Gefällt mir
Reaktionen: nobody360, Avero, tritratrullala und 9 andere
Wir werden bald an den Punkt kommen, wo man mit dieser Technologie schon faszinierende, wenn auch experimentelle Grafik-Adventure-Games machen kann, in denen man sich durch Szenen bewegt, die sich das LLM vorstellt.

Quasi eine Wanderung durch den Traum einer Maschine.
 
  • Gefällt mir
Reaktionen: nyster, nobody360, FordPrefect und 4 andere
Vor allem beschreiben sie in ihrem Paper deutlich mehr Einsatzszenarien als "nur" (starke Anführungszeichen) Videos. 3D Modeling, Physiksimulationen und ähnliches sind damit auch denkbar. Also nicht für Statiker und Physiker, aber auch wenn man das Video am Ende noch selbst rendern will, kann AI hier ggf. viel Arbeit oder Rechenzeit sparen.

Ich finde den Fortschritt hier auch erstaunlich. Das wird auf jeden Fall interessant.
 
  • Gefällt mir
Reaktionen: FCK_PTN und nlr
In nicht mal mehr 5 Jahren kann man sich "Pic/Video or it didn't happen" sparen, kann man dann wirklich nichts mehr glauben. Keine Ahnung ob das so toll ist. AI Content wird auf sämtlichen Plattformen immer mehr. Kreativität kann man das nicht mehr nennen, zuscheissen eher.
 
  • Gefällt mir
Reaktionen: nyster, IgorGlock, Fritzler und 25 andere
naja, gerade im video mit dem chinesischen drachen sieht man fehler. ganz offensichtlich: die frau links in der weissen jacke hält einen stab, der den drachen hochhalten soll. nur ist dieser nicht mit dem drachen verbunden...
 
  • Gefällt mir
Reaktionen: Gortha
Finde die Ergebnisse auch schick, gerade die kleinen Details in Oberflächen für die ein Animations-Studio sonst sehr lange brauchen würde sind beeindruckend. Mehr als einfache "in eine Richtung" Bewegung dürfte hier aber in nächster Zeit schwer werden, was man auch an den Passanten im zweiten Video sehr gut sehen kann.

Wie üblich ist man hier dem 80/20 Prinzip unterworfen: die ersten 80% sind relativ schnell machbar, einfache Shots von linearen oder einfach vorhersagbaren Bewegungen. Sobald es aber etwas komplexer wird, wird es genau wie bei Händen oder Augen erst mal zu ordentlichen Problemen kommen, da die Freiheitsgrade dort einfach zu hoch sind. Und apropos Hände, bis die irgendwie richtig als Bewegtbild generiert werden können, dürfte wohl noch mal länger dauern.

Für einfache Szenarien dürfte sowas aber in nächster Zeit durchaus gute Ergebnisse liefern, die sich dann ja auch mit "richtigen" Videos kombinieren lassen. Ich denke hier z.B. an einen Roboter-Arm der sich in eine Richtung bewegt, ein Auto das beschleunigt oder andere einfache Szenarien die für Werbe-Videos häufig verwendet werden.


EDIT: Die Implikationen von generierten Videos durch Jedermann ohne großes Budget für IT Sicherheit sind auch sehr schön, da einige der Verifikationsverfahren ja ein Video von Person/Ausweis benötigen und das in quasi standardisiertem Format. Hier lässt sich mit ein paar Referenz-Videos und einem Gesicht dass man fälschen will ohne Probleme Dinge anstellen, die auf den ersten Blick dank der geringen Komplexität kaum von echtem Material unterscheidbar ist. Gerade im Hinblick auf die bisherigen "Erfolge" von "KI" ebenfalls durch "KI" generiertes Material einfach zu erkennen ist das hier mangels Standbild sogar noch mal ne Nummer gravierender... Aber ja, OpenAI wie üblich wird erst mal "rausballern" und die Konsequenzen für einfach verfügbare komplexe Technik darf dann die Gesellschaft tragen weil Gott bewahre, Tech-Mega-Konzerne sind für ihre Handlungen verantwortlich. Wo käme man da hin :rolleyes:
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: AlphaKaninchen, coral81, Flunkiii und eine weitere Person
Es wird halt immer besser und das aber rasant oder wer hätte sich noch vor 5 Jahren ausmalen können was da jetzt schon möglich ist? Wohl die wenigsten.
 
  • Gefällt mir
Reaktionen: Flunkiii
edybero schrieb:
Freue mich schon auf die kommenden Desinformationskampagnen :love:
Richtig Bock auf militärische Mobilmachung weil ein CoD-Drohnen-Video von Torben (13) viral gegangen ist 🥰
 
  • Gefällt mir
Reaktionen: nyster, IgorGlock, Fritzler und 19 andere
Interessant ich freue mich schon auf Terminator, Stirb Langsam oder Rambo Teil 125
 
  • Gefällt mir
Reaktionen: nyster, IgorGlock, qlubtempo und 3 andere
kommen die pixel allesamt direkt aus der ai raus oder sind da noch zwischenschritte (ai erzeugt szene für 3d engine, die rendert es)?

bis vor kurzem war da ja keine stabilität zwischen den einzeln frames sondern nur wildes geflacker zu sehen

wahnsinn
 
edybero schrieb:
Hätte wirklich nicht gedacht, dass wir schon so weit sind. Auf Twitter wird gemunkelt, dass ein Teil der Trainingsdaten aus Unreal Engine 5 stammen, wodurch fast jede denkbare Situation abgebildet werden kann.

Freue mich schon auf die kommenden Desinformationskampagnen :love:

Was hat jetzt eine Grafik Engine (so beeindruckend sie auch sein mag) damit zu tun wie eine Transformator mit Trainingsdaten versehen wird?

Die von dir denkbaren Situationen muss trotzdem erstmal jemand er stellen bevor daraus bilddaten für den Trainingspool werden. Andreas herum funktioniert das noch nicht

0x8100 schrieb:
naja, gerade im video mit dem chinesischen drachen sieht man fehler. ganz offensichtlich: die frau links in der weissen jacke hält einen stab, der den drachen hochhalten soll. nur ist dieser nicht mit dem drachen verbunden...

Das wird auch solange so bleiben, bis die "KI" gelehrt bekommen hat den kausalen Zusammenhang zwischen der Stange und dem Objekt darüber herzustellen.
Was erst kommt wenn die KI gelehrt bekommen hat was eine Stange überhaupt ist und wofür sie eingesetzt werden kann.

-----

Das die Videos jetzt schon kommen überrascht mich nicht am ende ist es doch irgendwie mit dem Morphen vergleichbar. Man erzeugt ein Start und ein Ende Bild und lässt die KI die Einzelbilder dazwischen erzeugen
Dann sortiert man den Müll aus und macht es wieder bis man zu genug Bildern pro Sekunde kommt das es ein bewegtes Bild darstellt tada Video
 
  • Gefällt mir
Reaktionen: AlphaKaninchen und Eternal
Und das ist die schlechteste Version mit den schlechtesten Videos.
Es wird mit der Zeit nur besser werden.
Beeindruckend.
 
  • Gefällt mir
Reaktionen: nyster, dualcore_nooby, raven`` und 3 andere
Wie wird das dann mal z.B. mit Beweisen vor Gericht ablaufen?
"Nein, ich habe meinen Nachbarn nicht verprügelt, der hat das Überwachungsvideo KI-generieren lassen, weil der mich nicht mag, Herr Richter!"
 
  • Gefällt mir
Reaktionen: nyster, Avero, 7H0M45 und 6 andere
Azeron schrieb:
In nicht mal mehr 5 Jahren kann man sich "Pic/Video or it didn't happen" sparen, kann man dann wirklich nichts mehr glauben. Keine Ahnung ob das so toll ist. AI Content wird auf sämtlichen Plattformen immer mehr. Kreativität kann man das nicht mehr nennen, zuscheissen eher.
Das gilt schon heute UND auch schon vor 10+ Jahren. Selber denken und hinterfragen. Durch weglassen von Informationen sowie einseitiger Zensur wird am schlimmsten Manipuliert.
Dazu seinen Arsch bewegen.

Alles andere ist Lemmingverhalten.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: nyster, Gemcutter, maxrl und 3 andere
Zurück
Oben