News Sprach- und Bildfunktionen: Nutzer können bald mit ChatGPT sprechen

Wird nicht mehr lange dauern, bis der erste T-800 vom Band läuft. :)
 
  • Gefällt mir
Reaktionen: ChadSlemur, AlextK, 0screamer0 und 12 andere
Die Bildeingabe ist ein heiß ersehntes Feature.
Ich bin von Unity zur Unreal Engine umgestiegen, konnte ich damals ChatGPT Fehlermeldungen geben, um den Code korrigieren zu lassen, würde das jetzt perfekt die Blueprints in Unreal auffassen und erläutern können.
 
  • Gefällt mir
Reaktionen: flo.murr und Protogonos
Wenn ich mit ChatGPT reden könnte, das wäre echt ein großer Schritt. Die schriftlichen Antworten sind ja schon das Beste, was es momentan so gibt..
Amazons Alexa ist ja leider dumm wie drei Meter nasser Feldweg und versteht teilweise einfachste Sachen nicht.
 
  • Gefällt mir
Reaktionen: natZONE und 0screamer0
Das mit Podcast übersetzten, hört sich so an, als ob Dolmetscher/Übersetzter ihren Job bald verlieren werden.
 
  • Gefällt mir
Reaktionen: AlextK, iron-man, Ichthys und eine weitere Person
Das mit der Bildeingabe wäre wirklich interessant, es läuft über Plugins mal okay, mal nicht so gut, aber von Bildausgabe stand da jetzt wohl nichts oder? Läuft natürlich auch mit Plugins, aber bislang so lala...
 
Super,endlich kann ich mit ner KI quatschen,die mir nicht widerspricht ..so wie meine Frau:D .. wird das die Zukunft der menschlichen Kommunikation ? JA
 
  • Gefällt mir
Reaktionen: iron-man und eMiu
Damit sind sie nur ca 4 Monate hinter den Skyrim Modern xD


Aber mal ernsthaft....
So besch.....eiden wie die Bilderkennung bisher funktioniert verspreche ich mir davon nicht allzu viel.
Natürlich erkennt es Objekte darauf recht gut. Aber das war's dann auch schon.
Irgendwie habe ich immer andere ansprüche als der Output der da generiert wird.
 
  • Gefällt mir
Reaktionen: iron-man
Haldi schrieb:
So besch.....eiden wie die Bilderkennung bisher funktioniert
Nunja, über die Qualität können wir ja bisher begrenzt etwas sagen, da wir nur die Paper von OpenAI aus März dazu haben und die sahen IMO überraschend gut aus.

Beim "sprechen" habe ich aktuell noch begrenzte Erwartungen, da das Training auf Englisch ja wieder lief und für mich deutsch die interessantere Sprache da ist.

Wo ich aber hochgradig neugierig bin ist die Verbindung von GPT4V und Dall-e 3. Ob man dann - wie in einem Chat - tatsächlich seine Bilder iterativ genau erstellen kann? Bisher läuft die Bilderstellung in den ganzen Generatoren ja nach dem Motto: Gib der KI ein paar Schlagworte und die macht dann was draus. Vieleicht ist ja was dabei, was dir zusagt und dann variiere dich zu deinem Wunschziel hin - also vieleicht.
 
ReptileX schrieb:
Wird nicht mehr lange dauern, bis der erste T-800 vom Band läuft. :)

Ach ich sage das dauert noch min. 50 Jahre. Ja ChatGPT ist ein gutes Modell aber wirklich "KI" ist das nicht. Vor allem kann man mittels Tools ja sofort erkennen ob etwas GTP, Bard und co. ist. Ich bin erst richtig beeindruckt wenn man das nicht mehr feststellen kann.
 
  • Gefällt mir
Reaktionen: Tendercat, MeisterOek und Mr Peanutbutter
Also ganz so einfach ist das nicht mehr, GPT4 erstellte Texte die dann noch paraphrasiert werden sind kaum bis gar nicht mehr unterscheidbar, insbesondere wenn es sich um Texte handelt die einem bestimmten Standardmuster folgen müssen wie etwa wissenschaftliche Arbeiten oder Prüfungen.
 
  • Gefällt mir
Reaktionen: rosenholz
The_waron schrieb:
Also ganz so einfach ist das nicht mehr,

Dauert nur etwas bis die Tools aufholen :) Ist halt ein Katz und Maus Spiel. Wie du ja schon sagst nicht mehr so einfach aber es geht noch/wieder.
 
Eigentlich nicht, so funktionieren auch die Tools nicht, GPT4 kann Texte erstellen die mittlerweile exakt die Schreibweise eines Menschen nachstellen, das ist kein "Katz und Maus Spiel", wenn der generierte Text so aufgebaut ist das die Generierung nicht mehr zurückverfolgt werden kann, ist es unmöglich zu unterscheiden ob ein Mensch oder eine KI dran war.

Es hat seinen Grund warum das mittlerweile die UNIs da intern ordentlich durchrüttelt, nicht wenige sind dabei die Studienordnung neu aufzubauen. Sieh dir mal folgenden Text an und sag mir welcher Abschnitt KI generiert ist, die üblichen Tools sagen alle es ist vom Menschen vollständig verfasst:

Das Labor Unfassbar geil GmbH setzt sich für die Implementierung und Erhaltung eines durchdachten Qualitätsmanagementsystems (QMS) ein, das gemäß den Vorgaben der Norm DIN EN ISO/IEC 17025 entwickelt wurde. Diese Norm spezifiziert die Grundanforderungen an die unseres Labors und stellt sicher, dass die von uns erbrachten Leistungen fachlich fundiert und die Ergebnisse zuverlässig sind.

Unsere Mission ist es, Dienstleistungen von höchster Qualität bereitzustellen, die den Erwartungen unserer Kunden, den gesetzlichen Vorgaben, behördlichen Richtlinien und den Bestimmungen der DIN EN ISO/IEC 17025 gerecht werden. In diesem Handbuch werden das System, die Rollen, Verfahren und Qualitätsmanagementmaßnahmen dargestellt, die wir eingeführt haben, um diesen Anspruch zu erfüllen.

Das QMH bietet eine Leitlinie für alle qualitätsrelevanten Aktivitäten. Es garantiert, dass alle Abläufe in einer verlässlichen und standardisierten Weise durchgeführt werden und so die Qualität unserer Dienstleistungen stets aufrecht erhalten bleibt.

Jeder Mitarbeiter trägt zu unserem Qualitätsversprechen bei. Daher legen wir großen Wert auf ein Arbeitsumfeld, das kontinuierliche Verbesserungen fördert und in dem Anregungen und Rückmeldungen zur Optimierung unserer Leistungen geschätzt werden.

Das ist mein Fachgebiet und ich kann dir absolut nicht sagen was KI generiert ist, kannst du es?
 
  • Gefällt mir
Reaktionen: ###Zaunpfahl### und rosenholz
Siri 5.0
 
Aus technischer Sicht ist das Gespräch mit chatgpt ein Kinderspiel und kaum Aufmerksamkeit wert. Im Endeffekt speech to Text und Text to speech. Gibt es schon seit Jahrzehnten.

Die Bilderkennung ist interessanter, aber dürfte nur simplere Sachen und Texte in Bildern erkennen. (Wie hier zb die bluescreen Analyse die gewünscht ist)

Es ist spannend was schon alles geschafft wird, aber wenn man schaut wie zb die Texte erzeugt werden, ist es zwar nicht weniger beeindruckend, hat aber einfach nichts von Intelligenz. Es sind nur Wahrscheinlichkeiten, Null Verständnis. Ebenso bei Bildern, wobei wir da noch weniger verstehen wie das neuronale Netz zu seinen Ergebnissen kommt.
 
  • Gefällt mir
Reaktionen: Sanjuro
Zurück
Oben