News Neues OpenAI-Modell: „Voice Engine“ kann mit 15-sekündiger Sprachaufnahme die Stimme klonen

germanrule schrieb:
Ich finde das ist nicht vergleichbar, Bahn und Auto haben Mobilität bezahlbar und schneller gemacht. Vorher konnten die meisten Leute sich das Reisen doch kaum leisten.
Ernste Frage, welche großen Probleme lösen KI-generierte Fotos/Videos/Audios? Gibt es noch nicht genug Medien zum konsumieren? Sind diese zu teuer für den Massenmarkt?
Ich glaube das Resultat ist, wir verblöden noch mehr und üben uns weiter im sinnlosen Kosnum und Materialismus bis der Klimwandel viele dazu zwingt wieder das Hirn einzuschalten.( hoffen wir mal)
Ergänzung ()

Magellan schrieb:
Hat halt wie immer beim Thema KI seine zwei Seiten. Es bietet auch tolle Möglichkeiten, so ist man bei Stimmen für Marketing, für Werbefiguren, bei Synchronstimmen usw nicht mehr abhängig von einzelnen Personen, für kleine Content Creator wird es sehr viel einfacher (zu finanzieren) überhaupt Vertonungen zu generieren usw.
Jeder Mensch mit einem Smartphone ist ein Content-Creator mehr oder weniger. Meiner Meinung nach einer der sinnlosesten Berufs-Bezeichnungen die es je gab. Harter Grabenkampf mit Influenzern steht auf der Tagesordnung. Von daher sehe ich da weniger was vorteilhaftes für Mensch und Gesellschaft.
 
  • Gefällt mir
Reaktionen: manniefresh und germanrule
wontiii schrieb:
Meiner Meinung nach einer der sinnlosesten Berufs-Bezeichnungen die es je gab.
Nun ich habe den Begriff verwendet weil er eben recht weit gespannt ist - wir beauftragen z.B. Content Creator für die Erstellung von Clips für TikTok usw (also Content für eigene Kanäle), aktuell für uns eine der effizientesten Arten der Werbung gemessen an Kosten und Reichweite.

Aber ich denke dabei nicht nur an Social Media, Hörspiele lassen sich so z.B. viel einfacher umsetzen, man kann Charaktere erschaffen die eine eigene Stimme erhalten ohne langfristig abhängig zu sein von einzelnen Sprechern, man kann sehr einfach Indie Spiele vertonen, man kann seinen Tracks eine Stimme geben usw. usf. - Möglichkeiten gibt es mehr als genug.

Die (finanzielle) Hürde für eine Vertonung ist halt ungleich geringer als wenn man professionelle Sprecher beauftragen muss.
 
  • Gefällt mir
Reaktionen: Alioth
Alioth schrieb:
Und aus 5h Voice samples?
Wenn man zuvor fleißig hunderte an Beispielen aufzeichnet (alle möglichen Stimmungslagen inklusive), dann kann eine KI die Stimme vermutlich deutlich besser imitieren. Nur mit dem trockenen englischen Humor wird es nicht leicht, weil der schon bei echten Menschen nicht immer einfach so zu erkennen ist.
Alioth schrieb:
Die 15 sekunden waren nur ein plakatives Beispiel - daran würde ich mich nun wirklich nicht aufhängen!
Ich würde mich nie aufhängen, ich mag weder Erstickung noch Genickbruch. ;)
Wer mit 15 Sekunden wirbt, muss sich daran auch messen lassen.
 
  • Gefällt mir
Reaktionen: Alioth
heute traf auf einem mann der sah aus und sprach wie hellmuth karasek. auch der habitus war ganz arg ähnlich.
ok, der mann hatte graue harre, aber davon mal abgesehen war er wirklich sehr, sehr ähnlich.
man sieht es geht auch ohne eine ki.
 
1991 haben bei Terminator 2 noch alle gelacht bei dieser Technologie ... Bald haben wir alle nichts mehr zu lachen, wenn das so weiter geht.
 
Zurück
Oben