News Google Gboard: Spracherkennung in Zukunft offline statt online

Unglaublich, vor etwa 25 Jahren steckte ein bekannter Soundkartenanbieter bereits "Sprache zu Text" (Spracherkennungs-)-Software in seine Kartons, natürlich noch auf einer 3,5" Diskette.

DerRobert2019 schrieb:
*WTF-Factor einhalten zu versuche
Quelle? 😶

Soundblaster (Creative) war das, oder? Ich meine, da gabs mal was...
 
  • Gefällt mir
Reaktionen: R.I.P.er
Es gibt schon lange Spracherkennung mit einer Erkennungsgenauigkeit von über 99%. Dragon von Nuance. Für das Smartphone gibt es das auch, nennt sich Dragon Anywhere. Was Google hier als Neuerung anpreist, gibt es bei Dragon schon seit über 10 Jahren und nennt sich Kontexterkennung.
 
  • Gefällt mir
Reaktionen: denglisch und R.I.P.er
cruse schrieb:
Mensch Jungs.. Google ist echt schwer zu benutzen: https://de.m.wikipedia.org/wiki/Spracherkennung
Untitled 12.png
 
Vorerst funktioniert das aber nur auf Pixel-Smartphones mit amerikanischem Englisch.

Allein mit den Hillbillies und den ländlichen Gegenden hat das neuronale Netz genug zu tun. ;)
Irgendwann reicht es dann auch noch für schottisch, irisch, Oxford und London sowie Indien.
 
Wahnsinn, der Fortschritt ist enorm :o von 2Gb auf 80Mb. Hört sich wie eine light Version.
 
Ich möchte darauf hinweisen, dass die Spracheingabe damals - hab ich durchaus auch getestet - praktisch unmöglich einzusetzen war. Über ein paar Demo-Texte kam man üblicherweise nicht hinaus. Sprachbefehle mussten so exakt eingeübt werden, dass es meist weniger umständlich war, mit der Maus die 2-3 Klicks zu machen, anstatt das 2-3 Mal anzusagen, bis es denn das tat, was es sollte.

Theoretisch einziger echter Nutzen der Sprachkommandos war es, wenn man des Abends vor dem PC als Person mit nur einem Arm ein wenig Zerstreuung gesucht hätte...

Regards, Bigfoot29
 
  • Gefällt mir
Reaktionen: chillking und cruse
mic_ schrieb:
Swipe ist schon geil. iPhone Nutzer gucken blöd wenn die das sehen.
Sehr gute Spracherkennung ebenfalls.

Das ging schon mit dem iPhone 4
 
Bigfoot29 schrieb:
Theoretisch einziger echter Nutzen der Sprachkommandos war es, wenn man des Abends vor dem PC als Person mit nur einem Arm ein wenig Zerstreuung gesucht hätte...
Nette Formulierung :D
 
  • Gefällt mir
Reaktionen: R.I.P.er und Bigfoot29
Als ich das letzte Mal am Android Handy rum gespielt hab, ging alles nicht was ich wollte...

"hallo google" -> "öffne Whatsapp" (Threema/Telegram) -> "nachricht an Klaus" -> "Komme später. Bin noch auf der Autobahn." -> "Abschicken"

oder

"hallo google" -> "öffne youtube" --> "suche nach Skyrim Soundtrack" -> "spiele erstes Ergebnis ab"

oder

"hallo computer" -> "notiz für Einkaufsliste: Klopapier kaufen" -> Handy öffnet selbständig eine Notiz-App und trägt das in die Einkaufliste ein...


Sowas würde ich mir wünschen - oder ist sowas schon möglich? :D
 
Was ich wirklich nicht verstehe: Die Spracherkennung ist mittlerweile so gut von Google, warum können die nicht eine vernünftige Aussprache hinkriegen (könnte man nicht irgendwie das Spracherkennungsnetz dafür nutzen und sozusagen umdrehen, und eine "Durchschnittsprache" als Ausgabe produzieren)?

So Durchschnitte gibt es ja z.B. bildlich bereits:
763406
Quelle
 
Was ist daran neu, das geht doch schon ewig? Nicht nur auf Pixel, und auch auf Deutsch. Bei mir geht das so: Gboard-Einstellungen / Spracheingabe / Offline-Spracherkennung / Sprachen herunterladen.
 
Fluxxus schrieb:
Was ist daran neu, das geht doch schon ewig? Nicht nur auf Pixel, und auch auf Deutsch. Bei mir geht das so: Gboard-Einstellungen / Spracheingabe / Offline-Spracherkennung / Sprachen herunterladen.
Haben die auch nur 80 MB?
 
DoS007 schrieb:
Was ich wirklich nicht verstehe: Die Spracherkennung ist mittlerweile so gut von Google, warum können die nicht eine vernünftige Aussprache hinkriegen (könnte man nicht irgendwie das Spracherkennungsnetz dafür nutzen und sozusagen umdrehen, und eine "Durchschnittsprache" als Ausgabe produzieren)?

So Durchschnitte gibt es ja z.B. bildlich bereits:
Anhang anzeigen 763406Quelle
Bei Reddit sind sehr viele der Meinung dass der Durchschnitt gut aussieht (bzw. sogar mehr: anziehend). Ich finde sie vor allem durchschnittlich (was sie ja sein sollen, vielleicht täuscht einige die leuchtende Haut die durch die Filter entsteht, mir persönlich ist es zu langweilig), was teilweise auch zu runde und flache Gesichter bedeutet. Auffallend ist aber, dass einige eher wie eine speziellen Person aussehen, frage mich ob da der Datensatz zu klein war, oder zu viele Fotos für Werbezwecke verwendet wurden. Wenn man die Google Bildersuche verwendet, sind die Ergebnisse ja auch sehr seltsame, sehr amerikanische Bilder, sicher nicht natürlich oder der Durchschnitt (höchstens der Durchschnitt wie amerikanische Medien ihn gerne präsentieren, in Werbung und co.)
 
Zuletzt bearbeitet:
DoS007 schrieb:
Die Spracherkennung ist mittlerweile so gut von Google, warum können die nicht eine vernünftige Aussprache hinkriegen
Zumindest im englischen finde ich sie schon recht ordentlich (geht ab 1:10 Min los und bei 3:00 Min):
 
Bart S. schrieb:
Zumindest im englischen finde ich sie schon recht ordentlich (geht ab 1:10 Min los und bei 3:00 Min):
Ja, im Deutschen ist es aber leider noch murks. Da ist das beste im Moment noch Alexa.
 
Zurück
Oben