Sprache zu Text Programm gesucht

Sunjy Kamikaze

Commodore
Registriert
Aug. 2015
Beiträge
4.393
Guten Tag.

Da ich immer mehr Tippen muss und meine Anschläge schon gegen 100.000 Pro tag gehen möchte ich meine Finger etwas schonen und meine Stimmbänder mit einbeziehen.

Wichtig wäre das das Programm sehr schnell geht und ich auch die Entertaste über einen Befehl auslösen könnte. Darf gern auch was kosten wenn es sich lohnt.

PC nutzt Windows 10. ein Headset mit Micro ist auch vorhanden.
 
Ok, wollte gerade rueckfragen zu weiteren anwendungsfaellen stellen.. Aber uff. Der markt ist unerwarteter Weise nicht gewachsen.
Nimm dragon natural speaking.

Es gibt inzwischen von allen grossen Firmen in dem Bereich APIs die man nutzen kann (wobei eig. in allen viel Know How von Nuance steckt)

Ich haette jedoch gedacht, dass sie an der Front inzwischen auch konkurrenz haetten, da es extrem viele Publikationen und Forschung in dem Bereich gibt. Scheint halt nicht in Produkten zu landen..

Danke fuer den Thread. Ich suchte eh nach einem neuen Projekt :D https://github.com/buriburisuri/speech-to-text-wavenet sowas ist halt auch schon 5 jahre al;t und tut verdammt gut.

MS hat nuance auch vor ein paar monaten gekauft.. wird bestimmt bald in Windows eingebaut
 
schon witzig ... win7 hatte ein brauchbares Programm als Systemtool :) unter win10 gabs dann nur noch Cortana und Online etc :( eigentlich schade aber wohl der zahn der zeit
 
@Pyrukar unter Windows 7 waren das noch mit viel liebe & arbeit implementierte, getunte, extrem effiziente phonologische Modelle.

Was MS, Google, Amazon, Ali & Co machen sind recht dicke neuronale Netze, die fuers inferencing verdammt viel Power brauchen. Da kann schonmal der T Teil einer RTX2020 voll mit einer Person zu tun haben
 
@cartridge_case Kommt drauf an welches Vokabular und welche Fehlerquote da benoetigt sind, wie viele Akzente / Slangs mit welcher Praezision erkannt werden sollen, u.a
Bei Lokaler Spracherkennung in Smartphonesr sind in den letzten Jahren auch fast immer phonologische Modelle zum Einsatz gekommen - schau mal in Richtung Kohortenmodell.

Fuer die neuroanlen netze gibt es in immer mehr smarphones aics, bzw. genauergesagt dedizierte bereiche im SoC die nichts anderes machen, als sprache zu erkennen. Hier kommen oft relativ kleine Modelle zum Einsatz.
(Nur Wissen, welches ich aus Talks auf machine learning Konferenzen, die ich besucht habe weil ich in den Slots noch nichts vor hatte, mitgenommen haben. Paper lesen und eigene Erfahrung habe ich in dem bereich wenig)
 
Lass mal nen 4 Jaehriges Kind aus der Schweiz oder meintwegen aus Hessen damit reden.. Da wirds schon hart.
Wobei Spracherkennung bei kindern komplette Black magic ist :D

gerade mal den wikipedia artikel ruas gesucht.. der ist in der Tat uebrraschend gut. Auf deutsch sogar besser als im englischen. https://de.wikipedia.org/wiki/Kohortenmodell
 
  • Gefällt mir
Reaktionen: PHuV
Das war jetzt viel input. Es gibt also nur Alte Programme die Ok sind und neue die keiner Kennt. Schwer da muss ich wohl selbst testen.
 
Liste hab ich gar nicht. Bin nur auf die idee gekommen das mir das meinen Workflow deutlich vereinfachen könnte. Hab sowas noch nie genutzt und hatte gehofft hier finde ich wen der sich damit gut auskennt und eine empfehlung geben kann.
 
Schau Dir mal diesen Beitrag an. Geht mit Windows Hausmittel.

 
Also Windows Spracherkennung geht schonmal nicht da sie einen Schimpfwort filter hat. Da ich Erotische Texte Sprechen muss ist das ganz dämlich wenn der Halbe Satz aus ******* besteht. ;D


Wichtig ist das das Programm die Enter Taste beätigen lässt wenn ich Enter oder so sage. Windows schaltet sich auch nach jedem Textfeld ab und ich muss es neu Aktivieren was sehr ungünstig ist.

Ich Spreche/Schreibe kurze Texte 2-3 Zeiler davon aber etwa 1500 stück am Tag. Dafür sollte das Programm quasi perfekt sein.

Kann ich das Dragon dafür nutzen? 200 Euro sind natürlich viel Geld aber wäre es mir auf jedenfall wert.

P.S Dragon hab ich gerade mit dem Support telefoniert. die meinten das man mit ihrem Programm nicht die Enter Taste auf befehlt beätigen kann. Was das ganze schon wieder ausschließt. Schade wäre super da es auch am Handy funktionieren würde.
 
Zuletzt bearbeitet:
Kann ich irgendwo im Windows den Schimpfwort Filter für die Voiceerkennung wegmachen? Und es wäre top wenn das Programm nicht ausgehen würde nachdem ich enter drücke.

Hätte nicht gedacht das es in der Heutigen Zeit keine anständige Sprachsteuerung gibt.
 
Zurück
Oben