Ist Vista per Sprachbefehl hackbar?

Jirko Alex
46 Kommentare

Windows Vista stellt für Microsoft eine neue Stufe der Sicherheit und Nutzerfreundlichkeit dar, doch gerade letzteres könnte für Attacken der ungewöhnlichen Sorte sorgen. So ist es möglich, Vista Sprachbefehle beizubringen und es zu steuern; eine abgespielte Audio-Datei soll dies aber ebenso können und schädliche Befehle initialisieren.

Das dafür notwendige Feature ist die Vista-eigene Spracherkennung, mit der sich beliebige Befehle ausführen lassen, wenn sie denn aktiviert ist. So kann man Ordner öffnen und löschen, Programme aufrufen und Texte diktieren. Eigentlich ein komfortables und recht gut funktionierendes Feature, das aber bei unbedarfter Nutzung und Ausnutzung durch Dritte missbraucht werden kann. So beklagte sich George Ou als erster über die ungesicherte Funktionsvielfalt der Spracherkennung. So war es ihm möglich, via aufgenommener Audio-Datei die Spracherkennung zu aktivieren, den Windows-Explorer aufzurufen und den Dokumenten-Ordner zu löschen. Nebst der Leerung des Papierkorbes – ebenfalls über die selbe Aufnahme – ergab dies zwar keinen systemkritischen Schaden, jedoch ein für den potenziell betroffenen Nutzer unschönes Ergebnis.

Diese Art der Windows-Attacke besitzt jedoch mehrere Hürden, die der Angreifer überwinden muss. So sind die grundlegenden Voraussetzungen hierfür das Vorhandensein eines Mikrofons und von PC-Lautsprechern. Zudem muss die Vista-Spracherkennung gestartet worden sein. Dann jedoch ist es möglich, über eine Audiodatei die Spracherkennung zu aktivieren. Dies ist nämlich mit einem vordefinierten Befehl möglich, der im deutschen Vista "Jetzt zuhören" lautet. Windows nimmt dem folgend alle Sprachbefehle entgegen, inklusive der Navigation durch die Startleiste, durch Programme oder die Bearbeitung von Ordnern. Die Befehle müssen jedoch deutlich ausgesprochen werden, die Lautstärke hoch genug sein, um das Mikrofon auch zu beeinflussen, und der Prozess darf nicht an der Benutzerkontensteuerung von Windows scheitern. Diese nämlich lässt sich nicht per Sprachbefehl steuern. Das als Beispiel angeführte Löschen von Ordnern ist aber auf diesem Wege möglich.

Nach dem Starten der Spracherkennung kann mit dieser Windows gesteuert werden (links). Als Hilfe können alle Buttons mit Zahlen belegt werden (rechts), es geht aber ebenso ohne.

Microsoft selbst räumt zwar ein, dass auf diese Weise eine Art Angriff ausgeführt werden kann, misst der von Ou gefundenen Lücke jedoch keinen bedeutenden Status bei. So müsse die entsprechende Audio-Datei überhaupt erst einmal abgespielt werden und zudem das Mikrofon auch auf die Lautsprecher reagieren, was erst ab einer bestimmten Lautstärke möglich ist. Zudem bestimmt auch die Qualität der Aufnahme, ob Windows den Befehl versteht – scheitert einer der aufgenommenen Befehle an der Spracherkennung, so kann die Befehlskette nicht ausgeführt werden. Das Löschen des Dokumenten-Ordners beispielsweise ist erst möglich, nachdem auch das Startmenü aufgerufen und der Dokumenten-Ordner im Explorer ausgewählt wurde. Zudem können keine tiefgreifenden Änderungen im System vorgenommen werden, da hierfür die Benutzerkontensteuerung nötig ist, die per Hand bestätigt werden muss. Auch ein einfaches Ausstöpseln des Mikrofons oder der Lautsprecher bei Abwesenheit kann den Sprachattacken bereits entgegenwirken, so Microsoft weiter.

Nichtsdestotrotz könnte diesem simpelsten aller Angriffe begegnet werden, wenn sich beispielsweise ein eigenes Aktivierungspasswort für die Spracherkennung konfigurieren ließe oder Microsoft einen Schutz vor über die Lautsprecher ausgegebene Befehle einbauen würde. Solange dies nicht der Fall ist, sollte man auf die Spracherkennung zumindest ein halboffenes Auge haben. Ein Popup, das ungewöhnlich klar ausspricht, was der Nutzer tun soll, könnte sonst demnächst mehr bewirken als nur Nerven zu kosten.