Sprachsteuerung mit dem PC

[display_podcast]
Gesprochene Version des Artikels mit Anmerkungen


 

Hallo liebe Leserinnen und liebe Leser,

Das hier ist ein Text, den ich mit der Spracherkennung diktiert habe. Es geht ein wenig langsam aber die ersten Ergebnisse finde ich schon ganz gut. Man darf nicht so schnell sprechen und sollte den Satz in mehrere Teile einteilen. Der Computer checkt natürlich nicht ob das Gesagte Sinn ergibt oder die Satzzeichen richtig gesetzt sind.

Unter Windows findet man die Spracherkennung ganz einfach, was hier erklärt wird:
http://windows.microsoft.com/de-de/windows/dictate-text-speech-recognition#1TC=windows-7

Unter Windows 8 kann man z.B. Die Windows Taste und Q gleichzeitig drücken. Dann den Begriff “Spracherkennung” eingeben und das blaue Symbol mit dem Mikro anklicken.

Windows 7 oder Vista-Nutzer können die Spracherkennung über
“Systemsteuerung” > “Center für erleichterte Bedienung” > und “Spracherkennung” finden.

Die folgenden Funktionen sind eigentlich relativ selbsterklärend.

 

Hardware einrichten

Zuerst muss das Mikro korrekt eingerichtet werden. Es kann nicht schaden mit einem Rechtsklick auf dem Lautstärke-Symbol “Aufnahmegeräte” auszuwählen und zu schauen, ob bei dem angeschlossenen Mikro ein grüner Haken ist und der Pegel auf die Stimme reagiert.

In meinem Falle ist das z.B. “FrontMic” und untendrunter der Grüne Haken “Standardgerät”.

Mit einem Rechtsklick auf das Audio-Gerät kann es als Standardgerät festgelegt werden. Hier findet man auch die sonstigen Eigenschaften. Wenn man es noch nicht überprüft hat, sollte man auf “Eigenschaften” und “Pegel” gehen und hier den Pegel möglichst sinnvoll einstellen. Meistens bedeutet das, dass man die Lautstärke (das Eingangssignal) ganz nach oben schraubt. Auch die Mikrofonverstärkung sollte nach oben gesetzt werden. Das betrifft vor allem passive Mikrofone, wie man sie z.B. bei Headsets oder Webcams findet.

Durch die Hilfe arbeiten

Danach kann man sich durch die Hilfe und Einführungstouren arbeiten, die ganz gut gemacht sind und alles kompakt erklären.

Anscheinend ist es auch sinnvoll, das “Computer trainieren”-Programm zu durchlaufen, damit der Computer sich an die eigene Stimme besser anpasst. Es ist auch möglich, die fertigen Profile an Microsoft schicken zu lassen, damit die ihren Algorithmus besser anpassen können. Wer´s mag.

Beim ersten Mal klappte die Sprachsteuerung schon ganz gut.

Man klickt auf “Spracherkennung starten”, wodurch sich ein kleines Mini-Fenster öffnet, das immer im Hintergrund läuft. Dieses Fenster beinhaltet ein blaues Mikrofon und die Rückgabewerte und Nutzer-Kommunikation der Spracherkennung-Software.

Zum Steuern des Computers muss man erst mal die Spracherkennung “scharf schalten”, am einfachsten geht das mit der Tastenkombination “Strg+Windows-Taste”.

Das Programm wechselt zwischen “Zuhören” und “Ruhezustand”, es kann nur im “Zuhören”-Modus Sprache erkannt werden- logisch. Leider konnte man die Spracherkennung nicht mit Worten alleine starten oder beenden. Es wurde dann doch immer der Griff zur Tastenkombination notwendig.

 

Sobald das Programm “scharf” ist, kann der Computer mit Sprachbefehlen gesteuert werden.
Einfache Dinge (unter Windows 8) sind z.B.

”Start” – PC wechselt auf die Startseite
”Apps” sollte die Apps-Liste anzeigen, hier das erste Problem: Es wird nur die deutsche Aussprache mit dem langen “A” nicht aber das englische “Äpps” erkannt.

“Bildlauf nach rechts” – funktioniert.
”Desktop” – zurück in den Desktop-Modus
”den ersten Begriff eines aktiven Fensters”- Computer wechselt auf das Fenster.

Weitere Begriffe kann man durch ausprobieren herausfinden, das ist tlw. sogar ganz witzig und macht Spaß.

Diktat

Probleme gab es nur beim Diktat, anscheinend werden nicht alle Programme unterstützt. Im Idealfall soll der Computer automatisch erkennen, ob jetzt ein Befehl oder ein Diktat kommt. Ist das Wort aus der Befehlsliste, kann er reagieren, wenn nicht, wird es als Diktat aufgenommen.

Gute Erfahrungen habe ich mit dem Windows Live Writer gemacht, den man sich hier herunterladen kann: http://www.chip.de/downloads/Windows-Live-Writer-2012_21185162.html

Dieses Programm ist gleichzeitig auch ein Programm zum Schreiben und veröffentlichen von Blog-Artikeln. Es ist mit anderen Anbietern wie z.B. WordPress kompatibel.

Schwierigkeiten gibt es nur wenn englische Begriffe wie z.B. “Blog” oder Anführungszeichen verwendet werden sollen. Ein bisschen mit der Hand nachzubessern ist also unumgänglich.

Sehr schön funktioniert hingegen die Sprachsteuerung des Diktates.

Z.B. mit Befehlen wie “Wort auswählen”, “Wort löschen” (das letzte Wort wird gelöscht) oder “Wort korrigieren”. Gerade mit dem letzten Befehl kann man die Software lernen lassen. Richtig zuverlässig funktioniert es aber leider noch nicht. Anscheinend ist auch die Länge der Sätze entscheidend damit die Kontext – sensitive Erkennung verbessert wird.

Gut funktioniert hat auch das Steuern im Text z.B. mit dem Begriff “Zum Satzanfang wechseln” , “WORT auswählen” und dann “großschreiben” oder “Großschreibung WORT”. Am besten ein bisschen damit experimentieren und sich selbst die Begriffe einprägen, dann könnte die Steuerung eines Tages sehr schnell und unkompliziert werden..

Auch Befehle wie “Rücktaste” oder “Eingabetaste” funktionieren. “Enter” hingegen wird als Wort interpretiert. Die Frage ist also wie man die Spracherkennung im täglichen Leben einsetzen kann. Und ob es sie je mehr als ein Spiel mit den Fähigkeiten der modernen Computer sein kann.

Wenn das Ganze mal gut funktioniert hat man aber schon ein interessantes Gefühl wie z.B. in den Star-Trek – Filmen. Ich würde sagen die Zukunft kann kommen!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Protected with IP Blacklist CloudIP Blacklist Cloud