Technik

Technik

Spracherkennung

 

Bislang war es nur möglich, Texte über die Tastatur in den Computer einzugeben. Durch die so genannte Spracherkennungssoftware wurde es möglich, Sprache in Text umzuwandeln und das Betriebssystem nur mit Sprache zu steuern.

Die Vorteile:

Einer der größten Vorteile an dieser Art von Software ist die Schnelligkeit. Texte können wesentlich schneller gesprochen als eingetippt werden. Dies erlaubt im kommerziellen, aber auch privaten Bereich eine wesentlich zügigere Arbeitsweise.

Der nächste große Vorteil ist die Standortsunabhängigkeit. Es ist nicht notwendig, die ganze Zeit am Computer zu sitzen, wenn man Texte eingeben möchte. Verwendet man ein Bluetooth-Mikrofon, so kann man sich, je nach Reichweite, auch vom Computer entfernen. Des Weiteren bleiben die Hände frei für andere Tätigkeiten.

Gerade für Menschen mit einem Handicap bietet die Spracherkennungssoftware den sehr großen Vorteil, dass es nun auch ihnen möglich ist, den Computer intuitiv und ohne fremde Hilfe zu steuern.

Wie arbeitet eine Spracherkennungssoftware?

Für uns Menschen ist es ganz normal, Sprache zu verstehen. Wir sind in der Lage, mehr als einer Stimme zu folgen und können beim genauen Hinhören diese auch zuordnen. Was für uns Menschen so leicht und selbstverständlich ist, wird für einen Computer zu einer großen Herausforderung. Um unsere Sprache zu verstehen, muss er unsere gesagten Wörter in eine für ihn verständliche Form umwandeln. Die Schwierigkeit dabei ist, dass jede Stimme, je nach Herkunft, Alter sowie Geschlecht anders klingt und dass jedes einzelne Wort von einem anderen unterschieden werden muss.

Im ersten Schritt wird das aufgezeichnete Wort abgetastet und ein digitaler Code erstellt. Dieser Code wird in einer Datenbank mit zugewiesenen Wörtern verglichen. Das Wort, welches dem Code am ähnlichsten kommt, wird ausgewählt. Um die Genauigkeit zu erhöhen, wird in ausgereifteren Programmen die Wahrscheinlichkeit berechnet, mit der ein bestimmtes Wort folgt.

Vergleich zwischen kostenlosen und kostenpflichtigen Angeboten:

Da die Entwicklung erst seit einigen Jahren wirklich in Fahrt gekommen ist und die stetige Weiterentwicklung sehr viele Ressourcen verschlingt, sind kostenfreie Angebote kaum zu finden und wenn, dann sind diese kaum zu gebrauchen, wie nachstehendes Beispiel verdeutlicht:

Windows besitzt eine integrierte Spracherkennungssoftware. Mit dieser Software lässt sich der Computer steuern und Diktate aufnehmen. Jedoch ist die angebotene Software nicht mehr als eine Spielerei. Befehle wie das Starten von Programmen werden zwar recht zuverlässig ausgeführt, jedoch ist das Diktieren kaum möglich. Windows kennt einfach zu wenige Wörter und Begriffe.

Im Vergleich dazu eine kostenpflichtige Software: Diese kennt nicht nur mehr Wörter, Ausdrücke und Befehle, sondern kann das gesagte Wort auch besser in Text umwandeln, da es auf die individuelle Sprachweise des Anwenders eingeht.
Durch das Trainieren der Software und/oder ein besseres Mikrofon kann die Fehlerquote signifikant verringert werden. Eine Genauigkeit von 99% ist bereits heute problemlos erreichbar.

Follow Me

Beiträge zum Weiterlesen:

Copyright © 2024 Leo Oitzl. Alle Rechte vorbehalten.