Spracherkennungssoftware – Effizient Texte produzieren
Das Sprechen ist ein Vorgang, der den meisten Menschen nur wenig Sorge bereitet. Wir unterhalten uns häufig ohne große Probleme, tauschen uns über unsere alltäglichen Erlebnisse aus. Wir telefonieren mit Verwandten und Freunden, geben unsere Meinungen in Diskussionen preis, bestellen im Restaurant und auch am Arbeitsplatz bzw. in der Schule kommunizieren wir miteinander. Wesentlich schwieriger ist es für viele Menschen, die Worte aufzuschreiben, Texte zu produzieren. Per SMS oder Email mag das noch funktionieren, bei Briefen, Hausarbeiten und Ähnlichem aber treten ungewohnte Probleme auf. Eines besteht beispielsweise darin, dass wir Rechtschreibfehler produzieren, die bei der verbalen Verständigung gar nicht so wirklich ins Gewicht fallen, weil man sie nicht sieht.
Nur wenige Menschen des 21. Jahrhunderts können von sich behaupten, dass sie wirklich gute Kenntnisse in Sachen Grammatik und Rechtschreibung vorweisen. Zudem wechseln die einzelnen Richtlinien auch mit den Jahren. Ein weiterer Nachteil des Schreibens scheint im Faktor Zeit begründet. Während der Mensch gut 150 Wörter pro Minute sprechen kann, liegt die Anzahl des möglichen Schreibens bei gerade einmal 50. Selbst, wenn wir also heutzutage auf die Tastatur eines Laptops zurückgreifen können, sind wir nicht in der Lage, eine ähnliche Geschwindigkeit wie beim Reden zu erreichen. Die vorliegenden zwei Aspekte geben bereits eine gute Auskunft über den Nutzen, den eine Spracherkennungssoftware für den Menschen haben könnte. Dank dieser technischen Errungenschaft kann den Problemen beim Schreiben aus dem Weg gegangen werden. Dabei ist die lange Palette noch keinesfalls komplett beleuchtet.
Fehler ausgemerzt, Geschwindigkeit erhöht – Spracherkennungssoftware lohnt sich
Während uns Textprogramme wie Microsoft Word gerne vorgaukeln wollen, dass sie unsere schriftlichen Fehler komplett beheben, sieht die Realität doch etwas anders aus. Bei substantivierten Verben beispielsweise bleiben sie handlungsbeschränkt, falsche Artikel können ebenfalls nicht behoben werden. Bei einer Spracherkennungssoftware ist das ein wenig anders. Diese analysiert in Windeseile nicht nur die Worte selbst, sondern auch die dazugehörigen syntaktischen Funktionen. So wird richtig geschrieben und auch noch flektiert. Schon kurz nach der Installation weisen derartige Programme eine Richtigkeit vor, die bei mehr als 90 % anzusiedeln ist. Um diese weiter zu perfektionieren, kann man die eigene Software fortan trainieren. Dies erfolgt zum einen auf manuellem Weg durch die Eingabe von Eigennamen, Straßennamen oder speziellen Fachtermini, zum anderen automatisch durch ein anfängliches Coaching, welches in weniger als einer halben Stunde absolviert ist. Hierbei arbeiten die meisten Programme mit Texten, die vom Sprecher eingesprochen werden sollen. Anhand dieser Aufnahme erlernt die Spracherkennungssoftware dialektale Eigenheiten und die individuelle Intonation des Nutzers. Dies ist ohne Frage notwendig, da jeder Mensch in Bezug auf Betonung und Geschwindigkeit anders spricht. Ist die Software dann aber auf die individuellen Eigenschaften des Sprechers programmiert, steht einer perfekten Nutzung, die ein zuverlässiges Arbeiten bei einer Fehlerrate von weniger als 0,1 % ermöglicht, nichts mehr im Weg. So lassen sich dann Texte notieren, die mit zwei Charakteristika glänzen. Die Fehler sind nahezu komplett ausgemerzt und binnen kürzester Zeit ist alles aufgeschrieben, was sonst mindestens doppelt, wenn nicht sogar dreimal so lange gedauert hätte.
Was gibt es für Spracherkennungssoftware?
Genau genommen lohnt sich die Anschaffung einer Spracherkennungssoftware für jedermann. Alles, was neben dem Programm benötigt wird, ist ein Mikrofon oder auch ein Diktiergerät. Hierbei sollte man nicht versuchen zu sparen. Schließlich ist die akustische Qualität von hoher Bedeutung. Zu viele Hintergrundgeräusche schaden dem Effekt. Generell gilt, dass die Aufnahme umso besser abgetippt werden kann, je besser sie auch im Gerät ankommt. Natürlich unterscheiden sich auch die einzelnen Programme in ihrer Ausführung. Besonders hochwertige Software findet man bei Linguatec und Dragon, wobei es auch hier bei den einzelnen Produkten starke Unterschiede gibt.
Linguatec Voice Pro 12 vs. Dragon Dictate 3
[table width="750" colwidth="250|250|250" colalign="left|center|center"]
Programm; Lingautec Voice Pro 12;Dragon Dictate 3
Preis;169 €;149€
Systemvoraussetzungen;Intel Pentium 2,4 GHz oder 1,6 GHz Dual Core-Prozessor , 1 GB freier Arbeitsspeicher, 1 GB freier Festplattenspeicher, DVD-Laufwerk für die Installation, min. Windows Vista, Internetzugang für die Produktaktivierung;Intel-basiertes Mac-System mit Mac OS X Lion (10.7) oder OS X Mountain Lion (10.8), 2 GB Arbeitsspeicher, 4 GB freier Festplattenspeicher, Internetverbindung für die Registrierung erforderlich, DVD-Laufwerk für die Installation
Funktionen;SpeechCorrect, SmartCommand; ExpressEditor, Smart-Format-Regel
Vorteile;dreifache Schreibgeschwindigkeit, Speicherung ganzer Absätze, minimale Fehlerrate; dreifache Schreibgeschwindigkeit, perfekte Erkennungsrate, hohe Kompatibilität
Nachteile;verhältnismäßig schwache Erkennungsrate, nicht nachrüstbar;enger Bearbeitungsrahmen
[/table]
Linguatec Voice Pro 12 – Spracherkennungssoftware mit SpeechCorrect
Durch die Kooperation mit Microsoft hat Linguatec ein Programm auf die Beine gestellt, was durchaus zu gefallen weiß. Voice Pro 12, das es wie viele andere Spracherkennungssoftware auch für einzelne Bereiche (Medizin, Recht, Sport) gibt, lockt mit der rasanten Erledigung des alltäglichen Schriftverkehrs. Versprochen wird, dass die Tippgeschwindigkeit mit der Sprachgeschwindigkeit mithalten kann. In der Tat wird dank des Programms so ein Tippen in dreifacher Geschwindigkeit möglich, wohlgemerkt ohne viele Rechtschreibfehler. Gerade hierbei zeigt sich, dass im Bereich der Spracherkennungssoftware stetig vorangekommen wird. Einen ähnlich guten Wert konnte die Vorgängerversion nämlich bei weitem nicht erreichen. Die Premiumversion, die derzeit bei 169 € liegt, erkennt mehr als eine Million Wörter ohne Probleme und ist dabei auch mit Kenntnissen aus verschiedensten Gebieten (u.a. EDV, Wirtschaft, Technik) bestückt. Selbstverständlich zeigt sich die Software in Bezug auf Eigennamen und Sonstiges individuell anpassbar. Auch dialektale Eigenarten und persönliche Aussprachen werden schnell erkannt. Mithilfe der intelligenten Bauart lassen sich sogar durch das Einsprechen einzelner Stichworte ganze Textbausteine bzw. Absätze einfügen. Als ganz besonderes Funktionshighlight erwartet den Nutzer die Neuheit SpeechCorrect. Diese erkennt, dass auch identisch klingende Begriffe anders geschrieben werden können. Zusätzlich gehört es bei Linguatec zum festen Programm auch das sonstige Werkeln am PC zu vereinfachen. Befehle wie „Datei drucken“ können fortan per Sprache gesteuert werden. Dank SmartCommand wird so unter anderem auch das Emailschreiben an einen Geschäftskollegen mit nur einer Aussage eingerichtet. Negativ zu sehen ist, dass man in Bezug auf das Nachrüsten keinerlei Chance bekommt. Außerdem erreicht die Spracherkennung im Vergleich mit anderen Vertretern nicht den allerbesten Wert.
Dragon Dictate 3 – Spracherkennungssoftware für das Macbook
Dragon Dictate 3 ermöglicht einem schon kurz nach der Installation und dem folgenden Sprach-Diktier-Training einen größtmöglichen Umfang an verschiedensten Funktionen. Der Hersteller Nuance, der sich mit dieser Spracherkennungssoftware auf dem Markt eine absolute Spitzenposition ergattern konnte, hat wie auch Linguatec im Vergleich zur vorherigen Version nachgerüstet. Die Erkennungsgenauigkeit ist immens hoch, liegt wie angegeben wirklich bei rund 99 %. Natürlich ist die Software anpassungsfähig und justiert entsprechend der Sprachgewohnheiten des Nutzers fehlerfrei nach. Das Erlernen von Abkürzungen, Eigennamen und anderen persönlichen Eigenvariationen ist möglich. Die perfekte Textkonstruktion wird durch eine natürlich klingende Textvorlesung optimal abgerundet. Mittlerweile lassen sich mit dem Dragon Dictate nicht nur Texte schreiben, sondern auch nahezu alle Anwendungen auf dem Mac-Betriebssystem steuern. Posts bei Facebook und Twitter sind genauso möglich, wie das Erstellen von Präsentationen oder Schreiben von Emails. Mithilfe des ExpressEditors kann man in Windeseile alle Textinhalte auf die jeweilige Applikation übertragen. Dank der hohen Kompatibilität ist es auch unterwegs möglich, vom Programm zu profitieren. So lassen sich auf dem iPhone®, iPad® und iPod® Texteingaben einsprechen und speichern, die dann später ins System übertragen werden können. Für einen Preis von gut 149 € bekommt man also ein sehr gutes Komplettpaket. Einer der Bestandteile, die „Smart-Format-Regel“ sorgt dafür, dass Worte auch in Formeln bzw. Zeichen umgesetzt werden, so zum Beispiel im Fall von Prozent/%. Hinderlich ist es dann nur, wenn man dies wieder verändern will. Dabei unterlaufen ebenso Fehler wie, wenn man andere vorher getätigte Formatierungen verändern möchte. Insofern gibt diese Spracherkennungssoftware die Gangart selbst vor, ist im Nachhinein nicht allzu gut zu bearbeiten.