Mittwoch, 24. März 2010

Speech-to-Text gehört wohl immer noch ins Reich der Märchen

Mein Kunde Communology, deren PR ich betreue, hat mir neulich eine Geschichte erzählt, die ein wenig an Märchen von den Heinzelmännchen erinnert. 

In den USA bieten einige Anbieter wir z.B. Google Voice, AT&T oder Vonage Speech-to-Text als Zusatz-Service für Visual Voicemail Dienste an. Sprachnachrichten werden automoatisch transkribiert und als Text-File geliefert.


Sehr praktisch z.B. in Meetings, wenn es keine Gelegenheit gibt, die Voicemail abzuhören. Ein unauffälliger Blick in die Text-Nachrichten ist aber fast immer möglich. Warum gibt es den Dienst Voicemail to Text aber eigentlich noch nicht in Deutschland? Ein Grund für die „Verspätung“ ist wohl, dass es mit der automatischen Transkription durch die Speech-to-Text-Software noch nicht so weit her ist. Bei Google Voice ist die Qualität z.B. wohl ziemlich gemischt und es kommt oft ziemlicher Nonsens heraus. Für wirklich brauchbare „Abschriften“ braucht es noch ein zusätzliches Element, das die Anbieter oft eher verschämt den „human support“ nennen. Tatsächlich werden die automatisch erzeugten Texte bei einigen Anbietern noch von Menschen bearbeitet (meist von Contact Center-Agenten in Asien). Ich fand das eigentlich ganz witzig, ein wenig wie das Märchen von den Heinzelmännchen, die unbemerkt Arbeiten verrichten. Aber vor dem Hintergrund des Datenschutzes ist es dann gar nicht mehr so zum Lachen: Wer möchte schon, dass Fremde private Gespräche oder gar vertrauliche Inhalte von Fremden mitgehört und aufgezeichnet werden? Zumal die Anrufer davon ja gar nichts wissen können.

In den USA und anderswo scheint das kein so großes Problem zu sein. In Deutschland sind allerdings nicht nur die Konsumenten sensibler, auch die Telekommunikationsanbieter verhalten sich nach dem einen oder anderen Datenschutz-Skandal nun sehr viel vorsichtiger.

Aber dennoch wird es sehr wahrscheinlich bald solche Voicemail-to-Text-Services auch hierzulande geben. Nach meinem Kenntnisstand planen immerhin drei der vier Mobilfunker die Einführung. Und das, obwohl das Speech-to-Text-Softwareproblem noch keinesfalls gelöst und der „human factor“ weiter unverzichtbar ist. Man hat aber einen kreativen Work-Around gefunden: Es wird daran gearbeitet, die Sprachnachrichten mithilfe spezieller Software in Bruchstücken auf mehrere Transkriptionisten aufzuteilen, sodass kein fremder Mensch mehr einen zusammenhängenden Inhalt erfassen kann. Die bearbeiteten Fragmente werden durch die Software hinterher wieder zusammengesetzt. So ist sowohl der Textqualität als auch dem Datenschutz genüge getan.

Posted via email from thomas

Keine Kommentare:

Kommentar veröffentlichen