Automatische Spracherkennung Allwissender Computer bleibt Utopie
"Computer, sag mir alles über die Erde", verlangt Captain Kirk in Star-Trek - und erhält prompt Auskunft. Mehr als 800 Forscher reden ab heute in Saarbrücken über automatische Spracherkennung. Maschinen, die problemlos auf Sprach-Kommandos reagieren, bleiben aber Utopie, so Experte Reithinger im tagesschau.de-Interview.
"Computer, sag mir alles über die Erde", verlangt Captain Kirk in Star-Trek - und erhält prompt Auskunft. Mehr als 800 Forscher aus aller Welt reden ab heute auf dem Weltkongress der Phonetik in Saarbrücken über die Möglichkeiten automatischer Spracherkennung. Von Maschinen, die problemlos auf Sprach-Kommandos reagieren, ist die Forschung aber noch weit entfernt, sagt Norbert Reithinger vom Deutschen Forschungszentrum für künstliche Intelligenz im tagesschau.de-Interview.
tagesschau.de: Was kann die Spracherkennung heute leisten?
Norbert Reithinger: Wir haben im Alltag schon ziemlich viel damit zu tun. Schon vor zehn Jahren gab es Spracherkennung im Auto: Man konnte beispielsweise das Radio über Sprache bedienen. Inzwischen geht das auch mit Navigationssystemen. Ein anderes Beispiel sind Telefondialogsysteme etwa im Bereich Telefon-Banking oder Zugauskunft. Die haben einen schlechteren Ruf, als sie es verdienen. Wenn man sich darauf einlässt, funktionieren sie sehr gut, sehr schnell und sehr sicher. Auch Diktiersysteme haben heute eine sehr hohe Erkennungsgenauigkeit. Sie liegt bei über 99,9 Prozent. Das ist weniger als ein falsches Wort pro Seite.
tagesschau.de: Warum setzt sich die Diktierfunktion dann nicht durch?
Reithinger: Diktieren muss man können. Das ist keine Frage der Spracherkennung. Man muss, wie der Schriftsteller Kleist sagte, über die allmähliche Verfertigung der Gedanken beim Reden hinaus sein. So ein Gerät erkennt genau das, was man sagt. Jedes „Äh“ steht also hinterher im Text.
tagesschau.de: Wenn alles so gut funktioniert, woran forschen Sie dann überhaupt noch?
Reithinger: Maschinen sollen Sprache auch unter schwierigen Bedingungen erkennen - also entweder bei Hintergrundgeräuschen oder bei verschiedenen Sprechweisen. Ein Spracherkenner soll mit unterschiedlichen Dialekten, Sprachmelodien und Akzenten zurechtkommen. Eine weitere Herausforderung ist, dass die Systeme Wörter erkennen, die nicht im vorher eingespeisten Wortschatz vorkommen.
"Ich bin in Berlin, wie komme ich zum Alexanderplatz?"
tagesschau.de: Kann der Computer irgendwann komplexe Sachverhalte nicht nur erkennen, sondern auch begreifen?
Reithinger: Das Ziel muss sein, dass Benutzer Geräte bedienen können, ohne Kommandowörter lernen zu müssen. Dass der Benutzer also eine Frage oder Aufforderung in eigenen, nicht formalisierten Worten an den Computer richten kann. Wir forschen aktuell in unserem Projekt SmartWeb an der Möglichkeit, eine Frage an verschiedene Suchmaschinen und Anwendungen im Internet per Sprache einzugeben. Dann könnte man sagen: Ich bin hier in Berlin, wie komme ich zum Alexanderplatz? Das Gerät würde das verstehen und eine Wegbeschreibung zeigen. Oder man kann im Auto einen Knopf drücken und fragen: Wo kann ich hier billig tanken?
tagesschau.de: Das heißt, man hat dann einen intelligenten Gesprächspartner?
Reithinger: "Gesprächspartner" hören wir Wissenschaftler nicht gerne. Ein Gesprächspartner hat viele soziale Randbedingungen. Aber man hat ein System, das versteht, was man umgangssprachlich sagt und als Antwort die Information gibt, die man sucht.
tagesschau.de: Muss ich dann aufpassen, dass sich mein Computer nicht bei allem, was ich sage, angesprochen fühlt?
Reithinger: Nein. Man kann zum Beispiel ein Schlüsselwort, das nicht in der Sprache vorkommt, vor dem eigentlichen Kommando sprechen. Erst damit aktivieren Sie das Gerät. Diese Schlüsselwörter werden so gewählt, dass sie in keiner Sprache dieser Erde vorkommen und deshalb besteht auch kein Risiko, dass Sie es zufällig sagen.
Universeller Assistent ist Ziel der Forschung
tagesschau.de: Haben wir alle bald, wie im Science-Fiction-Film, eine Brosche am Hemd, auf die wir drücken und mit Computern kommunizieren?
Reithinger: Das ist der 'Heilige Gral' unserer Forschungsaktivitäten, auf den wir hinarbeiten: der universelle Assistent. Davon sind wir allerdings noch weit entfernt. Aber die Technik hilft heute schon vielen Menschen: Geräte, die Blinden Texte vorlesen sind Standard. Auch Sprachbediengeräte für Gelähmte gibt es schon.
tagesschau.de: Noch haben die Computer eine recht monotone Stimme. Wann werden sie wie ein Mensch klingen?
Reithinger: Es gibt schon Stimmen, die sehr gut verständlich und angenehm sind, wie beispielsweise die freundliche Dame des Navigationssystems.
tagesschau.de: Die sagt aber auch zehn Mal „Bitte wenden“ im gleichen Tonfall.
Reithinger: Unsere Stimme ist ein sozial hochkomplexes System. Wir hören daraus Freude, Ärger und vieles mehr. Die Stimme im Auto ist immer neutral. Stellen Sie sich vor, sie spricht zu Ihnen bei jeder Wiederholung aggressiver und sagt schließlich: 'Jetzt wende halt endlich!' Das dürfte Sie stören. Allerdings kann ein Benutzer schon bei vielen Navigationssystemen die Stimme personalisieren. Sinnvoll ist die Variation in der Stimme bei virtuellen Agenten, wie etwa in Second Life, wo man in einer virtuellen Welt ist und die Figuren menschlich wirken sollen.
Das Interview führe Anja Mößner, tagesschau.de