Voice XML: Bye, bye, Bandansage
geschrieben von Alexander Kales, 2741 Views
Erinnern Sie sich noch an die Uhrzeitansage per Telefon? Damals, in den 90ern, leierte eine Frauenstimme, dass es beim nächsten Piepton 12 Uhr, 17 Minuten und 43 Sekunden sei. Ihr Einwand, dass Sie gerne wüssten, wie spät es gerade in New York ist, war das der Frauenstimme herzlich egal: "Beim nächsten Piepton ist es 12 Uhr, 18 Minuten und 9 Sekunden."
Heute, im 21. Jahrhundert, läuft das Gespräch völlig anders ab. Die Frauenstimme verrät Ihnen nicht nur die genaue Uhrzeit in New York, sondern liefert den Wetterbericht für Miami gleich dazu. Genau darum haben Sie am Telefon ja auch gebeten. Die Datenbeschreibungssprache VoiceXML sorgt dafür, dass der Computer am anderen Ende der Leitung Sie versteht. Denn VoiceXML macht intelligente Sprachverarbeitung möglich – jedenfalls theoretisch.
Den Grundstein für die Datenbeschreibungssprache legten 1999 die Kommunikationskonzerne AT&T, Lucent und Motorola und der Computerriese IBM. Ihr Ziel: Informationen aus den Internet auch übers Telefon abfragbar zu machen. Doch fünf Jahre dauerte es, bis die Idee Einzug in die Programmier-Paxis hielt: 2004 nahm das WWW-Konsortium das clevere VoiceXML in seine Standard-Liste auf –und hob es damit auf eine Ebene mit dem prominenten HTML. Damit ist – ebenfalls theoretisch – der Weg für den VoiceXML-Erfolg frei.
Zwischen dem Klassiker HTML und dem Neuling VoiceXML gibt es eine ganze Reihe Parallelen. Mit VoiceXML lassen sich Sprachprogramme direkt kodieren, mit HTML ebenso direkt Benutzeroberflächen für das Internet. Auch im Quelltext sehen sich beide Datenbeschreibungssprachen ganz schön ähnlich: Es gibt spitze Klammern und selbstständige Tags, die durch bestimmte Attribute ergänzt werden können.
VoiceXML ist für die Kommunikation zwischen Mensch und Maschine ausgelegt: Deswegen versteht es gesprochene Benutzereingaben, kann Text in Sprache und Sprache in Text umwandeln – ein leistungsstarkes Computersystem im Hintergrund vorausgesetzt. Doch wird der Mensch-Maschine-Dialog allzu frei, stößt auch die Datenbeschreibungssprache an ihre Grenzen. Bei ganzen Sätzen etwa oder Füllwörtern muss VoiceXML schnell kapitulieren.
Fassen Sie sich also kurz! Wer dem Sprachcomputer zu viel erzählt, bekommt womöglich nicht den Wetterbericht für Miami, sondern den für Minden in Westfalen.
» Artikel drucken
» Themenbereich Voice XML
» Artikel Bereich Start