Spracherkennung wird zur wichtigsten Interaktionsform für eingebette Geräte. Smarte Assistenten wie Amazons Alexa halten in die eigenen vier Wände Einzug, doch es ist einiges zu beachten, wenn man Sprachinteraktion in eigenen Projekten nutzen möchte.
In diesem Vortrag sollen alle Komponenten eines Sprachinteraktionssystems anhand von Beispielen vorgestellt werden. Neben vielen technischen Aspekten auf dem Weg vom Nutzer über das Mikrofon bis zur KI und wieder zurück sind User-Experience, Datenschutz und Interoperabilität mit anderen Diensten Themen des Beitrags.
Vorkenntnisse
IoT-Grundlagenwissen sollte ausreichen.
Lernziele
Es soll vermittelt werden, was alles zu beachten ist, wenn man Spracherkennung in eine eigene Lösung integrieren möchte: Fallstricke, Dos and Don'ts sowie etwas Best Practice.
// Jan Wellmann
interessiert sich seit der frühen Jugend für Audiotechnik, Signalverarbietung und (elektronische und nicht ganz so elektronische) Musik. Nach dem Studium der Elektrotechnik führte ihn der Weg über mehrere Stationen im Bereich Audio-Enginerring und digitaler Signalverarbeitung – oft auf eingebetteten System – 2012 zum Fraunhofer IDMT, wo er heute das Themenfeld Spracherkennung leitet.