Technik
Akustisches Modell
Komponente der Spracherkennung, die Audiomerkmale auf Laute oder Phoneme abbildet.
Das akustische Modell ist für die Analyse des eingehenden Audiosignals zuständig. Es lernt anhand großer Mengen an Sprachaufnahmen, welche Klangmuster welchen Lauten oder Phonemen entsprechen.
Tiefe neuronale Netze haben klassische versteckte Markov-Modelle bei dieser Aufgabe weitgehend ersetzt. Sie verarbeiten Spektrogramme des Audiosignals und geben Wahrscheinlichkeitsverteilungen über mögliche Laute aus.
Die Güte des akustischen Modells beeinflusst direkt die Erkennungsrate und ist entscheidend für die Leistung bei verschiedenen Stimmen, Dialekten und Hintergrundgeräuschen.
Verwandte Begriffe
Sprachmodell
Statistisches oder neuronales Modell zur Vorhersage wahrscheinlicher Wortfolgen.
Phonem
Kleinste bedeutungsunterscheidende Lauteinheit einer Sprache.
Spektrogramm
Visuelle Darstellung der Frequenzverteilung eines Audiosignals über die Zeit.
Deep Learning
Maschinenlernverfahren mit mehrstufigen neuronalen Netzen für komplexe Aufgaben.