Technik

Akustisches Modell

Komponente der Spracherkennung, die Audiomerkmale auf Laute oder Phoneme abbildet.

Das akustische Modell ist für die Analyse des eingehenden Audiosignals zuständig. Es lernt anhand großer Mengen an Sprachaufnahmen, welche Klangmuster welchen Lauten oder Phonemen entsprechen.

Tiefe neuronale Netze haben klassische versteckte Markov-Modelle bei dieser Aufgabe weitgehend ersetzt. Sie verarbeiten Spektrogramme des Audiosignals und geben Wahrscheinlichkeitsverteilungen über mögliche Laute aus.

Die Güte des akustischen Modells beeinflusst direkt die Erkennungsrate und ist entscheidend für die Leistung bei verschiedenen Stimmen, Dialekten und Hintergrundgeräuschen.

Sprache zu Text nutzen

Sprache transkribieren

Sofort im Browser, ohne Anmeldung.

Zum Rechner

Akustisches Modell

Sprache transkribieren

Verwandte Begriffe

Sprachmodell

Phonem

Spektrogramm

Deep Learning