Grundlagen
Spracherkennung
Technologie zur automatischen Umwandlung gesprochener Sprache in maschinenlesbaren Text.
Spracherkennung bezeichnet die automatische Verarbeitung und Analyse gesprochener Sprache durch Computersysteme. Dabei werden akustische Signale in Textform überführt, sodass Maschinen menschliche Äußerungen verstehen und weiterverarbeiten können.
Moderne Spracherkennungssysteme stützen sich auf neuronale Netze und tiefes Lernen. Sie analysieren das eingehende Audiosignal auf Phonem-Ebene und gleichen erkannte Lautmuster mit einem trainierten Sprachmodell ab.
Anwendungsgebiete reichen vom Diktiersystem über die automatische Untertitelung bis hin zu Sprachassistenten in Mobilgeräten und intelligenten Lautsprechern.
Verwandte Begriffe
Transkription
Übertragung gesprochener Sprache in schriftliche Form, manuell oder automatisch.
Diktat
Sprachgesteuerte Texteingabe, bei der gesprochene Wörter direkt als Text erscheinen.
Sprachmodell
Statistisches oder neuronales Modell zur Vorhersage wahrscheinlicher Wortfolgen.
Akustisches Modell
Komponente der Spracherkennung, die Audiomerkmale auf Laute oder Phoneme abbildet.