Audio
Rauschunterdrückung
Verfahren zur Reduzierung unerwünschter Hintergrundgeräusche im Audiosignal.
Rauschunterdrückung bezeichnet Algorithmen und Verfahren, die Störgeräusche aus einem Audiosignal entfernen oder abschwächen, um die eigentliche Sprachaufnahme zu verbessern. Sie ist ein wichtiger Vorverarbeitungsschritt vor der Spracherkennung.
Klassische Methoden wie spektrale Subtraktion schätzen das Rauschprofil in sprachfreien Pausen und ziehen es vom Signal ab. Moderne KI-basierte Ansätze nutzen neuronale Netze, die direkt auf bereinigtes Audio trainiert wurden.
Eine wirkungsvolle Rauschunterdrückung verbessert die Erkennungsgenauigkeit in lauten Umgebungen erheblich und erweitert so die praktischen Einsatzmöglichkeiten von Spracherkennungssystemen.
Verwandte Begriffe
Sprachsignal
Elektrisches oder digitales Signal, das gesprochene Sprache als Wellenform darstellt.
Mikrofon
Wandler, der Schallwellen in elektrische Signale umwandelt und als Eingabegerät dient.
Wortfehlerrate
Maßzahl für die Erkennungsgenauigkeit, berechnet als Anteil falsch erkannter Wörter.
Dezibel
Logarithmische Einheit zur Messung der Lautstärke eines Audiosignals.