Grundlagen
KI-Modell
Trainiertes mathematisches Modell zur Verarbeitung und Analyse von Sprache.
Ein KI-Modell in der Spracherkennung ist ein mathematisches System, das aus großen Mengen an Audiodaten und den dazugehörigen Transkriptionen trainiert wurde. Es lernt Muster in Sprachsignalen zu erkennen und in Text umzuwandeln.
Bekannte Spracherkennungsmodelle wie Whisper von OpenAI oder Google Speech-to-Text basieren auf Transformer-Architekturen, die zeitliche Abhängigkeiten in Audiosignalen besonders gut verarbeiten können.
Die Qualität eines KI-Modells hängt stark von der Menge und Vielfalt der Trainingsdaten sowie der Modellgröße ab. Größere Modelle erzielen in der Regel höhere Erkennungsgenauigkeit, benötigen jedoch mehr Rechenleistung.
Verwandte Begriffe
Neuronales Netz
Vom menschlichen Gehirn inspiriertes Berechnungsmodell für KI-Aufgaben.
Deep Learning
Maschinenlernverfahren mit mehrstufigen neuronalen Netzen für komplexe Aufgaben.
Trainingsdaten
Beschriftete Datensätze, die zum Trainieren von KI-Sprachmodellen genutzt werden.
Whisper
Offenes Spracherkennungsmodell von OpenAI mit hoher Mehrsprachigkeit und Genauigkeit.