Technik
Latenz
Zeitverzögerung zwischen Spracheingabe und der Ausgabe des Transkriptionsergebnisses.
Latenz bezeichnet die Zeitspanne zwischen der Aufnahme eines gesprochenen Satzes und der Anzeige des transkribierten Texts. Sie ist ein zentrales Qualitätsmerkmal für die Nutzererfahrung bei Spracherkennungssystemen.
Bei Echtzeitsystemen wie Untertitelungslösungen oder Sprachsteuerungen ist niedrige Latenz kritisch. Cloud-basierte Systeme unterliegen Netzwerkverzögerungen, während Offline-Modelle auf lokaler Rechenleistung angewiesen sind.
Moderne Streaming-Ansätze reduzieren die wahrgenommene Latenz, indem sie Teilergebnisse anzeigen, noch bevor der gesamte Satz analysiert ist.
Verwandte Begriffe
Streaming
Kontinuierliche Übertragung und Verarbeitung von Audiodaten in Echtzeit.
Offline-Modus
Spracherkennung direkt auf dem Gerät ohne Internetverbindung.
Cloud-Verarbeitung
Auslagerung der Spracherkennung auf externe Serverinfrastruktur über das Internet.
Spracherkennung
Technologie zur automatischen Umwandlung gesprochener Sprache in maschinenlesbaren Text.