Technik
Formatierung
Nachbearbeitung transkribierter Texte zur korrekten Darstellung von Zahlen, Daten und Sonderzeichen.
Formatierung in der Spracherkennung umfasst die automatische Umwandlung gesprochener Inhalte in ihre korrekte Schreibform. Dazu gehören Zahlen (zwanzig statt 20), Daten, Uhrzeiten, Währungen und Abkürzungen.
Inverse Text Normalisierung (ITN) ist der technische Begriff für diesen Prozess. Ohne ITN würden Transkripte Zahlen ausgeschrieben enthalten, was die Lesbarkeit erheblich beeinträchtigt.
Über einfache Zahlen hinaus können Formatierungsmodule auch Paragrafen setzen, Überschriften erkennen und strukturierte Dokumente wie Protokolle oder Berichte erzeugen.
Verwandte Begriffe
Interpunktion
Automatisches Einfügen von Satzzeichen in transkribierte Texte.
Diktat
Sprachgesteuerte Texteingabe, bei der gesprochene Wörter direkt als Text erscheinen.
Transkription
Übertragung gesprochener Sprache in schriftliche Form, manuell oder automatisch.
Spracherkennung
Technologie zur automatischen Umwandlung gesprochener Sprache in maschinenlesbaren Text.