Grundlagen

Sprache zu Text

Direktes Verfahren zur Umwandlung von Audioeingaben in geschriebenen Text.

Sprache zu Text, auch als Speech-to-Text bezeichnet, beschreibt den technischen Prozess, bei dem ein Audiosignal mit gesprochener Sprache als Eingabe dient und als Textausgabe zurückgegeben wird. Der Vorgang läuft vollautomatisch ab.

Kernbestandteile eines solchen Systems sind ein akustisches Modell zur Lauterkennung und ein Sprachmodell zur Vorhersage wahrscheinlicher Wortfolgen. Beide Komponenten arbeiten zusammen, um möglichst präzise Ergebnisse zu liefern.

Die Technologie ist Grundlage für Diktiersoftware, Echtzeit-Untertitelung, Sprachassistenten und barrierefreie Bedienoberflächen.

Sprache zu Text nutzen

Sprache transkribieren

Sofort im Browser, ohne Anmeldung.

Zum Rechner

Sprache zu Text

Sprache transkribieren

Verwandte Begriffe

Transkription

Akustisches Modell

Sprachmodell

Web Speech API