Anwendung

Echtzeit-Transkription

Sofortige Umwandlung gesprochener Sprache in Text ohne spürbare Verzögerung.

Bei der Echtzeit-Transkription wird eingehende Sprache kontinuierlich und mit minimaler Verzögerung in Text umgewandelt. Das Ergebnis ist bereits während des Sprechens sichtbar, nicht erst nach Abschluss einer Äußerung.

Technisch setzt dies Streaming-Verarbeitung voraus: Das Audiosignal wird in kurzen Segmenten verarbeitet, und Zwischenergebnisse werden laufend aktualisiert. Die Latenz ist dabei ein entscheidender Qualitätsfaktor.

Echtzeit-Transkription wird bei Live-Untertiteln, in Videokonferenzen, bei der Barrierefreiheit und in Sprachassistenten eingesetzt, wo sofortige Rückmeldung erforderlich ist.

Sprache zu Text nutzen

Sprache transkribieren

Sofort im Browser, ohne Anmeldung.

Zum Rechner

Verwandte Begriffe