Anwendung
Podcast
Episodisches Audioformat, das zunehmend automatisch transkribiert und untertitelt wird.
Ein Podcast ist eine episodische Audio- oder Videoaufzeichnung, die online abonniert und abgerufen werden kann. Spracherkennungstechnologie wird zunehmend genutzt, um Podcast-Inhalte automatisch zu transkribieren.
Transkriptionen verbessern die Auffindbarkeit von Podcast-Inhalten in Suchmaschinen und machen Episoden für hörbeeinträchtigte Zuhörer zugänglich. Plattformen wie Spotify und Apple Podcasts integrieren bereits automatische Untertitel.
Herausforderungen bei der Podcast-Transkription sind Hintergrundgeräusche, mehrere Sprecher, Dialekte und fachspezifisches Vokabular. Sprechererkennungsmodelle (Speaker Diarization) weisen jedem Sprecher die entsprechenden Textabschnitte zu.
Verwandte Begriffe
Transkription
Übertragung gesprochener Sprache in schriftliche Form, manuell oder automatisch.
Untertitel
Textliche Darstellung von Dialogen oder Kommentaren, eingeblendet in Videos oder Live-Streams.
Spracherkennung
Technologie zur automatischen Umwandlung gesprochener Sprache in maschinenlesbaren Text.
Audiodatei
Digitale Datei, die Tondaten in einem bestimmten Format speichert.