Technik
Diarisierung
Automatische Zuordnung von Sprachsegmenten zu verschiedenen Sprechern in einer Aufnahme.
Diarisierung, auch Speaker Diarization genannt, bezeichnet den Prozess, bei dem in einer Mehrpersonen-Aufnahme automatisch erkannt wird, welcher Sprecher zu welchem Zeitpunkt spricht. Das Ergebnis ist eine segmentierte Transkription mit Sprecherzuordnung.
Typische Diarisierungssysteme arbeiten in zwei Schritten: Zunächst werden Sprecherwechsel im Audiosignal lokalisiert, dann werden die Segmente nach Sprecherzugehörigkeit geclustert. Eine exakte Identifikation der Personen erfordert zusätzliche Sprecher-Erkennungsmodelle.
Diarisierung findet Anwendung bei der Protokollierung von Meetings, in journalistischen Interviews und in der Analyse von Kundengesprächen.
Verwandte Begriffe
Sprecher-Erkennung
Identifikation oder Verifikation einer Person anhand charakteristischer Stimmmerkmale.
Transkription
Übertragung gesprochener Sprache in schriftliche Form, manuell oder automatisch.
Zeitstempel
Zeitmarkierung, die angibt, wann ein bestimmtes Wort oder ein Segment gesprochen wurde.
KI-Modell
Trainiertes mathematisches Modell zur Verarbeitung und Analyse von Sprache.