Technik

Diarisierung

Automatische Zuordnung von Sprachsegmenten zu verschiedenen Sprechern in einer Aufnahme.

Diarisierung, auch Speaker Diarization genannt, bezeichnet den Prozess, bei dem in einer Mehrpersonen-Aufnahme automatisch erkannt wird, welcher Sprecher zu welchem Zeitpunkt spricht. Das Ergebnis ist eine segmentierte Transkription mit Sprecherzuordnung.

Typische Diarisierungssysteme arbeiten in zwei Schritten: Zunächst werden Sprecherwechsel im Audiosignal lokalisiert, dann werden die Segmente nach Sprecherzugehörigkeit geclustert. Eine exakte Identifikation der Personen erfordert zusätzliche Sprecher-Erkennungsmodelle.

Diarisierung findet Anwendung bei der Protokollierung von Meetings, in journalistischen Interviews und in der Analyse von Kundengesprächen.

Sprache zu Text nutzen

Sprache transkribieren

Sofort im Browser, ohne Anmeldung.

Zum Rechner

Diarisierung

Sprache transkribieren

Verwandte Begriffe

Sprecher-Erkennung

Transkription

Zeitstempel

KI-Modell