Symbolbild mit einem Rollregal und Binärcode

Automatisierte Sprach­erkennung – whisply

Durch automatisierte Trans­kription können Sprach­inhalte aus gängigen Audio- und Videodateien in Textform extrahiert und anschließend weiterverarbeitet und genutzt werden. Das Forschungs­datenzentrum unter­stützt Sie dabei im gesamten Workflow.

Mit dem Tool whisply, das auf whisper basiert, können Sie über die Server der UB auch große Datenmengen in kurzer Zeit bearbeiten und trans­kribieren. Das Tool whisply ist sprach­agnostisch und kann eine Vielzahl von Sprachen trans­kribieren.

Weitere Funktionen von whisply sind:

  • automatisierte Annotation von Sprecher*innen und Sprecher*innenwechsel
  • Ausgabe der Trans­kription als .txt oder .rttm Datei
  • automatisierte Erstellung von Unter­titeln für Videos in den Formaten .srt und .webvtt

Anleitungen zur Installation und Nutzung finden Sie auf der GitHub-Seite von whisply.

Services

Das FDZ unter­stützt Sie unter anderem in folgenden Bereichen:

  • Beratung bei der Trans­kription multimedialer Inhalte
  • Einrichtung des Trans­kriptions-Workflows
  • Anpassung der Ausgabeformate von whisply
  • Allgemeine Beratung bei Audio-to-Text
  • Unter­stützung bei der Weiterverarbeitung der Trans­kription (z.B. Umwandlung von unstrukturierten in strukturierte Daten)

Kontakt

Forschungsdatenzentrum (FDZ)

Forschungs­datenzentrum (FDZ)

Team: Irene Schumm, Phil Kolbe, David Morgan, Thomas Schmidt, Renat Shigapov, Christos Sidiropoulos, Larissa Will
Universität Mannheim
Universitäts­bibliothek Mannheim
Schloss Schneckenhof West
68161 Mannheim