Automatisierte Spracherkennung – whisply
Durch automatisierte Transkription können Sprachinhalte aus gängigen Audio- und Videodateien in Textform extrahiert und anschließend weiterverarbeitet und genutzt werden. Das Forschungsdatenzentrum unterstützt Sie dabei im gesamten Workflow.
Mit dem Tool whisply, das auf whisper basiert, können Sie über die Server der UB auch große Datenmengen in kurzer Zeit bearbeiten und transkribieren. Das Tool whisply ist sprachagnostisch und kann eine Vielzahl von Sprachen transkribieren.
Weitere Funktionen von whisply sind:
- automatisierte Annotation von Sprecher*innen und Sprecher*innenwechsel
- Ausgabe der Transkription als .txt oder .rttm Datei
- automatisierte Erstellung von Untertiteln für Videos in den Formaten .srt und .webvtt
Anleitungen zur Installation und Nutzung finden Sie auf der GitHub-Seite von whisply.
Services
Das FDZ unterstützt Sie unter anderem in folgenden Bereichen:
- Beratung bei der Transkription multimedialer Inhalte
- Einrichtung des Transkriptions-Workflows
- Anpassung der Ausgabeformate von whisply
- Allgemeine Beratung bei Audio-to-Text
- Unterstützung bei der Weiterverarbeitung der Transkription (z.B. Umwandlung von unstrukturierten in strukturierte Daten)