Automatisierte Texterkennung – Datenerhebung via OCR/HTR

Mithilfe von maschineller Texterkennung (OCR) werden Texte aus digitalen Bildern automatisiert erfasst und auf diese Weise durchsuchbare und analysierbare Daten erzeugt. Die Universitäts­bibliothek Mannheim blickt auf langjährige Erfahrung in der Digitalisierung und mit der Anwendung verschiedenerTexterkennungs­software zurück.

Gerne unter­stützt das Forschungs­datenzentrum Forschende der Universität Mannheim entlang des gesamten Workflows von der Digitalisierung über die Layout- und Texterkennung sowie dem Nachtraining spezialisierter Modelle bis hin zur Strukturierung der Daten.

Services

  • Beratung zur maschinellen Texterhebung für Forschungs­projekte
  • OCR Recommender (in Vorbereitung)
  • Offene OCR-Sprechstunde: jeden 2. Donnerstag im Monat, von 15 bis 16 Uhr, ohne Anmeldung (Link zum Zoom-Meeting: https://ocr-bw.bib.uni-mannheim.de/sprechstunde, Meeting ID: 682 8185 1819, Kenncode: 443071)

In unseren FAQs finden Sie Antworten auf die am häufigst gestellten Fragen rund um das Thema automatisierte Texterkennung sowie die im Projekt OCR-BW genutzte Software.

Wenn die gesuchte Antwort nicht dabei ist, wenden Sie sich einfach per E-Mail an uns.

Projekte und Kooperationen

Wenn wir Sie unter­stützen können oder Sie Fragen haben, zögern Sie nicht uns zu kontaktieren.

Kontakt

Larissa Will, M.A.

Larissa Will, M.A.

Referentin für Forschungs­daten­management und Digitalisierung (Digital Humanities)
Universität Mannheim
Universitäts­bibliothek
Schloss Schneckenhof West – Raum SW 273
68161 Mannheim