Symbolbild mit einem Rollregal und Binärcode

Automatisierte Texterkennung – Datenerhebung via OCR/HTR

Mithilfe von maschineller Texterkennung (OCR) werden Texte aus digitalen Bildern automatisiert erfasst und auf diese Weise durchsuchbare und analysierbare Daten erzeugt. Die Universitäts­bibliothek Mannheim blickt auf langjährige Erfahrung in der Digitalisierung und mit der Anwendung verschiedenerTexterkennungs­software zurück.

Gerne unter­stützt das Forschungs­datenzentrum Forschende der Universität Mannheim entlang des gesamten Workflows von der Digitalisierung über die Layout- und Texterkennung sowie dem Nachtraining spezialisierter Modelle bis hin zur Strukturierung der Daten.

Icon aufgeschlagenes Buch

Services

In unseren FAQs finden Sie Antworten auf die am häufigst gestellten Fragen rund um das Thema automatisierte Texterkennung sowie die im Projekt OCR-BW genutzte Software.

Wenn die gesuchte Antwort nicht dabei ist, wenden Sie sich einfach per E-Mail an uns.

Icon Händeschütteln

Projekte und Kooperationen

Wenn wir Sie unter­stützen können oder Sie Fragen haben, zögern Sie nicht uns zu kontaktieren.

Kontakt

Forschungsdatenzentrum (FDZ)

Forschungs­datenzentrum (FDZ)

Team: Irene Schumm, Phil Kolbe, David Morgan, Thomas Schmidt, Renat Shigapov, Christos Sidiropoulos, Larissa Will
Universität Mannheim
Universitäts­bibliothek Mannheim
Schloss Schneckenhof West
68161 Mannheim