OCR-D: Integration von Kitodo und OCR-D zur produktiven Massendigitalisierung
Kontakt: Stefan Weil
Förderung: Deutsche Forschungsgemeinschaft (DFG)
Laufzeit: 2021–2023
Projektpartner: SLUB Dresden, Universitätsbibliothek Braunschweig
Die DFG fördert im Rahmen des Koordinierungsprojekts OCR-D seit 2015 verschiedene Projekte zur Entwicklung eines Verfahrens zur Massenvolltextdigitalisierung der im deutschen Sprachraum erschienenen Drucke des 16. bis 19. Jahrhunderts. In der aktuellen dritten Förderphase arbeitet die Universitätsbibliothek Mannheim daran, den OCR-D-Workflow in Kitodo zur produktiven Massendigitalisierung zu integrieren.
Mit Kitodo steht seit mehreren Jahren eine lizenzfreie Software zur Unterstützung der Massendigitalisierung und des Workflow-Managements von Digitalisierungsprojekten zur Verfügung. Die UB Mannheim setzt Kitodo seit 2014 ein und ist dabei auch in die Weiterentwicklung der Software eingebunden.
In Zusammenarbeit mit der SLUB Dresden und der Universitätsbibliothek Braunschweig beteiligt sich die Universitätsbibliothek Mannheim an dem Vorhaben, OCR-D und Kitodo wechselseitig zu integrieren. OCR-D soll dabei für den verteilten Betrieb auf einem Web-Server nutzbar gemacht werden. Volltexte können dann im DFG-Viewer dargestellt und „on demand“ bereitgestellt werden.
Ein weiteres Ziel ist es, den Workflow für OCR-D zu optimieren und verstärkt zu automatisieren. So sollen unter anderem Community-Workshops durchgeführt und ein prototypischer Aufbau für einen allgemein verfügbaren OCR-Dienst innerhalb der Kitodo-Community erstellt werden.