Open-source Texterkennung von Drucken und Handschriften mit OCR4all
Mittwoch, 18. Oktober 2023
14:00 - 17:00 Uhr
online
Aus der Reihe «Praxisatelier Digital Humanities»
Mit Christian Reul und Florian Langhanki, Zentrum für Philologie und Digitalität, Universität Würzburg
Der Workshop wird in die automatische Texterkennung von anspruchsvollen historischen Drucken und Handschriften einführen. Dabei kommt die frei verfügbare, quelloffene Software OCR4all zum Einsatz, die eine Vielzahl von Anwendungsszenarien, von der hochqualitativen Erfassung eines einzelnen Werks bis zur vollautomatischen Massenvolltextdigitalisierung, unterstützt. Der Workshop wird die Teilnehmenden zur selbstständigen Durchführung des kompletten OCR/HTR-Workflows befähigen. Die einzelnen Schritte vom Bild (Digitalisat) bis zur Ausgabe eines maschinenverarbeitbaren digitalen Texts werden in angeleiteten hands-on Phasen von den Teilnehmenden selbst durchlaufen.
Der Kurs findet online statt. Der Zoom-Link sowie die notwendige Softwareinstallation werden eine Woche im Voraus per E-Mail mitgeteilt.
Anmeldung: Anfang September