Sie sind hier: Startseite Lehre Lehrprojekte Handschriften und alte Drucke …

Handschriften und alte Drucke lesen mit Handwritten Text Recognition

Ein studentisches Seminarprojekt

Kontakt: 

 

Projektbeschreibung

Wie lässt sich Maschinelles Lernen für die Arbeit mit historischer Überlieferung einsetzen? Eine Gruppe Studierende des Historischen Seminars hat es im Sommersemester 2019 ausprobiert: Im Rahmen der Übung „Handschriften und alte Drucke lesen mit Handwritten Text Recognition“ haben sich die Studierenden in die Nutzung des Programms Transkribus eingearbeitet und gemeinsam zwei eigene Modelle zur automatischen Texterkennung (HTR - Handwritten Text Recognition) erstellt und ausprobiert.

Transkribus ermöglicht das Trainieren eines HTR-Modells, indem Digitalisate von Handschriftenseiten mit Transkriptionen, die nach eigenen, konsistenten Regeln erstellt wurden (Ground Truth), abgeglichen werden. Das HTR-Modell ist nach dem Training in der Lage, auch unbekanntes Material derselben (oder einer ähnlichen) Schreibhand automatisiert zu transkribieren. In die interdisziplinären Arbeitsgruppen brachten die Studierenden aus Bachelor-, Master- und Promotionsstudiengängen ihre ganz unterschiedlichen inhaltliche Interessen, Kompetenzen und Vorkenntnisse ein. Ihre Erfahrungen – von der Ausarbeitung passender Transkriptionsrichtlinien, über die eigenständige Herstellung von Digitalisaten in der UB Basel mit den ScanTent, bis zum Modell-Training und der Auswertung der automatisiert erstellten Transkriptionen – sind in folgenden Blogbeiträgen nachzulesen.

 

Blogbeiträge

Alina Bruderer, Charly Beck, Katharina Weinert und Sophie Lutz: Vom Camping Tent zum ScanTent. Zelte-Aufschlagen im Sonderlesesaal, in: UB Basel Blog, 10.10.2019, online unter https://blog.ub.unibas.ch/?p=3357.

Jakob Böhm, Alex Gerhardt, Olivia Kirsten, Maximilian Krümpelmann, Yao Lu und Mario Roemer: Transkribus auf dem Prüfstand (II). Ein studentischer Praxistest, in: Mittelalter. Interdisziplinäre Forschung und Rezeptionsgeschichte 2 (2019), online unter: https://mittelalter.hypotheses.org/22600.

Zusammen mit einer knappen Einleitung publiziert als: Pia Eckhart, Ina Serif [u.a.], Transkribus auf dem Prüfstand, in: Mittelalter. Interdisziplinäre Forschung und Rezeptionsgeschichte 2 (2019), S. 254–275, DOI: 10.26012/mittelalter-22600PDF

Eine kurze Projektvorstellung ist im Rahmen der Blogparade „Digitale Geschichte in der universitären Lehre – wer, wie, was?“ des DHI Paris erschienen: Pia Eckhart, Ina Serif: Transkribus in the Classroom. Students Find Their Way to Manuscripts and Handwritten Text Recognition (HTR) #dhiha8, in: Digital Humanities am DHIP, 07/06/2019, https://dhdhi.hypotheses.org/5985.

 

HTR-Modelle

Nach Projektabschluss stehen folgende HTR-Modelle zur Verfügung:

 

„Comb_Gothic_Scripts_M2+“
Trainiert anhand von UB Freiburg, Hs 1500-3. Digitalisat unter: http://dl.ub.uni-freiburg.de/diglit/hs1500-13

Für diese Handschrift wurde im Rahmen eines Projektseminars am Deutschen Seminar (Leitung von Balász Nemes) von Luisa Steiert und Katharina Tolle eine wissenschaftliche Beschreibung erarbeitet. Vgl. auch: Balász Nemes: Mittelalterliche Handschriften im WWW – von Studierenden erschlossen. Konzept und Ertrag einer Übung zur praktischen Arbeit mit mittelalterlichen Überlieferungsträgern, in: Handschriften als Quellen der Sprach- und Kulturwissenschaft. Aktuelle Fragestellungen – Methoden – Probleme. Akten der Nachwuchstagung, Bamberg, 4.-5.12.2015, hg. von Anette Kremer und Vincenz Schwab, Bamberg 2018 (Bamberger Interdisziplinäre Studien 13), S. 169-175 (Open Access).

 

„Comb_StAZH-StASO_kurr_XVI“
Trainiert anhand von UB Freiburg, Hs. 497-2, Digitalisat unter: http://dl.ub.uni-freiburg.de/diglit/hs497-2

Diese Handschrift gehört zu einer Gruppe von sieben Handschriften von der Hand Joseph Felizian Geissingers (1740-1806) im Besitz der UB Freiburg.

Das Modell kam in einer Studie zu generischen HTR-Modellen zum Einsatz, vgl. künftig Achim Rabus, Training generic models for Handwritten Text Recognition using Transkribus: Opportunities and pitfalls, in: Proceedings of the Dark Archives Conference (Oxford, accepted).