Der Bergbau war im 15. und 16. Jahrhundert ein starker Wirtschaftsfaktor in Tirol (Österreich). Aufgrunddessen sind beispielsweise im Tiroler Landesarchiv (TLA) zu Innsbruck sehr viele historische Dokumente zu finden, deren Inhalt sich mit der Verwaltung und Organisation in den Tiroler Bergbauorten beschäftigen. Zu nennen ist hier in diesem Zusammenhang die große Zahl an Dokumenten, die zur Montanistikasammlung oder dem Pestarchiv des TLA gehören. Alle diese Dokumente zeichnen ein Bild der damaligen Strukturen und Vorgänge im Bergbauwesen.

Das Team des Projektes „T.M.M.M.T.“ hat zwei besondere Handschriften ausgewählt, die es ermöglichen, einen Blick auf die montanhistorischen Entwicklungen in den Abbauregionen im Raum Schwaz und Rattenberg-Brixlegg (Tirol, Österreich) zu werfen. Erstens, das „Verleihbuch der Rattenberger Bergrichter“, 1460-1463 (Hs. 37) und zweitens, das „Schwazer Berglehenbuch“, ca. 1515 (Hs. 1587).

Bisher wurden beide Handschriften digitalisiert und transkribiert. Die Transkripte sind bereits auf unserer Read and Search Plattform „Mining Hub“ zu entdecken.

Nach Abschluss der weiteren Verarbeitungsschritte werden beide Handschriften als tokenisiertes und POS-tagged Korpus der Öffentlichkeit zur Verfügung gestellt.

Das „Verleihbuch der Rattenberger Bergrichter“ (Hs. 37) umfasst 353 Seiten (57.797 Wörter) und enthält Grubenverleihungen im Bergrevier Rattenberg-Brixlegg (Tirol, Österreich) sowie Informationen zu Verhüttungs- und Holzarbeiten.


(c) Tiroler Landesarchiv: Verleihbuch der Rattenberger Bergrichter, Hs. 37 pag. 50

Das „Schwazer Berglehenbuch“ (Hs. 1587) wurde 2009 von Wolfgang Tschan, teilweise transkribiert und in edierter Form veröffentlicht. Das Dokument umfasst 409 Seiten (115.005 Wörter) und bezieht sich auf das Bergbaugebiet Falkenstein in Schwaz (Tirol, Österreich). Die Handschrift listet die damals vorhandenen Gruben und die zugehörige Verleihungen auf sowie Urteilssprüche bei Streitigkeiten zwischen den Gruben.

(c) Tiroler Landesarchiv, Schwazer Berglehenbuch, Hs. 1587 pag. 4

Beide Handschriften wurden bereits mit Hilfe eines ScanTents und der DocScan App digitalisiert und mit Transkribus weiter verarbeitet. Dabei erfolgten ausführliche Strukturkorrekturen sowie die Erstellung von HTR+ Modellen zur automatischen Handschriftenerkennung. Die Ergebnisse der Character Error Rate (CER) liegen derzeit bei beiden Handschriften unter 4%.

Trotz automatischer Handschriftenerkennung war es notwendig den jeweiligen Output manuell zu korrigieren.

Zur Unterstützung der Entwicklung eines funktionalen NER-Tools (siehe Absatz Named Entity Recognition) für spätmittelhochdeutsche/frühneuhochdeutsche Texte erfolgte eine teilweise manuelle linguistische Annotation (Goldstandard). Im Hinblick auf die Forschungsziele wurden nur Wörter und Phrasen annotiert, die die folgenden Entitäten umfassen: Gruben, Orte, Personen und Daten

Zur Annotation verwendete das Team das bereits vorhandene Tagset von Transkribus. In den Tags ist die Ergänzung zusätzlicher Eigenschaften (attributes/properties) möglich. Für das Projekt T.M.M.M.T. war es notwendig, das Tagset sowie die properties zu modifizieren. Das Tag für Gruben wurde neu angelegt und die Attribute der Tags Person und Datum wurden erweitert.

Transkribus bietet außerdem die Möglichkeit die korrigierten und annotierten Transkripte in verschiedenen Formaten zu exportieren, z.B. TEI konform oder Excel Export. Das Projekt T.M.M.M.T. nutzt die Funktion der Excel Exporte zur Integration in eine Postgres Datenbank.