Zur Entwicklung eines Workflows zur automatischen Erkennung von Orts- und Personennamen (Named Entity Recognition) kombiniert T.M.M.M.T. zwei Forschungsansätze

NER für historische Texte

Für spätmittelhochdeutsche Texte adaptierte NER in zwei Schritten: (1) Spezialisierter NER-Schritt basierend auf Vergleichen zwischen Token und vorgefertigten Listen von Orts- und Personennamen (2) NER als Teil des Part-of-Speech-Tagging-Schrittes (Deep Learning-Ansatz)

Information Extraction & Gazetteers

Extraktion der Namen (Gruben, Orte, Personen) mithilfte von Postgres. Nutzung der entstandenen Gazetteers und Register zur Erarbeitung eines NER-Workflows.

References

Schmid, Helmut. „Probabilistic part-of-speech tagging using decision trees.“ International Conference on New Methods in Language Processing, 1994. 1994.

Schmid, Helmut. „Deep learning-based morphological taggers and lemmatizers for annotating historical texts.“ Proceedings of the 3rd international conference on digital access to textual cultural heritage. 2019.

German