Named Entity Recognition & Linking (NER/NEL)

Zur Entwicklung eines Workflows zur automatischen Erkennung von Orts- und Personennamen (Named Entity Recognition) kombiniert T.M.M.M.T. zwei Forschungsansätze

NER für historische Texte

Für spätmittelhochdeutsche Texte adaptierte NER in zwei Schritten: (1) Spezialisierter NER-Schritt basierend auf Vergleichen zwischen Token und vorgefertigten Listen von Orts- und Personennamen (2) NER als Teil des Part-of-Speech-Tagging-Schrittes (Deep Learning-Ansatz)

Information Extraction & Gazetteers

Extraktion der Namen (Gruben, Orte, Personen) mithilfte von Postgres. Nutzung der entstandenen Gazetteers und Register zur Erarbeitung eines NER-Workflows.

References

Schmid, Helmut. „Probabilistic part-of-speech tagging using decision trees.“ International Conference on New Methods in Language Processing, 1994. 1994.

Schmid, Helmut. „Deep learning-based morphological taggers and lemmatizers for annotating historical texts.“ Proceedings of the 3rd international conference on digital access to textual cultural heritage. 2019.

T.M.M.M.T.

Text Mining Medieval Mining Texts

NER für historische Texte

Information Extraction & Gazetteers