Autorinnen und Autoren | Christiane Klaes |
Titel | Linked Open Data-Strategien zum Identity Management in einer Fachontologie |
Untertitel | Prototypische Entwicklung eines Workflows zur Aufbereitung und zum Interlinking von Personennamen |
Publikationsart | Buch / Monographie / Herausgeberschaft |
Herausgebende Einrichtung / Verlag | Universitätsverlag Hildesheim |
Jahr | 2022 |
Seiten | 130 |
Digitale Objekt-ID (DOI) | DOI: 10.18442/132 |
Webadresse (URL) | https://hildok.bsz-bw.de/frontdoor/index/index/docId/1378 |
Zusammenfassung |
Semantic Web-Technologien und -Anwendungen erfahren gegenwärtig eine hohe Aufmerksamkeit im Forschungsfeld der Wissensrepräsentation. Daten über Personen bilden oft zentrale Knotenpunkte einer Wissensbasis, um verteilte Informationen miteinander zu verknüpfen und zu kontextualisieren. Mit der Fachontologie „LexDo“ wird im Umfeld der europäischen Forschungsinfrastruktur ELEXIS eine neue Linked Open Data-Ressource für die Disziplin der Lexikographie und Wörterbuchforschung entwickelt, die das Wissen der Domäne bündeln und vernetzen soll. Die Integration kuratierter Personendaten in die Fachontologie dient zunächst der Erschließung fachspezifischer Publikationen im Suchportal „ElexiFinder“. Die vorliegende Arbeit zeigt, wie ein solches Personenregister aus den Metadaten einer bestehenden Fachbibliographie mit semi-automatischen Methoden aufgebaut, bereinigt und als Linked Open Data aufbereitet werden kann. Vor diesem Hintergrund wird ein modularer Workflow zur Transformation von Namensliteralen in Entitäten des Semantic Web konzipiert, der Skalierbarkeit und eine hohe Datenqualität gleichermaßen berücksichtigt. Basierend auf Überlegungen zur RDF-Modellierung in LexDo für ein semantisch konsistentes Linking mit Referenzdatensets werden Algorithmen und Funktionen zur Datenbereinigung und zum Interlinking im Open-Source-Tool „OpenRefine“ anhand eines Testauszugs der Fachbibliographie umfassend evaluiert. Die Ergebnisse der Evaluierung münden in praxisorientierte Empfehlungen für den weiteren Ausbau und den Routinebetrieb der Fachontologie.
Semantic Web technologies and applications are steadily gaining traction in the field of knowledge representation. Data about persons are important linking nodes in a variety of Linked Open Data resources across different domains and use cases. The domain ontology „LexDo“ is a newly developed knowledge base for the field of Lexicography and Dictionary Research, primarily intended for publication indexing within the digital library „ElexiFinder“, which is part of the European research infrastructure ELEXIS. This study is focused on developing a modular workflow for populating LexDo with data on persons extracted from bibliographic metadata. To this end, the open source tool „OpenRefine“ is used to semi-automatically clean and transform name literals into Semantic Web entities, which are then linked to reference datasets (VIAF, Wikidata). OpenRefine’s algorithms for clustering and interlinking are evaluated in detail for a sample of persons, focusing on the tool’s possibilities to leverage scalability and data quality. The study’s results lead to practice-oriented recommendations for the ongoing development and long-term maintenance of the domain ontology „LexDo“. |
Dateien / Dokumente | Link |