Name des Teilnehmers: Andreas Thalhammer
Beschreibung des IT-Forschungsprojektes: Das SumOn-Projekt befasste sich mit der Entwicklung eines flexiblen Systems, welches automatische Zusammenfassungen von Linked-Data-Entitäten ermöglicht. Die Schwerpunkte umfassten sowohl das Auflösen der klassischen, auf den Typ bezogenen, Präsentation von Entitäten als auch die Einbeziehung verschiedener Kontextfaktoren. Diese Faktoren beinhalteten eine Orientierung bezüglich Wichtigkeit (normales Alltagsdenken), den Bezug auf aktuelles Zeitgeschehen sowie eine sprachenorientierte Komponente. Das SumOn-System wurde mit verschiedenen Applikations- sowie Benutzerschnittstellen umgesetzt, zum Beispiel der “SUMMA API” sowie “ELES”, eine Demoanwendung welche “Entity Linking” und “Entity Summarization” interaktiv kombiniert.
Im SumOn-Projekt wurden folgende Forschungsfragen beantwortet:
- Welche Datenquellen können die Faktoren Wichtigkeit, Aktualität und Sprachkontext im Bezug auf die Zusammenfassung von Entitäten jeweils bestmöglich unterstützen?
- Welche Algorithmen und Verfahren des maschinellen Lernens eignen sich für das Ranking von Fakten über einzelne Entitäten?
- Wie werden Zusammenfassung, Visualisierung und Navigation von Entitäten kombiniert um Synergien bestmöglich auszunutzen?
- Mit welchen Methoden können entitätsbezogene Daten von verschiedenen Wissensbasen im Netz automatisch zusammengeführt werden.
Die Ergebnisse des SumOn-Projekts führten zu drei Konferenzpublikationen, zwei Workshop-Publikationen und zu einer Demo-Präsentation. Zwei dieser Arbeiten wurden jeweils mit Preisen bedacht, eine Weitere wurde nominiert. Neben den wissenschaftlichen Publikationen wurden auch verschiedene Datensätze veröffentlicht. Insbesondere die Datensätze “Wikidata PageRank” und “DBpedia PageRank” fanden vielfältige Einsatzgebiete in weiteren Forschungsarbeiten. Ein Großteil der aus SumOn gewonnenen Forschungsergebnisse bildete den Kern der 2016 abgeschlossenen Dissertation “Linked Data Entity Summarization”.
Software Campus-Partner: Karlsruher Institut für Technologie, SAP SE
Umsetzungszeitraum: 01.03.2015 – 28.02.2017
Publikationen:
Andreas Thalhammer, Steffen Thoma, Andreas Harth, and Rudi Studer. Entity-centric Data Fusion on the Web. Proceedings of the 28th ACM Conference on Hypertext and Social Media, HT ‘17, pages 25-34. ACM, New York, NY, USA, 2017.
*ACM SIGWEB Ted Nelson Newcomer Award*
Andreas Thalhammer and Steffen Stadtmüller. SUMMA: A Common API for Linked Data Entity Summaries. In Engineering the Web in the Big Data Era, volume 9114 of Lecture Notes in Computer Science, pages 430–446. Springer International Publishing, Cham, 2015.
*Best Research Paper Nominee*
Weitere Informationen: https://entitysummarization.org