Name des Teilnehmers: Kozitierungsbasierte Maschinelle Lernverfahren zur Bestimmung Vielversprechender Forschungsvorhaben (Tarek Saier)
Beschreibung des IT-Forschungsprojekts: Die anhaltende Zunahme der globalen Forschungsaktivität stellt Wissenschaftler vor eine stetig wachsende Herausforderung der Informationsüberflutung. In manchen Forschungsfeldern ist es selbst in einem eng definierten Rahmen nicht mehr menschenmöglich, alle vermeintlich relevanten neuen Publikationen zu lesen. Derartigen Problemen entgegengesetzt stehen Bestrebungen zur automatisierten Verarbeitung akademischer Literatur. Hier gibt es seit langer Zeit auf Metadaten basierte Werkzeuge wie bibliometrische Kennzahlen oder Stichwortsuchen, die bereits ein gewisses Maß an Entlastung bei Aufgaben wie der Literaturrecherchen ermöglichen können. Durch die voranschreitende Umsetzung von Open-Access-Strategien seitens wissenschaftlicher Verlage sowie durch neue Entwicklungen in der Computerlinguistik ergeben sich nun mehr und mehr Möglichkeiten, nicht nur Metadaten sondern auch Publikationsvolltexte automatisiert zu verarbeiten und somit zur Unterstützung von Forschungstätigkeiten zu nutzen.
Ziel im Projekt [KOM,BI] ist es, die Identifizierung aussichtsreicher Forschungsvorhaben zu unterstützen. Konkreter sollen „akademische Artefakte“ — Ergebnisse bereits publizierter Forschung wie beispielsweise Methoden und Datensätze — identifiziert werden, deren kombinierte Verwendung aussichtsreich ist. Hierzu wird in großen akademischen Korpora automatisiert die bisherige Verwendung, Transformation und Kombination der Artefakte, sowie der Kontext dieser Prozesse im Sinne der Publikationen selbst und deren Kontributionen und Einfluss erfasst. Auf diesen Daten mithilfe überwachter maschineller Lernverfahren trainierte Modelle können anschließend Vorhersagen über in der Literatur noch nicht beschriebene Kombination gegebener Artefakte treffen. Diese Vorhersagen sollen Wissenschaftler dabei unterstützen, aussichtsreiche Forschungsvorhaben zu identifizieren.
Software Campus-Partner: KIT & Holtzbrinck Publishing Group
Umsetzungszeitraum: 01.04.2022 – 31.07.2023