Name des Teilnehmers: Sebastian Schmidt
Beschreibung des IT-Forschungsprojekts: Im Rahmen der fortschreitenden Digitalisierung der Gesellschaft existieren in Unternehmen oder auch frei verfügbar im Web große Mengen unstrukturierter Textdokumente, z.B. Studien, Berichte oder Produktbeschreibungen, welche unternehmensrelevante Informationen enthalten. Diese Informationen stellen oftmals einen wichtigen Wert der Unternehmen dar, sind aber schwer zugreifbar. Andererseits erhalten zum Beispiel Unternehmen Informationen von Kunden oder Lieferanten in unstrukturierter Form. Deren Verarbeitung erfordert eine Erfassung und Strukturierung der Daten. Nur so können entsprechende Geschäftsprozesse angestoßen werden. Beispielsweise erhalten die meisten Software-Produzenten Fehlerberichte von Kunden.
Diese Berichte sind von sehr unterschiedlicher Form, jedoch lassen sich gewisse inhaltliche Elemente regelmäßig wiederfinden (bspw. Fehlermeldung, Ursache, genutzte Software, Betriebssystem, etc). Wenn Dokumente solcher Art in einer strukturierten Form vorliegen würden, könnten weiterführende Methoden bspw. Dubletten erkennen oder eine Kategorisierung vornehmen oder es könnten automatisiert Prozesse angestoßen und Zuständigkeiten zugeordnet werden. Dieser Prozess musste bisher vom Menschen übernommen werden, was bei den heutigen großen Datenmengen nicht mehr handhabbar ist, weshalb viele Daten nicht sinnvoll genutzt werden können.
Software Campus-Partner: TU Darmstadt, Software AG