Name der Teilnehmerin: Laura Seiffe
Beschreibung des IT-Forschungsprojekts: Das Medium Text ist zentral, wenn es um die Vermittlung von Information geht – für eine erfolgreiche Vermittlung der Information muss der Text jedoch auch verstanden werden. Neben weiteren Einflussfaktoren ist vor allem die Textkomplexität relevant für das Textverständnis. Dies gilt im Besonderen, wenn eine Fachsprache verwendet wird, beispielsweise in der steuerrechtlichen Domäne, die DATEV bedient. In diesem Fall kann ein Fachtext zwar für Experten verständlich, für Laien auf diesem Gebiet jedoch zu komplex sein.
Textkomplexität wird hauptsächlich auf den drei linguistischen Ebenen Syntax, Lexikon und Diskursstruktur ausgedrückt. Variationen auf diesen Ebenen verursachen Verschiebungen im Komplexitätsniveau eines Textes. Ein Text ist immer nur in Relation zu dem Empfänger und der Textdomäne in seiner Komplexität zu bewerten.
Ist die Empfängergruppe bezüglich ihrer Fachkenntnisse heterogen, muss sichergestellt werden, dass die durch den Text ausgedrückte Information alle erreicht. Da davon auszugehen ist, dass Laien eine geringere Komplexität des Textes verarbeiten können als Experten, ist eine Differenzierung im Komplexitätsniveau des Textes hilfreich.
Ziel des Projekts AuTexx ist es, in einem iterativen, nutzerzentrierten Entwicklungsprozess Modelle zu entwickeln, die die Komplexität eines steuerrechtlichen Texts hinsichtlich einer Experten- und einer Laienzielgruppe auswerten. Diese Modelle basieren auf entsprechenden Datensätzen und sind das Ergebnis von Machine Learning-Prozessen. Es soll eine Anwendung bereitgestellt werden, die dem Redakteur promptes Feedback zu seinem Text in Hinblick auf die Textkomplexität gibt. Die manuelle Überarbeitung des Textes wird so unterstützt und vereinfacht. Durch solch eine Anwendung werden redundante Arbeitsschritte reduziert, Ressourcen gespart und der Text bestmöglich an seine Zielgruppe ausgerichtet.
Software Campus-Partner: DFKI, DATEV
Umsetzungszeitraum: 1.3.2020 – 31.12.2021