Name der Teilnehmerin: Amelie Wührl
Projekttitel: Patienten-Sprachanalyse mithilfe von NLP zur Erfassung erwartungsbasierter Behandlungsergebnisse (PLACEBO)
Beschreibung des IT-Forschungsprojektes:
Der Erfolg einer Behandlung hängt sehr stark von der Einstellung der Patient*innen und deren Erwartungen an die Behandlung ab (Bingel et al., 2011; Aulenkamp et al., 2023; Rief et al., 2016, u. a.). Dies gilt sowohl für positive als auch für negative Behandlungsergebnisse, auch Placebo- und Nocebo-Effekt genannt. Um die Behandlungserwartungen und ihre psychologischen und neurobiologischen Mechanismen zu verstehen, sind sorgfältig konzipierte medizinische Studien sowie Umfragen erforderlich, um die Denkweise einzelner Patient*innen zu verstehen. Diese Studien sind zwar von hoher Qualität, jedoch zeitaufwendig und aufgrund ihrer kostspieligen Organisation oft auf eine geringe Teilnehmer*innenzahl beschränkt.
Beide Einschränkungen können durch den Zugriff auf Social-Media-Daten abgeschwächt werden. Im Bereich der Verarbeitung natürlicher Sprache (Natural Language Processing) ist das Social-Media-Health-Mining auf die automatische Extraktion, Verarbeitung und Modellierung von Informationen aus großen Social-Media-Daten spezialisiert. Forschungen zur Erkennung von Beschreibungen und Bewertungen von Behandlungserwartungen gibt es bisher jedoch keine. Da sich Patient*innen häufiger auf Online-Plattformen über ihre medizinische Behandlung austauschen, könnten diese Daten dazu beitragen, Faktoren zu verstehen, die den Behandlungserfolg umfangreich beeinflussen. Darüber hinaus können wir anhand dieser Forschungsmethode neue Faktoren identifizieren, die in herkömmlichen umfragebasierten Studien nicht erfasst werden.
Ziel dieses Projekts ist es, Daten und KI-Modelle zu erstellen, die es uns ermöglichen, Beschreibungen von Behandlungserwartungen automatisch zu erkennen und Erfahrungsberichte eines großen Spektrums von Patient*innen, -gruppen und Demografien zu analysieren.
Dazu ist es zunächst notwendig, die Merkmale der Behandlungserwartungen in den sozialen Medien zu verstehen. Auf dieser Grundlage entwerfen und führen wir eine Annotationsstudie durch, mit der wir einen Trainings- und Bewertungsdatensatz für unsere Forschung erstellen. Anschließend untersuchen wir, welcher Modellierungsansatz die Klassifizierung von Dokumenten und Textabschnitten im Hinblick auf die Aufgabe am besten ermöglicht.
Wir werden sowohl hochmoderne Modelle für große Sprachdatenmengen (LLMs) als auch einfachere benutzerdefinierte Modelle in Betracht ziehen. Auf der Grundlage unserer Modelle untersuchen wir, inwieweit wir solche Modelle nutzen können, um neue Informationen zu gewinnen und Behandlungserwartungen aus umfangreichen Social Media-Daten zu analysieren. Gemeinsam mit dem Industriepartner beginnen wir effektive Wege – basierend auf dieser Wissensgrundlage – zu entwickeln, um auf die Anliegen der Patient*innen einzugehen, sei es durch gezielte Kommunikation oder durch die Entwicklung neuer Behandlungsmethoden.
Nach Abschluss des Projekts werden wir über einen Datensatz verfügen, der für die Erkennung von Behandlungserwartungen aufbereitet ist. Darüber hinaus werden wir über Rechenmodelle für die Erkennung von Behandlungserwartungen und ein detailliertes Verständnis der Fähigkeiten der State-of-the-Art Sprachmodelle für diese Aufgabe verfügen. Darüber hinaus werden wir einen Anwendungsprototyp evaluieren. Ein solches System könnte beispielsweise Interessengruppen aus der Industrie mit gängigen Erwartungen und Patient*innen mit gezielten Informationen vor der Behandlung versorgen, um etwaige negative Erwartungen zu abzumildern.
Software Campus-Partner: Universität Stuttgart und Merck KGaA
Umsetzungszeitraum: 01.05.2025 – 30.04.2027