ClaimsBERT – Prädiktion von Erkrankungsrisiken mittels eines transformerbasierten Sprachmodells (BERT) auf GKV-Claims Data
Gesundheitsrisiken frühzeitig zu erkennen, ist eine wichtige Voraussetzung für eine bedarfsgerechte medizinische Versorgung. ClaimsBERT untersucht, wie sich sogenannte »GKV-Claims Data« mithilfe Künstlicher Intelligenz systematisch auswerten lassen. Gemeint sind damit die im Versorgungsalltag routinemäßig entstehenden Abrechnungsdaten der gesetzlichen Kranken- und Pflegeversicherung, also strukturierte Angaben etwa zu Diagnosen, Behandlungen, Arzneimittelverordnungen, Krankenhausaufenthalten und weiteren abgerechneten Leistungen. Ziel des Projekts ist der Aufbau eines Foundation Models für diese Routinedaten, um gesundheitliche Risiken früh und über verschiedene Anwendungsfelder hinweg zu identifizieren.
Die technische Grundlage des Projekts bilden moderne Transformer-Architekturen, also KI-Modelle, die Muster in großen Datenmengen erkennen und Zusammenhänge über längere Zeit hinweg erfassen können. Sie verarbeiten die Daten in ihrer Abfolge und beziehen zusätzlich Merkmale wie Alter, Geschlecht und Bundesland ein. Auf diese Weise werden Muster identifiziert, die auf spätere gesundheitliche Entwicklungen hindeuten können. Nach dem Training werden die Ergebnisse auf medizinische Plausibilität geprüft. Anschließend wird das Modell gezielt feinjustiert, um die Vorhersagegüte weiter zu verbessern.
Das Foundation Model soll für verschiedene medizinische Anwendungsfälle einsetzbar sein. Dazu zählen:
- die Vorhersage des ersten Auftretens einer Pflegebedürftigkeit,
- stationäre Aufnahmen wegen oder infolge eines unerwünschten Arzneimittelereignisses,
- inzidente Diagnosen von Mammakarzinom,
- rheumatischen Erkrankungen oder Restless-Legs-Syndrom sowie
- Krankenhauseinweisungen aufgrund von Hypoglykämie oder Herzinsuffizienz.
Langfristig soll so eine breit nutzbare Grundlage entstehen, die sich mit vergleichsweise geringem Aufwand auch auf weitere Erkrankungen und Gesundheitszustände übertragen lässt.
Die Projektleitung und Konsortialführung liegen beim Wissenschaftlichen Institut der AOK (WIdO). Fraunhofer SCAI ist Konsortialpartner.
Das Projekt wird im Förderbereich Versorgungsforschung des Innovationsfonds beim Gemeinsamen Bundesausschuss (G-BA) mit rund 1,3 Millionen Euro gefördert.
Laufzeit: März 2026 bis Februar 2029. Förderkennzeichen: 01VSF25038.