Liebe Kolleginnen und Kollegen,
Liebe Leserinnen und
Leser,
nach gut einem Jahr freuen wir uns, Ihnen nun das nächste
AGENS-Supplement zu Methoden und Ergebnissen der Sekundärdatenanalyse vorlegen zu
können, freundlicherweise wie immer unterstützt durch die Gesamtschriftleitung des
Gesundheitswesens und die Mitarbeiter:innen des Thieme-Verlags. Vielen
Dank.
Das Heft zeichnet sich wie inzwischen gewohnt durch eine Kompilation
mehrerer methodischer Artikel aus, die die Vielzahl wissenschaftlich nutzbarer
Datenquellen und spezifischer Methoden widerspiegelt. Aber auch die Reflexion über
aktuelle wissenschaftspolitische Entwicklungen gehört zum Themenkanon dieser
Supplementreihe, ebenso wie Berichte aus der Sekundärdaten-‚Szene‘, wie der
Rückblick auf den AGENS Methodenworkshop 2024 in Hannover.
Ihle et al. stellen
ergänzend in einem Kurzbericht die Ergebnisse einer Onlinebefragung potentieller
Nutzer:innen des FDZ Gesundheit dar. Der Fokus lag hierbei auf den in der virtuellen
Analyseumgebung vom FDZ bereitgestellten Softwaretools SQL, R und Python. Im Bericht
wird diese Softwareauswahl vor dem Hintergrund der Nutzer:innenkenntnisse kritisch
diskutiert, und es werden daraus Schlussfolgerungen und Handlungsempfehlungen
formuliert
Die ersten beiden Beiträge befassen sich mit der Validität von
vertragsärztlichen Abrechnungsdaten der privaten Krankenversicherungen und knüpfen
damit an Artikel aus den vorangegangenen Supplements an. Gothe et al.
beschreiben zunächst die Grundlagen und Voraussetzungen für die wissenschaftliche
Nutzung dieser Daten. In der Darlegung von Gemeinsamkeiten und Unterschieden
zwischen GKV- und PKV-Daten sowie den besonderen Merkmalen von PKV-Daten wird
erkennbar, warum diese bislang einem wissenschaftlichen Zugang weitgehend
verschlossen blieben, was auch durch spezifische datenschutzrechtliche ‚Bewehrungen‘
dieser Daten erklärt wird. Eine Nutzung wie bei GKV-Daten inzwischen seit vielen
Jahren üblich ist jedoch grundsätzlich möglich und erstrebenswert, wie die
Autor:innen ausführen.
Anschließend adressieren Stallmann et al.
konkret Datenentstehung, Datenfluss und Herausforderungen beim wissenschaftlichen
Arbeiten mit diesen Daten. Um die PKV-Daten in der Forschung zu verwenden, ist es
essenziell, die Logik des PKV-Systems bzgl. Einreichung von Rechnungen zu deren
Erstattung für den Bereich der ambulant-ärztlichen Versorgung inklusive Arzneimittel
zu verstehen. Ein exemplarisches Datenflussmodell für die genannten Sektoren
illustriert Abläufe und Besonderheiten im PKV-System. Damit wird ein grundlegendes
Verständnis für diese Daten ermöglicht. Mit diesen beiden Artikeln wird schrittweise
der Blick auf die Inanspruchnahme medizinischer Leistungen der rund 12% privat
krankenversicherten Bürger:innen eröffnet. Der dritte Teil dieser Artikelserie wird
im nächsten AGENS Supplement erscheinen.
Der Beitrag von Tuncer et al.
thematisiert die Entwicklung und interne Validierung von Falldefinitionen für
Nierenerkrankungen bei Personen mit Diabetes in GKV-Routinedaten. Die Autor:innen
stellen Algorithmen zur Identifikation von chronischer Niereninsuffizienz und
Nierenersatztherapie vor, die über Diagnose- und Leistungsangaben validiert werden.
Schwierig erweist sich allerdings – wie schon für andere Krankheiten dargelegt - die
Prävalenzschätzung von Niereninsuffizienz, wenn nur ein kurzer Beobachtungszeitraum
vorliegt, weil diese Begleiterkrankung im Anfangsstadium nicht zwingend neben der
Grunderkrankung Diabetes dokumentiert wird.
Heinze et al. beschreiben
einen Ansatz zur Evaluation des deutschen Mammographie-Screening-Programms über ein
Datenlinkage von GKV-Routinedaten mit Informationen zur Todesursache aus regionalen
epidemiologischen Krebsregistern. Ein weiteres Ziel war die Untersuchung, in welchem
Ausmaß die Identifikation von laut GKV-Daten verstorbenen Versicherten in
Krebsregistern und dort ergänzend vorgehaltenen Angaben zur Todesursache gelingt.
Da
Todesursacheninformation jedoch nicht für alle Verstorbenen hinzugefügt werden
konnten, bleiben weiterhin Routinedaten-basierte Algorithmen zur
Todesursachenanreicherung mit Routinedaten notwendig.
Merzenich et al.
berichten aus einem Innofonds-Projekt zu Spätfolgen nach einer Krebserkrankung im
Kindes- und Jugendalter. Ebenso wie im vorhergehenden Artikel wird hierin das
Datenlinkage zweier Datenquellen beschrieben. Dabei werden GKV-Routinedaten genutzt,
um ehemalige im Deutschen Kinderkrebsregister (DKKR) registrierte Patient:innen auf
das mögliche erhöhte Risiko für Spätfolgen zu untersuchen. In diesem Artikel wird
das Linkageverfahren beschrieben und die Repräsentativität der entstandenen
Positive-Match-Kohorte analysiert. Es zeigten sich keine relevanten Unterschiede
zwischen Match- und Non-Match-Gruppe, was die Belastbarkeit der entstandenen
Überlebenden-Kohorte belegt und den Linkage-Ansatz als attraktiv für vergleichbare
Linkage-Studien erscheinen lässt. Im nächsten Supplement wird das Linkage-Verfahren
in größerer Detailliertheit beschrieben.
Goldhahn et al. stellen eine
weitere Datenlinkage-Studie vor, die Angaben aus dem Notfallregister AKTIN mit
GKV-Daten verknüpft, um den Verbleib und das Follow-up der Notfallpatient:innen zu
untersuchen. Es stellt sich heraus, dass sich stationäre Aufnahmen im direkten
Anschluss an Notaufnahmebesuche sowie ambulante Behandlungen in Notaufnahmen in
GKV-Routinedaten sinnvoll abbilden lassen. Die Verlinkung erfolgt auf der Basis
indirekter stochastischer Verfahren, da ein direkter Schlüssel wie die
Krankenversichertennummer in der Notfalldokumentation nicht vollständig vorliegt.
Die Notwendigkeit einer eindeutigen Schlüsselvariablen in Linkage-Studien lässt sich
damit als Grundpetitum für vergleichbare Studien ableiten.
Hauswaldt et
al. beschäftigen sich mit verglichen mit den vertragsärztlichen Abrechnungsdaten
sehr viel detaillierteren hausärztlichen Behandlungsdaten und den Möglichkeiten zur
Anonymisierung sensibler Feldinhalte, um diese Behandlungsdaten der
wissenschaftlichen Nutzung zuführen zu können. Mehrere Ansätze zur Anonymisierung
wurden exemplarisch geprüft, jedoch gelang eine Anonymisierung nicht vollständig.
Besonders Freitextfelder wie Dauerbemerkungen, aktuelle Diagnose, Medikament und
Befund erschweren die faktische Anonymisierung. Sorgfältige Vorabauswahl der
benötigen Variablen und Datensparsamkeit sowie privacy by design im
Verarbeitungsprozess sind daher von entscheidender Bedeutung.
Das Supplement
schließt mit dem Plädoyer von Schmitt et al. zugunsten einer kooperativen
Forschungsdatenplattform der Gesetzlichen und Privaten Krankenversicherung und des
Netzwerks Universitätsmedizin (NUM). Darin sollen perspektivisch Daten aus der
klinischen Routineversorgung der 36 deutschen Universitätskliniken, aus klinischen
Kohorten und klinisch-epidemiologischen Studien zusammenfließen. Nach Ansicht der
Autor:innen könnte diese Datenbasis In strategischer Partnerschaft mit gesetzlichen
Krankenkassen und privaten Krankenversicherungen perspektivisch für unterschiedliche
Forschungsfragen auf der Basis des an allen NUM-Standorten implementierten „Broad
Consent“ genutzt werden.
Wir wünschen Ihnen nun eine anregende Lektüre dieser
vielfältigen Artikel, idealerweise mit konkreten Implikationen für Ihre eigene
wissenschaftliche Arbeit mit Sekundärdaten. Schließen möchten wir mit der
Ermunterung schließen, eigene wissenschaftliche Arbeiten mit methodischem
Schwerpunkt für die Einreichung bei diesem Supplement in Erwägung zu
ziehen.
Enno Swart, Jelena Epping, Holger Gothe und Peter
Ihle