CC BY-NC-ND 4.0 · Gesundheitswesen 2020; 82(S 02): S117-S121
DOI: 10.1055/a-0999-5509
Original Article
Eigentümer und Copyright ©Georg Thieme Verlag KG 2018

Linkage of Routine Data to Other Data Sources in Germany: A Practical Example Illustrating Challenges and Solutions

Verknüpfung von Routinedaten mit anderen Datenquellen in Deutschland: Herausforderungen und Lösungen dargestellt an einem praktischen Beispiel
Ingo Langner
1   Klinische Epidemiologie, Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS, Bremen
,
Oliver Riedel
1   Klinische Epidemiologie, Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS, Bremen
,
Jonas Czwikla
2   SOCIUM Forschungszentrum Ungleichheit und Sozialpolitik, Universität Bremen, Bremen
3   Wissenschaftsschwerpunkt Gesundheitswissenschaften, Universität Bremen, Bremen
,
Franziska Heinze
2   SOCIUM Forschungszentrum Ungleichheit und Sozialpolitik, Universität Bremen, Bremen
3   Wissenschaftsschwerpunkt Gesundheitswissenschaften, Universität Bremen, Bremen
,
Heinz Rothgang
2   SOCIUM Forschungszentrum Ungleichheit und Sozialpolitik, Universität Bremen, Bremen
3   Wissenschaftsschwerpunkt Gesundheitswissenschaften, Universität Bremen, Bremen
,
Hajo Zeeb
3   Wissenschaftsschwerpunkt Gesundheitswissenschaften, Universität Bremen, Bremen
4   Abt. Prävention und Evaluation, Leibniz-Institut für Präventionsforschung und Epidemiologie, Bremen
,
Ulrike Haug
1   Klinische Epidemiologie, Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS, Bremen
3   Wissenschaftsschwerpunkt Gesundheitswissenschaften, Universität Bremen, Bremen
› Author Affiliations
Further Information

Publication History

Publication Date:
02 December 2019 (online)

Zusammenfassung

Routinedaten haben ein hohes Potenzial für die epidemiologische und Versorgungsforschung, doch fehlen beispielsweise Informationen zu Todesursachen und es mangelt häufig an detaillierten Informationen u. a. zu Lebensstilfaktoren. In Deutschland ist v. a. aufgrund der strengen Datenschutzauflagen eine unmittelbare Ergänzung dieser Informationen durch andere Datenquellen („Linkage“) mit einigen Herausforderungen verbunden. So besteht eine Herausforderung darin, dass die Routinedatennutzer üblicherweise keinen Zugriff auf Personenidentifikatoren besitzen, die für ein Linkage erforderlich sind. Darüber hinaus sollten sensible Informationen (z. B. die Todesursache) nicht an Institutionen übermittelt werden, die selbst über Personenidentifikatoren verfügen. In diesem Artikel veranschaulichen wir diese zentralen Herausforderungen und stellen entsprechende Lösungen anhand eines Praxisbeispiels vor, bei dem die Abrechnungsdaten von gesetzlichen Krankenkassen mit einem epidemiologischen Krebsregister verknüpft werden, um Informationen zur Todesursache zu erhalten. Wir beschreiben die für das Linkage notwendigen Genehmigungsverfahren, den Datenfluss zwischen den beteiligten Institutionen und erläutern die Gründe für den Datenfluss im Hinblick auf die wesentlichen Herausforderungen. Schließlich verallgemeinern wir die Fragen, die bei der Planung eines Linkage-Verfahrens zu klären sind und zeigen mögliche weitere Herausforderungen auf. Mit diesem praktischen Beispiel zeigen wir, dass ein Abgleich zwischen Routinedaten und anderen Datenquellen in Deutschland umsetzbar ist, dabei aber bestimmte Beschränkungen und Hindernisse berücksichtigt werden müssen.

Abstract

Routine data have a high potential for epidemiological and health care research but lack information, for instance, on the cause of death. Often detailed information, such as on lifestyle factors is also missing. In Germany, obtaining the missing information by linkage to data sources is challenging, mainly due to strict data protection regulations. One key challenge arises from the fact that routine data users usually have no access to person identifiers which would be necessary for record linkage. A second key challenge is that sensitive information (i. e., the cause of death) should not be transferred to an institution that holds person identifiers. In this paper, we illustrate these key challenges and present corresponding solutions based on a practical example where claims data from statutory health insurance providers are linked to an epidemiological cancer registry to obtain cause of death information. We describe the approval procedures necessary for the record linkage, the dataflow between the involved institutions and explain the rationale of the dataflow in view of the key challenges. Finally, we generalize the questions that need to be addressed when a record linkage is planned and point to additional potential challenges. Overall, we illustrate that a linkage between routine data and other data sources in Germany is feasible, but specific restrictions and hurdles need to be taken into consideration.

 
  • References

  • 1 Hoffmann F. Review on use of German health insurance medication claims data for epidemiological research. Pharmacoepidemiol Drug Saf 2009; 18: 349-356
  • 2 Kreis K, Neubauer S, Klora M. et al. Status and perspectives of claims data analyses in Germany-A systematic review. Health Policy 2016; 120: 213-226
  • 3 Hoffmann F, Abbas S. Gut gelinkt ist halb gewonnen: Es könnte alles so einfach sein, ist es aber nicht. Gesundheitswesen 2015; 77: 72-73
  • 4 March S, Antoni M, Kieschke J. et al. [Quo Vadis Data Linkage in Germany? An Initial Inventory]. Gesundheitswesen. 2018; 80: e20-e31
  • 5 March S, Rauch A, Bender S. et al. Data protection aspects concerning the use of social or routine data. FDZ Methodenreport 2015; 12: 1-22
  • 6 Fuhs A, Bartholomäus S, Heidinger O. et al. [Evaluation of the impact of the mammography screening program on breast cancer mortality: feasibility study on linking several data sources in North Rhine-Westphalia]. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz 2014; 57: 60e7
  • 7 Hense HW, Barlag H, Bartholomäus S et al. Evaluation der Brustkrebsmortalität im Deutschen Mammographie-Screening-Programm - Vorhaben. 3610S40002
  • 8 Czwikla J, Giersiepen K, Langner I. et al. A cohort study of mammography screening finds that comorbidity measures are insufficient for controlling selection bias. J Clin Epidemiol 2018; 104: 1-7
  • 9 Giersiepen K, Bachteler T, Gramlich T. et al. [Performance of record linkage for cancer registry data linked with mammography screening data]. Bundesgesundheitsblatt Gesundheitsforschung Gesundheitsschutz 2010; 53: 740-747 doi:10.1007/s00103-010-1084-1
  • 10 Meyer M. Kontrollnummern und Record-Linkage. In Hentschel S, Katalinic A. Hrsg Das Manual der epidemiologischen Krebsregistrierung. München: Zuckschwerdt; 2008: 57-68
  • 11 Langner I, Krieg V, Heidinger O. et al. Enrichment of claims data with official causes of death using a record linkage with the epidemiological cancer registry of north rhine-westphalia: feasibility study and comparison of procedures. Gesundheitswesen 2018; DOI: 10.1055/s-0043-124669.. Epub ahead of print
  • 12 Ohlmeier C, Hoffmann F, Giersiepen K. et al. Linkage of statutory health insurance data with those of a hospital information system: Feasible, but also “Useful”?. Gesundheitswesen 2015; 77: e8-e14. doi:10.1055/s-0034-1395644
  • 13 Maier B, Wagner K, Behrens S. et al. Deterministic record linkage with indirect identifiers: Data of the Berlin Myocardial Infarction Registry and the AOK Nordost for patients with myocardial infarction. Gesundheitswesen 2015; 77: e15-e19. doi:10.1055/s-0034-1395642