Gesundheitsökonomie & Qualitätsmanagement 2020; 25(06): 297-304
DOI: 10.1055/a-1167-5927
Originalarbeit

Regularisierte regressionsanalytische Verfahren für hochdimensionale Daten: ein neuer Ansatz in der Krankheitskostenrechnung des Statistischen Bundesamts zu ärztlichen Leistungen und Arzneiverordnungen

Regularized regression for high-dimensional data: a new approach for cost of illness calculation of medical services and medicine prescriptions within the range of statistical machine learning
J. Heuer
1   Zentralinstitut für die kassenärztliche Versorgung, Berlin, Deutschland
,
M.-L. Rosenbusch
1   Zentralinstitut für die kassenärztliche Versorgung, Berlin, Deutschland
,
E. Steiger
1   Zentralinstitut für die kassenärztliche Versorgung, Berlin, Deutschland
,
M. Erhart
2   Alice-Salomon-Hochschule, Berlin, Deutschland
› Author Affiliations

Zusammenfassung

Hintergrund und Zielsetzung Im Rahmen seiner Krankheitskostenrechnung hat das Statistische Bundesamt (Destatis) vom Zentralinstitut für die kassenärztliche Versorgung (Zi) berechnete Kosten in Arztpraxen erhalten. Das Zi hat hierfür einen neuen statistischen Ansatz entwickelt, dessen Ergebnisse in dieser Arbeit mit den Befunden der bisherigen Methode verglichen werden.

Methode Die Kosten werden erstmalig mit einem Regressionsmodell geschätzt. Aufgrund der hohen Anzahl teilweise kollinearer Prädiktoren wird die Ridge-Regression angewendet, die darüber hinaus die Varianz der Schätzung reduziert und zu den Verfahren des maschinellen statistischen Lernens gezählt werden kann.

Ergebnisse Die Verteilung der Kosten in Arztpraxen des Jahres 2008 und der Verordnungskosten in Apotheken des Jahres 2009 nach dem Ridge-Regressionsmodell folgt annähernd der Kostenverteilung gemäß den nach der bisherigen Methode berechneten und publizierten Ergebnissen, weicht jedoch für bestimmte Erkrankungsgruppen erkennbar ab. Die höchsten direkten Behandlungs- bzw. Verordnungskosten werden für Nierenversagen bzw. HIV-Erkrankungen ermittelt.

Schlussfolgerung Die durchgeführten Analysen resultieren in plausiblen Ergebnissen und zeigen die Möglichkeiten, regularisierte Regressionsverfahren für die Analyse hochdimensionaler Versorgungsdaten Gewinn bringend einzusetzen.

Summary

Aim Zi provided the Federal Statistical Office (Destatis) with results of cost of illness, calculated from the costs of ambulatory care. Therefore, Zi has developed a new statistic approach, whose results are compared with the findings of the former methodical calculation in this paper.

Method First, costs per disease group are estimated with a regression model. Due to the great number and partly collinear predictors ridge regression has been used to reduce the variance of estimates. It ranks among the methods of statistical machine learning.

Results Using the ridge-regression model, the distribution of costs of ambulatory physician services in 2008 and costs of medical prescriptions in pharmacies in 2009, roughly follows the published cost allocation, calculated with the usual method, but varies visibly in certain illness groups. The highest direct costs for treatment and prescription were detected for kidney failure and HIV infection, respectively.

Conclusion The performed analyses show plausible results and demonstrate the benefits of using regularized regression procedures for the analysis of high-dimensional claims data.



Publication History

Article published online:
29 July 2020

© Georg Thieme Verlag KG
Stuttgart · New York

 
  • Literatur

  • 1 Vijg J, de Grey A. Innovating aging: promises and pitfalls on the road to life extension. Gerontology 2014; 60 (04) 373-380
  • 2 Ioannou A. et al. Impacts of globalization in health. Studies In Health Technology And Informatics 2013; 190: 222-224
  • 3 Robert-Koch-Institut Welche Auswirkungen hat der demografische Wandel auf Gesundheit und Gesundheitsversorgung?. Robert Koch-Institut Hrsg. Gesundheit in Deutschland. 2015. RKI: Gesundheitsberichterstattung des Bundes. Gemeinsam getragen von RKI und Destatis; Berlin: 432-456
  • 4 Stahmeyer J. et al. Gesundheitsausgabenentwicklung und der Einfluss des demografischen Wandels. Bundesgesundheitsblatt – Gesundheitsforschung – Gesundheitsschutz 2018; 61 (04) 432-441
  • 5 Henke K, Martin K. Die Krankheitskostenrechnung als Entscheidungshilfe. Bundesgesundheitsbl-Gesundheitsforsch-Gesundheitsschutz 2006; 49 (01) 19-27
  • 6 Krankheitskostenrechnung für Deutschland. Bericht zum Symposium. Bad Breisig: 2003
  • 7 Jo C. Cost-of-illness studies: concepts, scopes and methods. Clinical and Molecular Hepatology 2014; 20: 327-337
  • 8 Bergmann E, Horch K. Kosten alkoholassoziierter Krankheiten. Schätzungen für Deutschland. Beiträge zur Gesundheitsberichterstattung des Bundes. Berlin: 2002
  • 9 Gesundheit. Krankheitskosten 2002, 2004, 2006 und 2008. Fachserie 12 Reihe 7.2. Wiesbaden: 2010
  • 10 OECD Extension of work on expenditure by disease, age and gender. Final Report 2013. EU Contribution Agreement 2011; 53 (01) 72
  • 11 Bundesversicherungsamt. So funktioniert der neue Risikostrukturausgleich im Gesundheitsfonds. o. J.: o. O.
  • 12 Berger I, Hinz A, Looschen K. Bericht des Instituts des Bewertungsausschusses zur Weiterentwicklung des Klassifikationssystems sowie zur Ermittlung der Veränderungsraten für das Jahr 2017 gemäß § 87a Abs. 5 SGB V. 2017
  • 13 James G, Witten D, Tibshirani R. An introduction to Statistical learning. New York: Springer; 2013
  • 14 Hastie T, Tibshirani R, Friedman J. The elements of statistical learning – data mining, inference and prediction (2nd edition). New York: Springer; 2008
  • 15 Chatterji S, Hadi A. Regression analysis by example. 4th Edition. New Jersey: John Wiley & Sons; 2006
  • 16 Wieringen W. Lecture notes on ridge regression. Cornell University Library; 2015. arXiv:1509.09169.
  • 17 Tibshirani R. Modern regression 1: Ridge regression. Data Mining: 36–462/36-662WN. Pittsburgh: Carnegie Mellon University; 2013
  • 18 Vlaming R, Groenen P. The current and future use of ridge regression for prediction in quantitative genetics. in BioMed Research International DOI: 10.1155/2015/143712. 2015;
  • 19 Schmidt K, Trenkler G. Einführung in die moderne Matrix-Algebra. Mit Anwendungen in der Statistik. Zweite, vollständig überarbeitete Auflage. Berlin Heidelberg: Springer; 2006
  • 20 Zou H, Hastie T. Regularization and variable selection via the elastic net. JR Statist Soc B 67 2005; 2: 301-320
  • 21 Wiebe B. Das elastic net und Gruppierung korrelierter Prädiktoren. 2014
  • 22 Friedman J, Hastie T, Tibshirani R. Regularization Paths for Generalized Linear Models via Coordinate Descent. Journal of statistical software 2010; 33 (01) 1-22
  • 23 OECD Estimating Expenditure by disease, age and gender by the system of health account (SHA) framework. 2008
  • 24 Gesundheit. Krankheitskosten 2015. Fachserie 12 Reihe 7.2.1. Wiesbaden: 2017