Gesundheitswesen 2019; 81(10): 781-787
DOI: 10.1055/a-1007-0811
Verbandsmitteilungen
© Georg Thieme Verlag KG Stuttgart · New York

Eignung von Qualitätsindikatorensets in der Gesundheitsversorgung für verschiedene Einsatzgebiete – Forschungs- und Handlungsbedarf

K Döbler
,
M Schrappe
,
S Kuske
,
J Schmitt
,
B Sens
,
D Boywitt
,
B Misselwitz
,
M Nothacker
,
M Geraedts
Further Information

Publication History

Publication Date:
01 October 2019 (online)

Positionspapier der Arbeitsgruppe Qualitäts- und Patientensicherheitsforschung des Deutschen Netzwerks für Versorgungsforschung

Die AG Qualitäts- und Patientensicherheitsforschung (QPSF) wurde beim 13. Kongress für Versorgungsforschung (DKVF) im Juni 2014 gegründet. Ziele sind die Förderung der Qualitäts- und Patientensicherheitsforschung und die Vernetzung der thematisch aktiven Forscher aus den verschiedenen Fachgesellschaften und sonstigen Mitgliedergruppen des Netzwerks für Versorgungsforschung. Nun hat die AG QPSF ein neues Positionspapier verfasst.

Hintergrund und Zielsetzung

Indikatorengestützte Verfahren zur Qualitätsmessung und -bewertung in der Gesundheitsversorgung sind in Deutschland primär aus Initiativen wissenschaftlicher Fachgesellschaften entstanden und wurden über Jahrzehnte v. a. mit den Zielen der Forschung und der Qualitätsverbesserung eingesetzt [1]. Spätestens seit Einführung der verpflichtenden Qualitätsberichterstattung für Krankenhäuser im Jahr 2006 werden Qualitätsindikatoren zunehmend auch mit dem Ziel der Versorgungssteuerung verwendet [2].

Mit dem Krankenhausstrukturgesetz aus dem Jahr 2016 sollen Ergebnisse von Qualitätsindikatoren nunmehr noch weitgehender für regulative und steuernde Interventionen im Krankenhausbereich verwendet werden, so bspw. für Vergütungszu- und -abschläge sowie für Entscheidungen von Krankenhausplanungsbehörden [3].

Unter einem Qualitätsindikator versteht man nach weithin akzeptierter Definition der JCAHO „ein quantitatives Maß, welches zum Monitoring und zur Bewertung der Qualität wichtiger Leitungs-, Management-, klinischer und unterstützender Funktionen genutzt werden kann, die sich auf das Behandlungsergebnis beim Patienten auswirken“ [4]. Als wesentliche Einsatzgebiete von Qualitätsindikatoren im Gesundheitssystem benennt die US-amerikanische Agency for Healthcare Research and Quality (AHRQ) „Qualitätsverbesserung, Steuerung und Forschung“ [5].

Aus der dargestellten Entwicklung ergibt sich die Notwendigkeit, den Einsatz von einzelnen Qualitätsindikatoren und insbesondere auch von Indikatorensets in ein Rahmenkonzept einzubetten, auf dessen Grundlage die weitere Entwicklung geplant und später auch evaluiert werden kann. Die spätere Evaluation erscheint von besonderer Bedeutung, da international Ergebnisse aus einem breiten Einsatz von Qualitätsinformationen bekannt sind, die teilweise einen positiven Einfluss im Sinne einer Qualitätsverbesserung nicht belegen konnten. Ein wichtiges aktuelles Beispiel ist das National Surgical Quality Improvement Program des American College of Surgeons (ACS-NSQIP), dessen Auswertung auf insgesamt 1,6 Mio Patienten mit elektiven Eingriffen basiert [6] [7] [8].

Mit dem Koalitionsvertrag für die 19. Legislaturperiode haben die Regierungsparteien nun erneut die Schwerpunktsetzung der sektorenübergreifenden und regionalen Versorgung in den Mittelpunkt gestellt [9]. Auch hieraus können sich wichtige Konsequenzen für den Einsatz von Qualitätsindikatoren ergeben: es können neben der bislang im Mittelpunkt stehenden Beobachtungs- und Handlungsebene einzelner Einrichtungen weitere Beobachtungsebenen relevanter werden (wie bspw. Versorgungsverträge oder Regionen) und das Einsatzgebiet „Forschung“ bekommt größere Bedeutung, da der Einsatz von Qualitätsindikatoren sich vom Vergleich einzelner Einrichtungen auf die Ebene der Systembetrachtung ausweiten kann.

Neue gesetzliche Anforderungen, aber auch die Entwicklung der realen Versorgungsstrukturen und -prozesse stellen neue – höhere – Anforderungen an den Einsatz von Qualitätsindikatoren und Qualitätsindikatorensets in der Gesundheitsversorgung.

Diese veränderte Ausgangssituation führt dazu, dass in Zukunft nicht nur die Qualitätsförderung einzelner Einrichtungen, sondern auch regional-sektorenübergreifende, qualitätssteuernde Zwecke zu verfolgen sein werden und bedingt erheblichen und teilweise dringlichen Forschungs- und Handlungsbedarf.

Die an den bisherigen Anforderungen ausgerichteten Konzepte zur Entwicklung und zum Einsatz von Qualitätsindikatoren und Qualitätsindikatorensets scheinen für diese neuen Anforderungen teilweise nur noch bedingt geeignet.

Das vorliegende Positionspapier stellt dar, welcher prioritäre Forschungs- und Handlungsbedarf sich aus Sicht der Qualitäts- und Patientensicherheitsforschung abzeichnet.


#

2. Die Situation in Deutschland

Vor diesem Hintergrund ergeben sich in Deutschland weitergehende Anforderungen an die Qualitätsmessung, -bewertung, und -darlegung. Diese muss zunehmend auch für regional-sektorenübergreifende Beobachtungs- und Handlungsebenen gestaltet werden und zudem Rahmenbedingungen und Grenzen für regulative Verfahren wie bspw. Zu- und Abschläge bzw. einen Versorgungsausschluss aufzeigen [10].

Parallel zu der Entwicklung, Qualitätsindikatoren für Steuerungszwecke zu verwenden, findet eine intensive Diskussion um Kriterien zur Bewertung methodischer Eigenschaften („Gütekriterien“) von Indikatoren statt [11] [12] [13]. Aufbauend auf dem QUALIFY-Bewertungsinstrument für Qualitätsindikatoren der BQS haben das AQUA-Institut und das Institut für Qualitätssicherung und Transparenz im Gesundheitswesen (IQTIG) hierzu jeweils eigene Konzepte in ihren jeweiligen Methodenpapieren formuliert [14] [15].

Festzustellen ist hierbei, dass sich unterdessen für die Kriterien zur Darstellung methodischer Eigenschaften von Qualitätsindikatoren recht umfangreiche Literatur findet, während für die Bedeutung der Ausprägung dieser Eigenschaften für bestimmte Einsatzgebiete („Eignung“) noch wenig Klarheit zu bestehen scheint [11] [16].

Zudem steht eine Diskussion um die Eigenschaften, Ausrichtung und Ausgewogenheit von Indikatorensets, d. h. einer Zusammenstellung einzelner Qualitätsindikatoren zu einem Thema, hinter der Diskussion um Eigenschaften einzelner Indikatoren noch deutlich zurück [17].

Beide Ebenen (einzelner Indikator, Indikatorenset) spielen eine wichtige Rolle für die Bewertung der Eignung von Verfahren zur Qualitätsdarstellung, da sowohl der einzelne Indikator als auch das Indikatorenset jeweils Konstrukte der Qualität darstellen, deren Eigenschaften sich unterscheiden können und damit für bestimmte Einsatzgebiete mehr oder weniger gut geeignet sein können [18]. Um dies beispielhaft zu illustrieren:

  1. Auf Ebene einzelner Indikatoren können für ein Verfahren mit dem Ziel einer Qualitätsverbesserung in einem anonymen Rahmen unter sorgfältiger Abwägung von Nutzen und Risiken ggf. Kompromisse an der Güte der Risikoadjustierung hingenommen werden, wenn dadurch gleichzeitig ein geringerer Erfassungsaufwand resultiert. Für einen Einsatz mit möglichen einschneidenden Konsequenzen ist dagegen eine möglichst optimale Risikoadjustierung zu fordern, da hierfür ein ggf. erhöhter Aufwand den Nutzen rechtfertigt.

  2. Auf Ebene des Indikatorensets kann für das Ziel einer Qualitätsverbesserung in Bezug auf ein erkanntes Qualitätsdefizit (z. B. Implementierung einzelner Leitlinienempfehlungen) ein sehr schmales, auf eben diesen Ausschnitt (z. B. einzelner Aspekt aus der Dimension Sicherheit) fokussiertes Indikatorenset eingesetzt werden oder aber die Implementierung selber wird zum Gegenstand gemacht und deren Ergebnisse werden gemessen [19]. Wenn Indikatoren genutzt werden sollen, um Patienten bei der Auswahl von Krankenhäusern zu einem bestimmten Thema zu unterstützen (z. B. in der Geburtshilfe), ist hingegen ein ausgewogenes, umfassenderes Indikatorenset erforderlich, das Informationen zu mehreren Dimensionen, wie etwa Sicherheit (Vermeidung unerwünschter Ereignisse), Effektivität (werden die Behandlungsziele erreicht?) und zur Patientenzentrierung liefert.

Mit der Einführung einer sektorenübergreifenden Qualitätssicherung und zunehmendem Fokus auf eine bedarfsgerechte, sektorenübergreifende Steuerung der Gesundheitsversorgung werden Qualitätsindikatoren in Zukunft über die Beobachtungs- und Handlungsebene der einzelnen Einrichtung hinaus stärker für weitere Beobachtungs- und Handlungsebenen (z. B. für regionale Betrachtungen) zu modellieren sein [10] [20]. Es zeigt sich, dass für die Qualitätsbetrachtung auf einer sektorenübergreifenden „Systemebene“ die aktuellen Instrumente derzeit nur eingeschränkt einsetzbar sind [21].


#

3. Spezifische Fragestellungen zur Bewertung von Indikatorensets

Die Gesundheitsversorgung ist ein multidimensionales, komplexes Geschehen. Gut ausgewählte und valide Indikatoren können zwar Aussagen zur Versorgungsqualität auch für größere Bereiche der Gesundheitsversorgung ermöglichen, trotzdem bleiben sie immer selektiv. Zudem wird es nie möglich sein, alle Aspekte der Gesundheitsversorgung abzubilden.

In einigen Fällen ist dies hinreichend, wenn z. B. nur ein bestimmter, spezifischer Aspekt der Gesundheitsversorgung beobachtet werden soll. Soll jedoch die Qualität der Gesundheitsversorgung in einem ganzen Leistungsbereich (z. B. „Geburtshilfe“) und dann auch noch möglichst sektorenübergreifend (z. B. ambulante Schwangerschaftsvorsorge, Geburt, Nachsorge) bewertet werden, dann sind Indikatorensets (d. h. Gruppen mehrerer einzelner Qualitätsindikatoren zu einem Thema) nötig, die unterschiedliche Teilaspekte bewerten. Dies gilt zumindest für Bewertungen, aus denen eine direkte Handlungsrelevanz abgeleitet werden soll, die also bspw. die Leitlinienkonformität der Behandlung einzelner Leistungserbringer beurteilen. Auf den Sonderfall der aggregierten Auswertung mehrerer Einzelindikatoren („Composite Measures“) wird in Abschnitt 4.5 eingegangen.

Indikatorensets der Gesundheitsberichterstattung, die ganze Gesundheitssysteme bewerten, sind hinlänglich bekannt (z. B. World Health Report 2000, OECD – Health Care Quality Indicators). Auch Indikatorensets, die die Behandlung durch einzelne Leistungserbringer in definierten Regionen bewerten, sind international bekannt. Eines der ältesten und am besten erprobten derartigen Indikatorensets wurde von der Health Care Financing Administration (HCFA) bzw. später den Centers for Medicare & Medicaid Services (CMS) entwickelt und für den Vergleich der Versorgungsqualität der Bundesstaaten der USA verwendet [22] [23]. Dieses Indikatorenset basiert auf sechs Erkrankungen (akuter Myokardinfarkt, chronische Herzinsuffizienz, Schlaganfall, ambulant erworbene Pneumonie, Brustkrebs und Diabetes) mit insgesamt 24 Indikatoren. Das Instrument ergibt über die Zeit hochgradig korrelierende Ergebnisse. Die Auswahl der Indikatoren geschah nach transparent ausgewählten Kriterien:

  • disease is a major source of morbidity or mortality

  • certain processes of care are known to improve outcomes

  • measurement of these processes is feasible

  • offers substantial scope for improvement in performance

  • managerial intervention can potentially improve performance

International werden Kriterien angewendet, die allgemein zur Priorisierung von Indikatoren für die Verwendung in den jeweiligen Indikatorensets genutzt werden. Orientiert an den jeweiligen Zielsetzungen und Einsatzgebieten werden die Kriterien „Wissenschaftlichkeit“, „Schweregrad “, „Häufigkeit“, „Kostenfaktoren“, „Interesse der Öffentlichkeit“, „Machbarkeit“ und „Vulnerabilität“ herangezogen [24]. Je nach Fragestellung können weitere Kriterien wie „Ausgewogenheit der Settings“ sowie „Ausgewogenheit der Qualitätsdimensionen“ sowie „Repräsentativität“ herangezogen werden. Dies sind jedoch Kriterien, die nur von einzelnen Institutionen explizit genannt werden (z. B. The Joint Commission, Organisation for Economic Co-operation and Development, Agency for Healthcare Research and Quality, National Quality Forum).

Bei der Entwicklung von Indikatorensets finden letztlich Auswahlentscheidungen auf mehreren Ebenen statt:

  • Auswahl prioritärer Themen, die eine große Bedeutung für die Gesundheit der Bevölkerung haben (mögliche Kriterien: Häufigkeit, Schwere der Erkrankungen)

  • Auswahl von Indikatoren zu Versorgungsaspekten, bei denen Qualitätsunterschiede wie Über-, Unter,- oder Fehlversorgung unter Berücksichtigung von Bedarfen festzustellen sind

  • Auswahl von Indikatoren mit verbliebenem Verbesserungspotenzial, für die evidenzbasierte Behandlungsempfehlungen bestehen, die wiederum unter Kontrolle der Leistungserbringer sind

In Erweiterung dieser Auswahlkriterien sind bei Indikatorensets weitere Aspekte zu berücksichtigen:

  • Auswahl der einzelnen Indikatoren unter dem Gesichtspunkt ihrer methodischen Eigenschaften/methodischen Güte

  • Auswahl messbarer, also praktikabler Indikatoren

  • Auswahl der einzelnen Indikatoren unter dem Gesichtspunkt der ausgewogenen Abbildung des Versorgungsaspekts (Eigenschaften des Indikatorensets)

Es ergibt sich aus dem in den Abschnitten 2 und 3 Beschriebenen, dass bei der Bewertung von Indikatorensets primär 2 Ebenen zu berücksichtigen sind:

  1. Die Ebene der Eigenschaften („Gütekriterien“)

  • der einzelnen Indikatoren

  • der Indikatorensets

  1. Die Ebene der Eignung für bestimmte Zielsetzungen und Einsatzgebiete

  • der einzelnen Indikatoren

  • der Indikatorensets

zu 1) Bewertung auf der Ebene der Eigenschaften („Gütekriterien“)

Eine Bewertung auf Ebene der Eigenschaften liefert eine Bewertung der Güte des Indikators, jedoch keine Bewertung der Eignung eines Indikators für einen bestimmten Zweck im Sinne von „gut für“ oder „nicht gut für“, sondern nur im Sinne von „ausgeprägt“ oder „weniger ausgeprägt“, bestenfalls im Sinne von „gut“ oder „weniger gut“ bzw. „besser“. So kann bspw. festgestellt werden, dass ein Indikator eine mehr oder weniger differenzierte und damit spezifische Risikoadjustierung aufweist. Dies lässt aber zunächst noch keine Aussage zu, ob der Indikator damit für eine bestimmte Zielsetzung mehr oder weniger gut geeignet ist.

Somit sind für eine Bewertung auf der Ebene der Eigenschaften Kriterien erforderlich, die die Eigenschaften eines Indikators und eines Indikatorensets möglichst umfassend beschreiben und somit ein Profil dieser Eigenschaften liefern.

Für Kriterien zur Beschreibung der Eigenschaften einzelner Indikatoren erscheint der Begriff „Gütekriterien“ unterdessen geläufig und es liegen eine Reihe von Empfehlungen für solche Gütekriterien vor [11] [12] [13] [14] [15] [25] [26] [27].

Für Kriterien zur Beschreibung der Eigenschaften von Indikatorensets liegen derzeit keine klaren Empfehlungen vor [17].


#

zu 2) Bewertung auf Ebene der Eignung für bestimmte Zielsetzungen und Einsatzgebiete

Eine Eignung kann nur in Bezug auf die beabsichtigte Anwendung beurteilt werden: Eignung wofür? Im Vordergrund steht dabei die Zielbestimmung des Einsatzes der Indikatoren.

Berücksichtigt werden müssen dabei die strukturellen Umgebungsbedingungen, mögliche erwünschte sowie nicht erwünschte strukturelle Folgen des Indikatoreneinsatzes sowie die Beobachtungs- und Handlungsperspektive. Der letztgenannte Aspekt ist besonders wichtig, denn speziell in Deutschland werden Indikatoren vielfach unter dem Blickwinkel des Institutionen- bzw. Anbieterbezugs genutzt (Beobachtungs- und Handlungsebene: einzelne Einrichtung). In Zukunft erscheint zusätzlich besonders ein Populations- bzw. regionaler Bezug von Bedeutung (sektorenübergreifende und patientenbezogene Perspektive).

Immanent mit der Frage der Zielsetzung verbunden ist die Frage nach den möglichen Konsequenzen, d. h. praktisch die Frage nach den Interventionen, die auf Grundlage der Indikatorergebnisse erfolgen sollen.

Dies betrifft die Grundfragen nach freiwilligen oder verpflichtenden Datenerhebungen und Maßnahmen, externer oder interner Nutzung der Ergebnisse sowie nach den sich ergebenden Konsequenzen, z. B. Veröffentlichung der Ergebnisse, Einsatz qualitätsfördernder oder steuernder Maßnahmen, Benchmarking-Projekte der beteiligten Einrichtungen.

Somit müssen zunächst mögliche Ziele und Einsatzgebiete der Indikatoren sowie mögliche Konsequenzen der ermittelten Ergebnisse beschrieben werden.

Im nächsten Schritt sind dann Kriterien festzulegen, mithilfe derer die Eignung von Indikatoren und Indikatorensets mit bestimmten Eigenschaften für bestimmte Ziele und Einsatzgebiete bewertet werden kann.


#
#

4. Prioritärer Forschungs- und Handlungsbedarf

Im Folgenden soll der prioritäre Forschungs- und Handlungsbedarf auf den mehrfach genannten 2 Ebenen beschrieben werden:

  • Ebene Qualitätsindikatoren

  1. Bewertung der Eigenschaften (Gütekriterien) von Qualitätsindikatoren

  2. Bewertung der Eignung von Qualitätsindikatoren für bestimmte Zielsetzungen und Einsatzgebiete

  • Ebene Qualitätsindikatorensets

  1. Bewertung der Eigenschaften (Gütekriterien) von Qualitätsindikatorensets

  2. Bewertung der Eignung von Qualitätsindikatorensets für bestimmte Zielsetzungen und Einsatzgebiete

4.1 Bewertung der Eigenschaften von Qualitätsindikatoren

Vielfach verwendet werden Gütekriterien aus der vom RAND-Institut vorgeschlagenen „RAND-Appropriateness-Methode“ und des Qualify-Instruments. Für beide Instrumente gilt jedoch, dass die Kriterien meist in modifizierter Form verwendet werden, d. h. dass nur ausgewählte Kriterien verwendet werden, und/oder die Kriterien modifiziert wurden und/oder das Vorgehen zur Bewertung der Kriterien modifiziert wurde [12] [28] [29] [30].

Der Einsatz und die Ausgestaltung dieser Instrumente hängt wesentlich davon ab, ob die Kriterien zur Bewertung der Eigenschaften von Qualitätsindikatoren während der Entwicklung von Qualitätsindikatoren oder zur Bewertung „fertiger“ Indikatoren im Routinebetrieb verwendet werden.

Keines der in Deutschland eingesetzten Verfahren (Qualify durch BQS, modifiziertes Qualify durch NVL, modifiziertes RAND durch AQUA, Kriterien des IQTIG) wurde bislang systematisch empirisch validiert; das Qualify-Instrument wurde zumindest interviewbasiert evaluiert [31]. Dabei erscheint es sinnvoll, zwischen den eigentlichen Gütekriterien (z. B. Diskriminationsfähigkeit, Risikoadjustierung, usw.) und deren Operationalisierung, etwa mittels eines Instruments wie QUALIFY oder modifiziertes RAND, zu unterscheiden. So bedienen sich bspw. unterschiedliche Instrumente ähnlicher Gütekriterien, operationalisieren diese jedoch teilweise auf unterschiedliche Weise.

  • Forschungsbedarf: systematische Validierung eines oder mehrerer der eingesetzten Instrumente zur Bewertung der methodischen Güte von Indikatoren


#

4.2 Bewertung der Eignung von Qualitätsindikatoren für bestimmte Zielsetzungen und Einsatzgebiete

Die BQS hat das Qualify-Instrument genutzt, um die Eignung von im Routinebetrieb eingesetzten Indikatoren für ein einrichtungsbezogenes Public Reporting zu bewerten. Für diese spezifische Zielsetzung wurden 14 der 20 Qualify-Kriterien ausgewählt und es wurden Annahmeschwellen definiert, ab wann ein Indikator unter methodischen Gesichtspunkten als geeignet für Public Reporting anzusehen ist [12]. Das AQUA-Institut hat dieses Vorgehen modifiziert [32]. In beiden Fällen wurden ausgewählte Gütekriterien verwendet und mittels eines individuell festgelegten Bewertungsschemas unter Einbeziehung von Expertenpanels bewertet.

Das IQTIG spricht in seinem Methodenpapier von „Eignungskriterien“ für verschiedene „Verwendungszwecke“. Das Konzept des IQTIG differenziert daher nicht primär zwischen „Eigenschaften“ und „Eignung“, sondern verwendet letztlich einen integrierten Bewertungsansatz [15].

  • Forschungsbedarf: systematische Validierung eines oder mehrerer der eingesetzten Konzepte zur Eignungsprüfung für unterschiedliche Verwendungszwecke

Insbesondere erscheint es relevant, Vor- und Nachteile des integrierten Bewertungsansatzes des IQTIG mit einer differenzierten Bewertung von „Eigenschaften“ und „Eignung“ zu vergleichen und zu bewerten.

Darüber hinaus erscheint es empfehlenswert, einen einheitlichen Sprachgebrauch darüber herzustellen, was als „Einsatzgebiet“ bzw. „Verwendungszweck“ von Qualitätsindikatoren anzusehen ist. Die von der AHRQ vorgeschlagenen und vom IQTIG grundsätzlich aufgenommenen drei Kategorien (Qualitätsverbesserung, Steuerung, Forschung) sind sicherlich als akzeptierte Konvention anzusehen, erscheinen allerdings für den praktischen Einsatz und für Forschungsaktivitäten nicht ausreichend differenziert. So liegt bspw. nahe, dass unterschiedliche Eignungskriterien für (möglicherweise unterschiedliche Formen von) Pay-for-Performance und für Public Reporting sachgerecht sind, obwohl beide Einsatzgebiete der Kategorie „Steuerung“ zuzuordnen sind.

Das IQTIG differenziert in seinem aktuellen Methodenpapier für den „Kontext der externen Qualitätssicherung nach SGB V“ zwischen „Qualitätsförderung, Information, selektivvertraglichen Anreizen, Planung der Versorgungsstrukturen und Qualitätszu- und -abschlägen“ [15].

Es erscheint empfehlenswert, auch über die Vorgaben des SGB V hinaus einen Rahmen zu definieren, der für Einsatzgebiete, Handlungskonsequenzen (Interventionen) und Beobachtungsebenen eine Grundlage für einheitlich verwendbare Begriffe schafft

  • Entwicklungsbedarf: Erarbeitung eines Rahmenkonzepts zu verschiedenen Zielsetzungen, Beobachtungs- und Handlungsebenen von Qualitätsindikatoren und Qualitätsindikatorensets


#

4.3 Bewertung der Eigenschaften (Ausrichtung und Ausgewogenheit) von Indikatorensets

Konsentierte oder anerkannte Kriterien zur Bewertung der Güte von Indikatorensets stehen derzeit nicht zur Verfügung. Verbreitet sind allerdings Zuordnungen von Qualitätsindikatoren zu sogenannten Qualitätsdimensionen oder Domänen [14] [15] [17] [33] [34] [35].

Wohl am bekanntesten und gebräuchlichsten ist die Einteilung nach Donabedian in die sog. „Dimensionen“ Struktur-, Prozess- und Ergebnisqualität [33]. Diese Einteilung erlaubt aber keine Aussage zur Ausgewogenheit in Bezug auf die inhaltliche Ausrichtung von Indikatorensets, da bspw. durch ein Indikatorenset allein die Dimension der Sicherheit (nach dem Rahmenkonzept der OECD) angesprochen werden kann – aber möglicherweise eben mit je einem Indikator zur Strukturqualität, einem zur Prozess- und einem zur Ergebnisqualität.

Um die inhaltliche Ausgewogenheit von Indikatorensets zu beurteilen, könnten die von einer Arbeitsgruppe der OECD konsentierten Qualitätsdimensionen genutzt werden [34] [35].

Damit wird eine Zuordnung zu folgenden zentralen Dimensionen („core dimensions“) möglich:

  • Effektivität (werden die Behandlungsziele erreicht?),

  • Sicherheit (werden unerwünschte Ereignisse vermieden?),

  • Indikationsstellung und

  • Patientenzentrierung

Aktuell wurde das Modell der Qualitätsdimensionen der OECD als methodischer Ansatz zur Bewertung der inhaltlichen Schwerpunktsetzung und Ausgewogenheit von Indikatorensets genutzt und an den Indikatorensets der stationären Qualitätssicherung nach §136 SGB V überprüft [17]. Grundsätzlich erscheint der genutzte Ansatz geeignet, eine orientierende Aussage zur Ausrichtung von Indikatorensets vorzunehmen. Es können auch andere Modelle genutzt werden, auf die die im Folgenden formulierten Fragestellungen vom Grundsatz her analog anzuwenden sind [36] [37] [38]. Auch das IQTIG hat in der aktuellen Version seiner Methodischen Grundlagen hierzu ein eigenes Modell vorgeschlagen [15].

Sowohl für die Dimension der Effektivität als auch die Dimension der Sicherheit können Core Outcome Sets ein hilfreiches Instrument darstellen, um festzustellen, wie umfassend die jeweiligen Dimensionen abgebildet werden [26] [27] [39]. Die Bewertung der Abbildung der jeweiligen Dimensionen ist zunächst unabhängig davon, ob Prozess- oder Ergebnisindikatoren eingesetzt werden. Die Evidenzbasierung von Prozessindikatoren drückt sich darin aus, dass jeder Indikator sich auf mindestens einen patientenrelevanten Endpunkt bezieht (dies gilt auch für Indikatoren zur Indikationsstellung). Somit können sowohl Prozess- als auch Ergebnisindikatoren anhand der adressierten patientenrelevanten Endpunkte den einzelnen Dimensionen zugeordnet werden. Die Abbildung der Dimension der Sicherheit kann somit bspw. nicht nur durch die Erfassung der „Abwesenheit von unerwünschten Ereignissen“ sondern auch durch die Erfassung der „Eigenschaften von Organisationen und Systemen“ erfolgen [36].

Damit erscheint die Diskussion der Vor- und Nachteile von Prozess- und Ergebnisindikatoren für diese Betrachtung als zunächst nachgelagert – auch wenn sie grundsätzlich von hoher Bedeutung ist (insbesondere vor dem Hintergrund der Grenzen der Adjustierbarkeit von Ergebnisindikatoren).

Auf der Basis der ersten Erprobungsergebnisse des OECD-Modells zur Beurteilung der Ausgewogenheit von Indikatorensets stellen sich folgende weitergehende Forschungsfragen:

  • Welche Dimensionen können prinzipiell als geeigneter Rahmen für eine Bewertung der Ausgewogenheit und Ausrichtung von Indikatorensets angesehen werden?

  • Welcher Dimension wird die Sterblichkeit zugeordnet?

    • Wenn die Dimensionen der OECD genutzt werden, muss die Zuordnung der Mortalität geklärt werden. Dieser Endpunkt kann abhängig vom Zeitpunkt der Erfassung, dem Gesundheitszustand des Patienten und von der Dringlichkeit eines Eingriffs der Dimension „Vermeidung unerwünschter Ereignisse“ oder der Dimension „Erreichen primärer Behandlungsziele“ zugeordnet werden. Für diagnosebezogene Verfahren kann die Sterblichkeit abhängig von der betrachteten Behandlungsepisode verschiedenen Dimensionen zugeordnet werden. Möglicherweise ist es vor diesem Hintergrund eine Option, solche Indikatoren als „Sterblichkeit“ zu bezeichnen, wenn sie unerwünschte Ereignisse abbilden (Zuordnung zur Dimension „Sicherheit“) und „Überleben“, wenn sie das Erreichen von Behandlungszielen erfassen (Zuordnung zur Dimension „Effektivität“). Alternativ kann auch eine Mehrfachzuordnung von Indikatoren vorgenommen werden (ein Indikator deckt mehrere Dimensionen ab).

  • In welcher Tiefe werden die einzelnen Dimensionen durch ein Indikatorenset abgebildet?

    • Ein Indikatorenset kann ggf. einen Aspekt innerhalb einer Dimension mit einem Indikator adressieren (z. B. eine Komplikation, zugeordnet zur Dimension Sicherheit) und somit die Dimension formal abdecken. Möglicherweise erfasst ein Indikator jedoch nur einen marginalen Ausschnitt dieser Dimension (z. B. ausschließlich Verwendung eines einzelnen Indikators zu einem Teilaspekt der Antibiotikaprophylaxe bei einem bestimmten Eingriff für die Dimension der Sicherheit)

    • Es bedarf daher neben der Erfassung der Anzahl der Indikatoren für die einzelnen Dimensionen auch einer Bewertung des Umfangs und der Qualität der Abdeckung durch die Indikatoren.

    • Hierzu ist theoretisch ein Abgleich mit einem Goldstandard, einem „idealen“ oder „umfassenden“ Indikatorenset sinnvoll.

    • Hierbei können „Core outcome sets“, z. B. die Sets des International Consortium for Health Outcomes (ICHOM) oder der COMET Initiative [37] [39] und evidenz-basierte starke Leitlinienempfehlungen eine wichtige Rolle spielen, um ein solches “ideales Indikatorenset” zu entwerfen.


#

4.4 Bewertung: Eignung von Indikatorensets für bestimmte Zielsetzungen und Einsatzgebiete

Indikatorensets, die alle Dimensionen adressieren, liefern einen Blick auf ein prinzipiell umfassendes und ausgewogenes Konstrukt der Qualität zu einem bestimmten Thema. Indikatorensets, die sich ggf. auf eine Dimension konzentrieren, sind möglicherweise für eine definierte Zielsetzung der Qualitätsdarstellung ebenfalls sachgerecht und geeignet, wenn diese Dimension eine hohe Priorität darstellt.

Auch bei „umfassenden“ Indikatorensets werden zwangsläufig niemals alle Aspekte der Gesundheitsversorgung erfasst werden können. Ziel sollte jedoch sein, ein Instrumentarium zu schaffen, mit dem die Stärken und Schwächen von Indikatorensets systematisch transparent gemacht werden können.

Um bei der Bewertung der Eignung von Indikatorensets für bestimmte Zielsetzungen und Einsatzgebiete voran zu kommen, sollte daher folgender Entwicklungs- bzw. Forschungsbedarf in den Fokus genommen werden:

  • Rahmen für einheitliche Begriffsverwendung (siehe 4.2):

    • Abstimmung einer Konvention zur differenzierten Benennung der jeweiligen Einsatzgebiete

    • Abstimmung einer Konvention zur differenzierten Benennung der jeweiligen Beobachtungs-/Handlungsebenen;

  • Entwicklung von Kriterien zur Bewertung der Eignung von Indikatorensets für bestimmte Einsatzgebiete (z. B. Public Reporting, P4P);


#

4.5 „Composite Measures“

Weiterhin besteht Forschungsbedarf zur Eignung von Composite Indicators/Composite Measures/Scores/Indices (im Folgenden: „Composite Measures“).

Während Indikatorensets mehrere Indikatoren (mit jeweils einzelnen Ergebnissen) zu einem Thema nebeneinander darstellen, werden in „Composite Measures“ die Ergebnisse mehrerer einzelner Indikatoren/Kennzahlen zu einem Gesamtergebnis aggregiert.

Auch hier besteht Bedarf, ein einheitliches Begriffsverständnis herzustellen.

Die bereits langjährige Diskussion der Thematik hat international zuletzt bezüglich des PSI90-Indikatorsets im Rahmen des Value Based Purchasing (P4P) erheblich an inhaltlicher Tiefe und Relevanz gewonnen [40] [41].

Bereits einzelne Qualitätsindikatoren bilden komplexe Konstrukte der Gesundheitsversorgung „in einer Zahl“ ab (bspw. „Indikationsstellung zu einem Eingriff“). „Composite Measures“ nehmen eine noch stärkere Aggregation vor. Dies erscheint auf der einen Seite „verlockend“, da es zu einer verbesserten Übersichtlichkeit und scheinbar einfacheren Verständlichkeit führt, birgt allerdings relevante Risiken, v. a. in Bezug auf eine zu starke Aggregation im Sinne einer nicht angemessenen Vereinfachung [36] [42].

Forschungs- und Entwicklungsbedarf besteht daher bei der Bildung von solchen aggregierten Kennzahlen v. a. in Bezug auf die Möglichkeiten, Vor- und Nachteile der Aggregation verschiedener Dimensionen/Domänen (z. B. von Indikatoren zur Prozess- und Ergebnisqualität oder von Indikatoren zur Indikationsstellung und der Ergebnisqualität), in Bezug auf die Interpretierbarkeit und den Einsatz für regulierende Interventionen, wobei ein besonderes Augenmerk auf die Problematik der Gewichtung der Indikatoren innerhalb der Composite Measures gelegt werden sollte [42].

Zusammenfassend erfordert die aktuelle Situation – Weiterentwicklung in Richtung auf eine sektorenübergreifende, populationsorientierte Qualitätsbewertung mit teilweise verstärkt steuernder Intention – eine Verstärkung der Forschung zur Güte und Eignung von Indikatorensets und den darin verwendeten einzelnen Indikatoren. Die Forschung sollte eingebettet sein in ein methodisches Rahmenkonzept, in dem Konventionen zu „Einsatzgebieten“ und „Handlungs- und Beobachtungsebenen“ von Qualitätsindikatoren sowie zu „Instrumenten/Interventionen“ (d. h. zu Steuerungsinstrumenten) festgelegt werden.


#
#