physioscience 2013; 9(3): 89-90
DOI: 10.1055/s-0033-1350274
Editorial
© Georg Thieme Verlag KG Stuttgart · New York

Systematische Übersichtsarbeiten und Metaanalysen – Segen oder Fluch?

K. Lüdtke
Further Information

Publication History

Publication Date:
04 September 2013 (online)

Systematische Übersichtsarbeiten und Metaanalysen gelten als die höchste Stufe der Evidenz [1]. In ihnen werden alle zum Zeitpunkt der Literaturrecherche verfügbaren Studien nach vorgegebenen Kriterien zusammengefasst und ein gemeinsames Resultat formuliert [3]. Die Autoren von systematischen Übersichtsarbeiten ersparen damit dem Leser, nach Studien zu recherchieren, sie zu lesen, deren Qualität zu beurteilen, die wichtigsten Ergebnisse zu extrahieren und diese mit den Ergebnissen anderer Studien zu vergleichen. In einer Metaanalyse werden positive und negative Ergebnisse zusammengefasst, und man erhält ein kombiniertes Ergebnis aus allen Studien, das richtungweisend für z. B. den Effekt einer Intervention sein kann [3].

Für die Erstellung von systematischen Übersichtsarbeiten gibt es sehr konkrete Handlungsanweisungen, wie z. B. das Cochrane Handbook [3] und das PRISMA Statement [7]. Für den Leser einer systematischen Literaturübersicht stehen ebenfalls eine Reihe von Instrumenten zur Verfügung, z. B. Assessing the Methodological Quality of Systematic Reviews (AMSTAR; [9]) oder Critical Appraisal Skills Programme (CASP; [2]).

Aber selbst wenn alle Qualitätsaspekte berücksichtigt wurden, wenn unter anderem mindestens 2 Personen eine Literaturrecherche in allen relevanten Datenbanken, Referenzlisten, Inhaltsverzeichnissen, Konferenz-Abstracts und der grauen Literatur durchführten, wenn mindestens 2 Personen die Qualität der eingeschlossenen Studien beurteilten und die wichtigsten Inhalte extrahierten, sind die Ergebnisse nie wirklich objektiv.

Die Beurteilung der methodischen Qualität der eingeschlossenen Studien ist einer der wichtigsten Qualitätsaspekte einer systematischen Literaturübersicht. Leider wird diese nur in etwas über der Hälfte von systematischen Reviews durchgeführt, wie MacDonald et al. [5] am Beispiel der urologischen Literatur aufdeckten.

Allerdings kann auch die Qualitätsbeurteilung Subjektivität einführen, da Rubriken wie „Other sources of bias“ im Cochrane Instrument [3] nicht immer so einheitlich zu beantworten sind wie im Falle der Studie von Sharma et al. [8], die in der Rubrik „gelesen & kommentiert“ in diesem Heft besprochen wird.

Die Übereinstimmung der Beurteiler wird anhand des Kappa-Wertes dargestellt. Die systematische Literaturübersicht von Klein et al. in diesem Heft zeigt, dass sich zwar eine gute, aber keine perfekte Übereinstimmung erzielen lässt. Insbesondere, wenn Studien eingeschlossen werden, die keine RCTs sind (z. B. Fallstudien, Cross-over-Studien), wird die Beurteilung oft ungenau und die Übereinstimmung zwischen den Bewertern schlechter.

Die Metaanalyse soll durch das Poolen von Daten dazu führen, dass aus mehreren kleinen Studien eine große entsteht, die dadurch eine höhere Validität aufweist. Dem Autor einer Metaanalyse liegen jedoch nicht die Rohdatensätze der einzelnen Teilnehmer einer Studie vor, sondern bestenfalls die Mittelwerte mit ihren Standardabweichungen (und selbst die müssen meist erst bei den Autoren angefordert werden, da oft manipulierte Daten berichtet werden, die durch Normalisierung, Prozentangaben etc. oft keinen Rückschluss auf die absoluten Zahlen zulassen; aber schlechtes Reporting ist ein anderes Thema). Werden also nur Studien mit sehr kleinen Teilnehmerzahlen eingeschlossen, deren Ergebnisse naturgemäß sehr anfällig für Ausreißer sind [11] und legen wir außerdem zugrunde, dass es nach wie vor schwierig ist, Negativstudien zu veröffentlichen – also ein „Publication bias“ vorliegt, so wird das Ergebnis der Metaanalyse sehr viel positiver ausfallen als es der Realität entspricht [6].

Manche Autoren argumentieren daher, dass kleinere Studien aus Metaanalysen ausgeschlossen werden sollten [4] [10], aber oft sind diese in den therapeutischen Disziplinen die einzig vorhandene Evidenz. Publication bias und die Heterogenität der eingeschlossenen Studien lassen sich anhand eines sogenannten „Funnel plots“ schätzen [12], und Konfidenzintervalle geben zudem an, wie sehr die eingeschlossenen Studien variieren.

Weniger offensichtlich ist die Heterogenität der Patientenkohorten innerhalb der eingeschlossenen Studien. In diesem Heft wird unter der Rubrik „gelesen & kommentiert“ eine Arbeit vorgestellt, die zeigt, wie unklar die Ein- und Ausschlusskriterien der meisten Studien sind – in diesem Fall bei nicht spezifischen Rückenschmerzen. Es ist also unklar, ob sich die Ergebnisse der Metaanalyse überhaupt auf das eigene Patientenklientel übertragen lassen, weil Studien eventuell ganz anders charakterisierte Patientenkohorten untersuchen.

Systematische Literaturübersichten und Metaanalysen sind demnach eine unverzichtbare Erleichterung für evidenzbasiertes Handeln, sollten jedoch immer eine Qualitätsbeurteilung der eingeschlossenen Studien beinhalten und ein Minimum an methodischen Voraussetzungen erfüllen.