Wennerholm UB et al. Induction of labour at 41 weeks versus expectant management and
induction of labour at 42 weeks (SWEdish Post-term Induction Study, SWEPIS): multicentre,
open label, randomised, superiority trial. BMJ 2019; 367: l6131
Zusammenfassung
Die hier zusammengefasste randomisierte kontrollierte Studie wurde vorzeitig beendet.
Dies wirft viele Fragen auf. Daher gehen wir in unserem kritischen Kommentar stark
auf die Planungsphase dieser Studie ein und besprechen das Outcome, das scheinbar
den Abbruch notwendig werden ließ.
Ziele
Ziel der 16 Forscherinnen und Forscher, mehrheitlich aus dem Karolinska Institut in
Stockholm, Schweden, war es, die bislang in Schweden übliche Routine bei Terminüberschreitung
(Einleitung 14-15 Tage nach errechnetem Termin) mit einer etwas früheren Einleitung
(7-8 Tage nach errechnetem Termin) zu vergleichen und dabei sowohl kindliches als
auch mütterliches Outcome zu berücksichtigen [1].
Methodik
Vor Beginn der SWEPIS-Studie (SWEdish Post-term Induction Study) veröffentlichte das
Forschungsteam im März 2015 das zuvor genehmigte Studienprotokoll [2]. Durch die Vorabveröffentlichung sollte verhindert werden, dass Änderungen während
des Forschungszeitraums nach Belieben der Zuständigen erfolgen konnten – und damit
das Ergebnis bewusst beeinflussbar wäre. Die Forschenden legten hierbei als primäres
Outcome eine Kombination unter anderem folgender Befunde (composite perinatal outcome)
fest.
-
Totgeburt
-
Tod des Kindes postnatal bis zum Alter von 27 Lebenstagen
-
5-Minuten Apgar-Wert < 7
-
pH-Wert in der Nabelschnurarterie < 7
-
hypoxisch-ischämische Enzephalo-pathie Grad 1-3
-
intrakranielle Blutung
-
Krampfanfälle
-
Mekonium-Aspirations-Syndrom
-
mechanische Beatmung innerhalb von 72 Stunden nach der Geburt
-
Plexus-Brachialis-Verletzung im direkten Zusammenhang mit der Geburt.
Finanzielle Unterstützung kam von der Foundation of the Health and Medical care committee
of the Region of Vastra Gotaland, Sweden, und vom Health Technology Centre der Schwedischen
Regierung. Das Ethikvotum des Regional Ethics Board in Göteborg fiel positiv aus [2]. Zur Überwachung der Studie wurde ein unabhängiges Gremium (Data and Safety Monitoring
Board) aus einem Statistiker (Hans Wedel) und zwei geburtshilflich Tätigen mit langer
Berufserfahrung (Lars-Åke Mattson als Geburtshelfer und Elisabeth Jangsten als Hebamme)
gebildet. Die Forschungsleitung berichtete alle Todesfälle und andere schwerwiegenden
Ereignisse sofort nach Auftreten bzw. Meldung aus den Kliniken an diese drei Personen.
Im Vorfeld berechnete das Forschungsteam, wie viele Teilnehmerinnen benötigt werden,
damit eine Reduktion des primären Outcomes um ein Drittel darstellbar ist. Anhand
der Daten aller Schwangeren in der Schwangerschaftswoche 41 + 3 in der Region Skåne
in den Jahren 2000 bis 2010 schätzten die Forscherinnen und Forscher das Auftreten
des primären Outcomes zu diesem Zeitpunkt auf 2,74 % aller Kinder. Obwohl Totgeburt
und Tod des Kindes postnatal bis zum Alter von 27 Lebenstagen zwei verschiedene Komponenten
des Outcomes sind, gibt das Forscherteam nur den gemeinsamen Wert von 0,53 % für die
Region Skåne an [2]. Zur Totgeburtenrate fehlt daher der Vergleichswert. Als Signifikanzniveau für den
geplanten Vergleich legten die Forschenden den üblichen 0,05 Wert sowie eine Power
von 80 % fest und nahmen eine Dropout-Rate von 10 % aller Teilnehmerinnen an. Mit
diesen Vorgaben errechneten sie eine Stichprobengröße von 10.038 Teilnehmerinnen gleichmäßig
verteilt auf beide Gruppen und legten vorab eine Zwischenauswertung aller bis dahin
gewonnenen Daten für den Zeitpunkt fest, an dem Daten von 50 % der angestrebten Geburtenanzahl
vorliegen.
Ab September 2015 baten die Forschenden Low-Risk-Schwangere in 14 Kliniken mit angeschlossenen
Zentren für Schwangerenvorsorge um Teilnahme an ihrer Studie. Die Einschlusskriterien
der Teilnehmerinnen waren nicht einheitlich [1], auch wenn die Forschenden diesen Umstand in ihrer Publikation nicht als kritisch
hervorheben: Der Geburtstermin wurde bei der Ultraschalluntersuchung entweder im ersten
oder zweiten Trimester festgelegt. Die abwartende Betreuung verlief nach der jeweiligen
Routine der 5 universitären und 9 ländlichen Zentren für Schwangerenbetreuung. Eine
Kontrolluntersuchung erfolgte bei allen Schwangeren eine Woche nach dem ET, im Zeitraum
von drei Tagen zwischen 40 SSW + 6 bis 41 SSW + 1. Dieser Untersuchungstermin war
auch gleichzeitig der Zeitpunkt zur Randomisierung. Die allermeisten Frauen aus der
Region Stockholm haben während dieser Untersuchung auch eine Ultraschalluntersuchung
bei einer Hebamme oder einer ärztlichen Fachperson erhalten. Frauen mit einem auffälligen
Befund schlossen die Forschenden von der Studienteilnahme aus. Obwohl die Ultraschalluntersuchung
im Studienprotokoll vorgesehen war, war dieses Angebot in den 9 ländlichen Zentren
nicht immer gegeben. Hier bekamen die interessierten Teilnehmerinnen von der zuständigen
Forschungshebamme die jeweils übliche Routineuntersuchung mit Kontrolle des Blutdrucks,
des Symphysen-Fundus-Abstandes und der kindlichen Herztöne (Dopton). Ein Nachlassen
der kindlichen Bewegungen, Verdacht auf Wachstumsretardierung oder Präeklampsie erforderte
Handlungsbedarf und bedeutete einen Ausschluss dieser Frauen von der Teilnahme an
der Studie. Bei allen anderen Frauen wurden die Geburten nach dem Zufallsprinzip entweder
innerhalb 24 Stunden und damit 7-8 Tage nach errechnetem Termin (Studiengruppe) oder
aber erst etwa eine Woche später, 14-15 Tage nach errechnetem Termin (Kontrollgruppe)
eingeleitet.
Ergebnisse
Von den insgesamt 12.554 Frauen, die die Voraussetzungen für eine Teilnahme erfüllten,
lehnten 9.792 die Studienteilnahme ab. Nur 2.760 Frauen mit einer unkomplizierten
Einlingsschwangerschaft (22 %), und damit weniger als die über 30 %, die laut Studienprotokoll
erwartet wurden, nahmen in den drei Jahren bis zum Abbruch Ende September 2018 an
der Studie teil und wurden für eines der beiden Verfahren randomisiert. Die Gruppe
mit der früheren Einleitung (7-8 Tage nach errechnetem Termin) hatte eine Gruppengröße
von 1.381 Teilnehmerinnen und diejenige mit der Routinebehandlung eine Größe mit ähnlich
vielen Teilnehmerinnen, 1.379, erreicht. Die schleppende Rekrutierung wird in einer
Antwort der Forschenden im offenen Reviewprozess des Artikels mit der Überzeugung
der Schwangeren beziehungsweise der Behandelnden begründet, dass Abwarten die bessere
Option sei [3]. Relativ wenige Teilnehmerinnen (3,5 % der Studiengruppe und 2 % der Kontrollgruppe)
haben nicht die Behandlung erhalten, die eigentlich für ihre Gruppe vorgesehen war.
Entweder waren keine Kapazitäten in der betreffenden Klinik für eine Einleitung zum
frühen Termin vorhanden oder die Frauen wollten eine Einleitung früher als geplant.
76 Geburten verliefen demnach nicht wie geplant, werden aber nach dem Prinzip „intention-to-treat“
in ihrer ursprünglichen Gruppe mit ausgewertet.
Von den Ergebnissen seien hier speziell diejenigen präsentiert, die zum Abbruch der
Studie am 2. Oktober 2018 führten: Im Gegensatz zur Studiengruppe (7-8 Tage nach ET),
in der kein kindlicher Todesfall verzeichnet wurde, traten 6 Fälle in der Kontrollgruppe
(14-15 Tage nach ET) auf. Auch wenn die kindliche Sterblichkeit als Einzeloutcome
zu den sekundären Outcomes zählt (und damit die Gruppengröße nicht daraufhin berechnet
ist, einen signifikanten Unterschied in der kindlichen Sterblichkeit aufzeigen zu
können), konnte es das Data and Safety Monitoring Board ethisch nicht vertreten, die
Studie weiter fortzuführen („it was not considered ethical to continue the study“).
Schlussfolgerung der Autorinnen / Autoren
Die Forscherinnen und Forscher sehen ihre Ergebnisse trotz des Studienabbruchs als
verwertbar an und schlussfolgern: Auch wenn die Ergebnisse mit Vorsicht zu bewerten
sind, sollte Schwangeren eine Einleitung mit 41 SSW + 0 Tage oder früher angeboten
werden.
Kommentar
Die Entscheidung, die Studie aus den vom Forscherteam genannten Gründen vorzeitig
abzubrechen, ist insofern irritierend, als bis zum Abbruch die getestete Intervention
gegenüber dem üblichen Vorgehen einen Benefit aufzeigte und damit nicht zu erwarten
war, dass sich die perinatale Mortalität durch den Abbruch verbessern ließe. Es ist
zudem bekannt, dass vorzeitige Studienabbrüche wegen eines Benefits den Nutzen einer
Intervention tendenziell größer erscheinen lassen, als dies mit einer Durchführung
der Untersuchung bis zur geplanten Stichprobengröße zu beweisen wäre [4]. Somit wurde hier ein Ergebnis angenommen (und als Empfehlung auch veröffentlicht),
das sich bei einer Fortführung der Studie vielleicht gar nicht bestätigt hätte. Diese
Kritik wird in einem Leserbrief von Ole Olsen aus dem Department für Public Health
an der Universität von Kopenhagen vorgebracht [5].
Abgesehen von diesem Einwand lohnt es sich, die zum Abbruch der Studie führenden Todesfälle
näher zu betrachten: Es handelt sich um 5 Totgeburten und einen Tod in der frühen
Neugeborenenperiode (innerhalb der ersten 7 Lebenstage). Somit errechnet sich eine
kindliche Todesrate von 0,4 % (6 / 1.379). Diese Rate übersteigt demnach nicht die
Rate von 0,53 %, die als Referenzwert in der Region Skåne ermittelt wurde. Dennoch
scheint die Meldung das dreiköpfige Gremium so sehr alarmiert zu haben, dass es nicht
die vorgesehene Zwischenauswertung (bei Erreichen von 50 Prozent der 10.038 erforderlichen
Geburten) abwarten, sondern bereits nach Erhebung von nur 27,5 % der erforderlichen
Geburten die Entscheidung zum Abbruch herbeiführen wollte.
Dem Review-Verfahren zu diesem Artikel kann entnommen werden, dass die Fälle erst
nach der Entscheidung statistisch ausgewertet wurden. Das eigentlich zu untersuchende
primäre, zusammengesetzte Outcome zwischen der Studiengruppe (Einleitung 7-8 Tage
nach errechnetem Termin) mit 33 Fällen auf 1.381 Kinder (2,4 %) und der Gruppe mit
Routinebehandlung mit 31 Fällen auf 1.379 Kinder (2,2 %) unterscheidet sich statistisch
gesehen nicht, wie es das Relative Risiko von 1,06 mit einem 95 %-Konfidenzintervall
von 0,65 – 1,73 zeigt. Beide Prozentangaben liegen niedriger als die in der Region
Skåne ermittelten Werte von 2,74 % aller Kinder. Allerdings ist diese Berechnung nicht
zuverlässig, da sie erst bei der Auswertung der 10.038 erforderlichen Geburten zuverlässige
Aussagekraft gewonnen hätte.
Die Ursachen für die Todesfälle scheinen vielfältig: Ein Kind verstarb wohl intrauterin
kurz nach der Aufnahme in die Klinik. Das Obduktionsergebnis zeigte einen (nicht lebensbedrohlichen)
Herzfehler. Auch bei den anderen vier Totgeburten ließen sich keine sicheren Todesursachen
nachweisen. Eines der Kinder war für sein Gestationsalter zu klein. Das postpartal
verstorbene Kind hatte eine hypoxisch-ischämische Enzephalopathie. Alle 6 Todesfälle
ereigneten sich bei Erstgebärenden, die nicht in der Stockholmer Region versorgt wurden
und demnach eine andere, eventuell weniger ausführliche Schwangerenvorsorge erhielten
als in dieser Region. Es bleibt unklar, in welcher Schwangerschaftswoche die betroffenen
6 Schwangeren bei Geburt waren, denn nur der Durchschnitt von 292 Tagen und das Minimum
von 289 sowie das Maximum von 294 Tagen wird für die gesamte Kontrollgruppe angegeben.
Es steht damit jedoch fest, dass keine Schwangere aus der gesamten Stichprobe den
Zustand einer eigentlichen Übertragung erreicht hat. Auch der Zeitpunkt des Wehenbeginns
(mit oder ohne Einleitung) und der Geburtsmodus werden für diese 6 Geburten nicht
dargestellt. In der Gruppe mit Routinebehandlung hatte die Mehrheit, 66,7 % der Frauen
(920 von 1.379), einen spontanen Wehenbeginn, gegenüber 14,1 % der Frauen mit der
frühen Einleitung. Eine vaginale Geburt ohne Einsatz von Instrumenten erlebten in
beiden Gruppen gleich viele Frauen: etwa 83 %.
Der Peer-Review-Prozess des am 19. Juli 2019 beim British Medical Journal eingereichten
Artikels ist offen und einsehbar [3]. Auf den ersten Entwurf hin, in dem die Forschenden den Abbruch der Studie noch
mit dem statistisch signifikanten Unterschied in der perinatalen Mortalität zwischen
den Gruppen begründen, schlägt der erste Reviewer als Erklärung stattdessen die Formulierung
„Abbruch aus Sicherheitsgründen“ vor. Die zweite Reviewerin, Philippa Middleton, sieht
keine Formfehler und äußert sich nur positiv über die Studie. An dieser Stelle sei
bemerkt, dass Middleton die Hauptautorin des Cochrane Reviews „Induction of labour
at or beyond 37 weeks’ gestation“ ist.
Interessant gestaltet sich die Debatte, die auf der Leserbriefseite der Zeitschrift
zu dieser Studie entbrennt [3]. Es steht der Vorwurf im Raum, dass die gesamte Studie jetzt nicht mehr nutzbar
ist, da man sich nicht an die vorab festgelegte Vorgehensweise gehalten hat. Das mit
dieser Kritik konfrontierte Forschungsteam entgegnete mit dem kaum mehr anfechtbaren
Argument, welches der erste Reviewer als Erklärung für den Abbruch vorgeschlagen hatte:
Die Studie wurde aus Sicherheitsgründen abgebrochen. Für diese Einschätzung gebe es
keine statistische Grundlage und dieser Umstand hätte auch nicht im Studienprotokoll
vorab festgelegt werden müssen. So der aktuelle Stand der Debatte.
Abgesehen von der Tatsache, dass das Outcome zum Abbruchzeitpunkt noch gar nicht schlechter
war als die Anhaltswerte aus der Vergleichsregion Skåne und dass der Studienabbruch
im Artikel zuerst nicht explizit mit der Sicherheit der Ungeborenen begründet wurde,
ist es mehr als fraglich, ob die Studienzwischenergebnisse von dieser renommierten
Zeitschrift in einer Form, als wäre es eine normale, wenn auch verkürzte Studie, hätten
veröffentlicht werden dürfen.
Unser Hauptargument gegen die Schlussfolgerungen aus dieser abgebrochenen Studie ist
jedoch das Folgende: Wir wissen nicht, wie viele andere Ungeborene gestorben sind,
bevor ihre Mütter randomisiert wurden. Bei wie vielen Schwangeren ist beim Randomisierungstermin
ein intrauteriner Fruchttod festgestellt worden und damit eine Aufnahme in die Studie
verhindert worden? Alle für die Studiengruppe randomisierten Frauen mit einer sofortigen
Einleitung (oft am selben Tag, spätestens am Tag darauf) hatten nur wenige Stunden
Zeit, von einem intrauterinen Todesfall getroffen zu werden – daher ist es nicht erstaunlich,
dass keine Totgeburt verzeichnet wurde. Da es in der anderen Gruppe etwa eine Woche
später zur Einleitung oder zum spontanen Geburtsbeginn kam und damit eine größere
Zeitspanne für eine mögliche Totgeburt vorlag, wäre es nur logisch zu erheben, wie
viele Totgeburten sich eine Woche vor der Randomisierung bei allen Frauen ereignet haben. Wenn wir aus diesem Grund die Rate der Totgeburten nicht vergleichen
können und nur die nach der Geburt verstorbenen Kinder anschauen, hätte das Gremium
eine Differenz von nur einem Todesfall sicher nicht als Alarmzeichen gewertet.
Betroffene (Schwangere oder Mütter) wurden in den Planungsprozess dieser Studie nicht
involviert. Möglicherweise wäre ihnen dieser ungleiche Informationsgehalt der Daten
aufgefallen. Umso bedauerlicher ist es, dass dieses Studienfragment als vollwertiger
Datensatz in die aktualisierte Fassung des Cochrane Reviews „Induction of labour at
or beyond 37 weeks’ gestation“ eingeflossen ist, Hauptautorin: Philippa Middleton.