Deutsche Zeitschrift für Akupunktur 2001; 44(3): 208-209
DOI: 10.1055/s-2001-17818
Forum

Karl F. Haug Verlag in MVH Medizinverlage Heidelberg GmbH & Co. KG

Bemerkungen zum Äquivalenztest

Aus Wissenschaft und ForschungRemarks Concerning the Equivalence TestBerthold Schneider
  • Institut für Biometrie, Med. Hochschule Hannover
Further Information

Publication History

Publication Date:
15 October 2001 (online)

In der Arbeit von Fink, Künsebeck und Wippermann werden in den Abb. 1 und 2 die Mittelwerte und Standardabweichungen der Visuellen Analogskala für die Schmerzintensität und des Funktionsindex nach Lequesne zum Zeitpunkt vor Behandlung (Baseline F0) sowie zu den follow up-Terminen F1 (2 Wochen nach Behandlung), F2 (6 Wochen nach Behandlung) und F3 (6 Monate nach Behandlung) für die beiden Behandlungsgruppen grafisch dargestellt. Für den 1. und 2. follow up Termin wurden für jede Behandlungsgruppe die Unterschiede zum Ausgangswert mit dem verbundenen t-Test getestet. Dabei ergab sich für beide Behandlungsgruppen jeweils ein signifikant niedrigerer Mittelwert der Schmerzskala und des Lequesne Index gegenüber dem Ausgangsbefund. Der Unterschied zwischen beiden Behandlungsgruppen wurde beim ersten und zweiten follow up Termin mit dem t-Test für unverbundene Stichproben getestet. Dabei ergaben sich keine signifikanten Unterschiede. Allerdings ist beim zweiten follow up Termin der Mittelwert beider Variablen in der Kontrollgruppe größer (höhere Schmerzintensität und schlechterer Funktionsindex) als in der Verumgruppe.

Die Frage, welches Ausmaß für diesen Unterschied in der Grundgesamtheit noch angenommen werden kann, ist mit einem Äquivalenztest bzw. mit einem Test auf Nicht-Unterlegenheit (Non-inferiority) der Kontrollbehandlung zu beantworten. Dabei ist für die Differenz der Erwartungswerte (Mittelwerte in der Grundgesamtheit) zwischen Kontroll- und Verumgruppe ein noch zulässiger Betrag Δ vorzugeben. Es wird dann mit einem geeigneten Testverfahren geprüft, ob zu einer vorgegebenen Irrtumswahrscheinlichkeit α (z.B. 5 %) die Nullhypothese, dass der Erwartungswert in der Kontrollgruppe mindestens um den Betrag Δ größer ist als der Erwartungswert in der Verumgruppe, verworfen werden kann. Kann diese Hypothese nicht verworfen werden, dann kann die Nicht-Unterlegenheit mit der vorgegebenen Irrtumswahrscheinlichkeit angenommen werden. Der Test kann mit einem einseitigen unteren Konfidenzbereich zur Konfidenzwahrscheinlichkeit 1-α (z.B. 95 %) für die Differenz des Erwartungswertes der Kontroll- zur Verumgruppe durchgeführt werden. Überdeckt dieser Bereich den Wert Δ, dann wird die Nicht-Unterlegenheit der Kontrollbehandlung angenommen, sonst (wenn die obere Grenze des Bereichs kleiner als Δ ist) abgelehnt.

In der Arbeit wurde dieser Test nicht durchgeführt. Es kann daher nur ausgesagt werden, dass zwar beim zweiten follow up-Termin der Mittelwert der Schmerzskala und des Lequesne Index in der Verumgruppe kleiner als in der Kontrollgruppe ist, der Unterschied aber zum Niveau 5 % nicht signifikant ist (d.h., bei dem beobachteten Unterschied kann die Nullhypothese, dass die Erwartungswerte in beiden Gruppen gleich sind, auf dem Niveau 5 % nicht abgelehnt werden). Über das Ausmaß des Unterschieds kann nichts ausgesagt werden. Bemerkenswert ist, dass (nach Abb. 3) der mittlere Score der Lebensqualität bereits bei der Baseline-Untersuchung in der Verumgruppe größer als in der Kontrollgruppe ist. Diese Differenz verstärkt sich bei den Nachuntersuchungen. Nach den Angaben in Abb. 3 ist bei der ersten Nachuntersuchung der Unterschied nicht signifikant. Für die zweite Nachuntersuchung enthält Abb. 3 keine Signifikanzangabe. Es könnte hier eine signifikante Überlegenheit der Verumgruppe bestehen.

Prof. em. Dr. Berthold Schneider

Institut für Biometrie, Med. Hochschule Hannover

Carl-Neuberg-Str. 1

D-30625 Hannover

    >