Jedes Studienergebnis bezieht sich auf eine Auswahl an Probanden bzw. Patienten und
beschreibt die Ergebnisse einer Patientenstichprobe. In den seltensten Fällen können
wir wirklich alle Patienten mit einer bestimmten Diagnose untersuchen. Demnach sind
wir darauf angewiesen, von einer Auswahl (Stichprobe) auf die gesamte Patientengruppe
(Grundgesamtheit) zu schließen (Inferenz). Wenn die Auswahl einer Studie keine bestimmte
Patientengruppe repräsentiert, kann man die beschriebenen Ergebnisse nur auf ähnliche
bzw. vergleichbare Patienten übertragen [1].
Die Guten ins Töpfchen, die Schlechten ins Kröpfchen
Die Guten ins Töpfchen, die Schlechten ins Kröpfchen
Repräsentative Stichproben erreicht man am besten durch eine Auswahl per Zufallsprinzip
[2]. Denn: Die Stichprobenziehung bestimmt die Übertragbarkeit der Studienergebnisse.
Stichproben wählt man manchmal auch willkürlich aus. Die Szene aus dem Märchen von
Aschenputtel „die Guten ins Töpfchen, die Schlechten ins Kröpfchen” ist ein Beispiel
für eine willkürlich vorgenommene Auswahl. Eine Zufallsstichprobe dagegen erhebt oder
zieht man aus einer definierten Gesamtpopulation – zum Beispiel der Bevölkerung der
Bundesrepublik Deutschland. Dabei wählt man per Zufallsprinzip und nicht willkürlich
Personen aus. Beachtet man das Zufallsprinzip während der Auswahl, kann man Rückschlüsse
von dieser Stichprobe auf die Allgemeinheit ziehen – in diesem Fall auf die Gesamtbevölkerung
Deutschlands. Wenn wir beispielsweise die Rauchgewohnheiten von Ergotherapeuten und
weitere Hintergründe dazu studieren wollen, müssen wir nicht alle Ergotherapeuten
untersuchen. Es reicht hier völlig aus, eine repräsentative und bestimmte Anzahl von
zufällig ausgewählten Ergotherapeuten zu ihrem Rauchverhalten zu befragen.
Stichprobenziehungen sollen per Zufallsauswahl erfolgen
Stichprobenziehungen sollen per Zufallsauswahl erfolgen
Ein gutes Beispiel für Stichprobenziehungen sind Wahlprognosen und Hochrechnungen.
Die Präsidentschaftswahl der Vereinigten Staaten von 1936 ging zum Beispiel durch
eine methodisch mangelhafte Stichprobenziehung in die Geschichte ein. Im Vorfeld dieser
Wahl startete die Zeitschrift „Literary Digest” eine Umfrage unter etwa zehn Millionen
Lesern und potenziellen Lesern. Etwa 2,3 Millionen antworteten darauf. Fast 8 Millionen
antworteten nicht, das Ergebnis war also durch die freiwillige Teilnahme verzerrt.
Daraufhin führte die Wahlprognose den Präsidentschaftskandidaten und Republikaner
Alfred Landon als klaren Favoriten mit circa 60 % ins Feld. Fälschlicherweise, denn
die Wahl gewann mit 61 % der Demokrat Franklin Roosevelt – klar vor Alfred Landon
mit 37 %. Dieses Beispiel zeigt, dass das Ziehen von Stichproben nicht willkürlich,
sondern per Zufallsauswahl erfolgen sollte. Die Zeitschrift wurde vor allem von Republikanern
gelesen, und tatsächlich führte die katastrophale Umfrage letztlich dazu, dass die
Zeitschrift wenige Monate später verschwand. George Gallup führte zeitgleich eine
repräsentative Umfrage mit der Zufallsauswahl einer Stichprobe von 50.000 US-Bürgern
durch und konnte das Wahlergebnis tatsächlich korrekt vorhersagen.
Viel hilft nicht immer viel
Viel hilft nicht immer viel
Das Beispiel der Zeitschrift „Literary Digest” zeigt, dass der Spruch „viel hilft
viel” keineswegs zutreffend ist. Nach modernen statistischen Berechnungen der Stichprobengröße
– auch Stichprobenumfang genannt – hätte wohl die Befragung von etwa 16.000 zufällig
ausgewählten US-Bürger eine ausreichend zuverlässige Vorhersage des Wahlergebnisses
erbracht.
Stichprobenartig Daten zu erheben unterscheidet sich von einer Totalerhebung, welche
auch Zensus genannt wird. Ein Beispiel für einen Zensus sind Bevölkerungszählungen
oder spezialisierte Register zu bestimmten Erkrankungen, in welchen alle Betroffenen
registriert sind.