Einleitung
Einleitung
Im Zuge der Stichprobenplanung für die Hauptphase eines bundesweiten Kinder- und Jugendgesundheitssurveys
wurden in einem Pretest zwei Varianten der Stichprobenrekrutierung überprüft. Zur
Auswahl standen die Ziehung einer Einwohnermelderegisterstichprobe und die einer Klumpenstichprobe
von Schulen bzw. Schulklassen für die Altersgruppe 11 bis 15 Jahre.
Bei der Entscheidung, welches der beiden Stichprobendesigns - Einwohnermelderegister
oder Schule - in der Hauptphase des Kinder- und Jugendgesundheitssurveys für den Altersbereich
der 11- bis 15-jährigen Kinder und Jugendlichen zum Einsatz kommen soll, sind verschiedene
Kriterien zu berücksichtigen. Diese betreffen die Kosteneffizienz der Varianten, den
Informationsbedarf und die Komplexität bei der Stichprobenplanung, die Ausschöpfungsquoten,
die Höhe der Unterschiede zwischen Teilnehmer und Nicht-Teilnehmer und damit der Validität
der Ergebnisse sowie die Höhe des Stichprobenfehlers und die daraus resultierende
Präzision der erhobenen Daten.
Nachfolgend werden das Stichprobendesign des Pretests sowie ausgewählte Ergebnisse
aus dem Vergleich der beiden Stichprobenziehungsvarianten dargestellt. Die Grundgesamtheit
(Zielpopulation) des Pretests umfasste alle Kinder und Jugendlichen im Alter zwischen
0 und 18 Jahren, die in den vier ausgesuchten Standorten Berlin-Steglitz, Berlin-Friedrichshain,
Neuruppin (Brandenburg) und Wesendorf (Niedersachsen) lebten. Ausgeschlossen waren
dabei Kinder und Jugendliche in Einrichtungen wie Krankenhäusern sowie Heil- und Pflegeanstalten.
Stichprobendesign und Zusammensetzung der Teilnehmergruppe
Stichprobendesign und Zusammensetzung der Teilnehmergruppe
Methode A: Einwohnermelderegisterstichprobe
Methode A folgt den Prinzipien eines geschichteten Random-Designs mit folgenden Auswahlstufen:
In jedem der vier Sample Points wurden die Stichprobeneinheiten zuerst nach dem Alter
stratifiziert. Über die Einwohnermeldeämter wurden dann aus jeder Schicht (Strata),
d. h. für die einzelnen Jahrgänge 0 bis 17, die gleiche Anzahl von Personenadressen
zufällig gezogen.
Die Ziehung der Stichprobe erfolgte hierbei nach einem mathematischen Zufallsverfahren
(systematische Zufallsauswahl mit Startzahl und vorgegebenem Intervall) aus den Adressdateien
der Einwohnermeldeämter. Insgesamt wurden 2479 Kinder und Jugendliche zu einer Teilnahme
eingeladen. In den 32 vorgesehenen Untersuchungswochen wurden schließlich 1235 über
die Einwohnermelderegister rekrutierte Probanden untersucht.
Methode B: Schulen-Stichprobe für den Altersbereich 11 bis 15 Jahre
Methode B folgt den Prinzipien eines geschichteten Random-Cluster-Designs. Das Stichprobendesign
ist bei dieser Variante eine Kombination aus einem geschichteten Random-Design und
einem Cluster-Design für das Alter 11 bis 15 Jahre mit folgenden Auswahlstufen:
-
Die Schulen wurden in den einzelnen Sample Points nach Schultyp geschichtet. Aus jeder
Schicht wurde eine Schule zufällig ausgesucht.
-
In jeder der gezogenen Schulen wurde aus einer bestimmten Klassenstufe eine Klasse
(Cluster) zufällig gezogen. Alle Schüler der ausgewählten Klassen bilden die Bruttostichprobe.
-
Da die geplante Anzahl der zu untersuchenden Kinder im Pretest für Variante B (Schulstichprobe)
auf maximal 120 pro Sample Point begrenzt war, konnten alle möglichen Kombinationen
von Schultyp und Klassenstufe nicht in jedem einzelnen Sample Point realisiert werden.
Damit jede mögliche Kombination aus Schultyp und Klassenstufe im Pretest einmal vorkommt,
waren diese über alle vier Sample Points zu verteilen. Mithilfe eines einfachen Computerprogramms
wurden die möglichen Kombinationen in vier Gruppen eingeteilt und den vier Sample
Points zufällig zugeordnet.
Tab. 1 zeigt an, wie der Zusammenhang zwischen herangezogenen Klassenstufen und Verteilung
der Brutto-Probanden auf die einzelnen Altersjahrgänge aussieht.
Tab. 1 Zusammenhang zwischen Klassenstufen und realisierter Bruttostichprobe
Alter (in Jahren) |
Klassenstufe |
5 |
6 |
7 |
8 |
9 |
10 |
gesamt |
11 |
78 % |
40 % |
|
|
|
|
15,5 % |
12 |
20 % |
58 % |
15 % |
|
|
|
18,6 % |
13 |
2 % |
3 % |
71 % |
23 % |
|
|
19,9 % |
14 |
|
|
12 % |
51 % |
7 % |
|
15,3 % |
15 |
|
|
1 % |
20 % |
76 % |
21 % |
21,4 % |
>15 |
|
|
1 % |
7 % |
17 % |
79 % |
9,4 % |
Gesamtanzahl brutto
|
40
|
134
|
106
|
123
|
111
|
29
|
543
|
Insgesamt wurden in den Schulen aus einer Bruttostichprobe von 543 Probanden 395 Jugendliche
im Alter von 11 bis 17 Jahren untersucht und befragt. Nur 355 dieser Probanden lagen
in dem vorgesehenen Altersbereich von 11 bis 15 Jahren.
In Tab. 1 ist zu erkennen, dass durch das Heranziehen ganzer Klassen die Verteilung der realisierten
Nettostichprobe über die einzelnen Altersjahrgänge nicht nur von der Ausschöpfung,
sondern auch von der altersspezifischen Besetzung der ausgesuchten Klassen zum Zeitpunkt
der Untersuchung abhängt. Nur wenn diese altersspezifische Besetzung der Klassen zum
Zeitpunkt der Untersuchung in der jeweiligen Schule am Anfang der Hauptphase bekannt
wäre, ist auch eine gesicherte Stichprobenplanung im Voraus möglich. Da jedoch am
Anfang der Hauptphase für die dreijährige Laufzeit der Feldarbeit die benötigte Information
nicht vorhanden sein kann, ist eine Stichprobenplanung nicht ohne weiteres machbar.
Die fehlende rechtzeitige Information und die Komplexität der Stichprobenplanung sind
ein erheblicher Nachteil der Schulvariante.
Teilnehmerresponse im Pretest
Teilnehmerresponse im Pretest
Variante A: Einwohnermelderegisterstichprobe
Insgesamt waren 290 von den 2479 eingeladenen Probanden (11,7 %) als qualitätsneutrale
Ausfälle einzustufen. Für die Einstufung von gezogenen Kindern und Jugendlichen als
qualitätsneutrale Ausfälle wurde im Pretest eine ähnlich restriktive Definition wie
beim Bundes-Gesundheitssurvey für Erwachsene ausgewählt. Demnach wurden als neutrale
Ausfälle solche Fälle aus der Bruttostichprobe herausgenommen, bei denen Folgendes
zutraf:
-
Proband unbekannt/Adresse falsch
-
Wohnung, in der das Kind hauptsächlich lebt, liegt außerhalb des Points
-
Proband verstorben
-
Verständigung mit Proband bzw. dessen Eltern aufgrund von Sprachproblemen unmöglich
-
Proband verzogen bzw. wohnt nicht (mehr) im Haushalt
-
Proband ist schon 18 Jahre alt
-
Proband ist doppelt gezogen, z. B. auch schon in der Schulvariante.
Abb. 1 Zusammensetzung der qualitätsneutralen Ausfälle im Pretest.
Der Anteil der einzelnen Gründe bei der Bestimmung der qualitätsneutralen Ausfälle
ist in Abb. 1 abzulesen. Den größten Anteil machten Probanden/Familien aus, die entweder unter
der vorliegenden Adresse unbekannt oder zwischenzeitlich verzogen waren. Auch aus
anderen Studien ist bekannt, dass die Register der Einwohnermeldeämter nicht den aktuellsten
Stand der Wohnbevölkerung wiedergeben. Da die Untersuchungen in den einzelnen Sample
Points zum Teil mit einer zeitlichen Verschiebung gegenüber der Ziehung der Stichprobe
durchgeführt werden konnten, war dieses Ergebnis zu erwarten. Den drittgrößten Anteil
der qualitätsneutralen Ausfälle mit 14,2 % (41 Fälle) machten Kinder und Jugendliche
aus, die aus verschiedenen Gründen zwar im Untersuchungspoint angemeldet waren, jedoch
hauptsächlich außerhalb des Points lebten und deshalb nicht erreichbar waren. Solche
Gründe waren unter anderem, dass das Kind bei einem Elternteil angemeldet war, jedoch
bei dem anderen Elternteil außerhalb des Points lebte, oder dass das Kind bei den
Großeltern im Ausland lebte oder dass das Kind im Internat untergebracht war. Schließlich
gab es noch 23 Personen/Familien (ca. 8 % der neutralen Ausfälle), die wegen Sprachproblemen
an der Studie nicht teilnehmen konnten.
Die Gesamtresponse der Ziehungsvariante Einwohnermelderegister beträgt 57 %. Tab.
[2] gibt alle wesentlichen Angaben zur Response an. Bei alterspezifischer Betrachtung
sind deutliche Unterschiede zu erkennen. Während bei den Säuglingen und den Vorschulkindern
(Altersgruppe der 0- bis 6-Jährigen) die Ausschöpfung im Durchschnitt liegt, ist die
Response bei den 7- bis 13-Jährigen mit 61 % überdurchschnittlich hoch. Die Altersgruppe
der 14- bis 17-jährigen Jugendlichen weist demgegenüber mit 50 % die niedrigste Responserate
aus.
Tab. 2 Response - Variante Einwohnermelderegister
gesamt |
Geschlecht |
Region |
Gemeindegröße |
|
|
|
weiblich |
männlich |
Ost |
West |
Stadt |
Land |
Altersgruppe
|
Probanden netto/brutto
|
Response
|
n = 1121
|
n = 1068
|
n = 1127
|
n = 1062
|
n = 1142
|
n = 1047
|
0 bis 2 |
171/312 |
55 % |
54 % |
56 % |
50 % |
60 % |
56 % |
54 % |
3 bis 6 |
265/471 |
56 % |
56 % |
56 % |
56 % |
57 % |
51 % |
62 % |
7 bis 10 |
290/475 |
61 % |
61 % |
62 % |
54 % |
68 % |
57 % |
65 % |
11 bis 13 |
247/402 |
61 % |
58 % |
65 % |
60 % |
63 % |
59 % |
64 % |
14 bis 17 |
262/529 |
50 % |
50 % |
49 % |
52 % |
47 % |
50 % |
49 % |
0 bis 17
|
1235/2189
|
56,5 %
|
55,7 %
|
57,2 %
|
54,5 %
|
58,5 %
|
54,2 %
|
58,8 %
|
Die Responserate ist bei Mädchen und Jungen etwa gleich hoch. Ein signifikanter geschlechtsspezifischer
Unterschied ist nur bei der Altersklasse der 11- bis 13-Jährigen zu verzeichnen.
Insgesamt zeigte sich mit 58 % eine höhere Ausschöpfung im Westen (Berlin-Steglitz
und Wesendorf/Niedersachsen) als mit 54 % im Osten (Berlin-Friedrichshain und Neuruppin/Brandenburg).
Die Differenz resultierte in erster Linie aus den Unterschieden in den Altersgruppen
0- bis 2-Jährige und 7- bis 10-Jährige. In den ländlichen Sample Points Neuruppin
und Wesendorf war die Ausschöpfung insgesamt mit 59 % höher als in den städtischen
Erhebungsstandorten Friedrichshain und Steglitz (54 %), wobei die höchsten Unterschiede
in den Altersgruppen der 3- bis 6-Jährigen bzw. der 7- bis 10-Jährigen zu verzeichnen
waren (Tab. 2).
Bei der Stichprobenvariante Einwohnermelderegister waren es insgesamt nach Abzug der
qualitätsneutralen Ausfälle 954 Kinder und Jugendliche, die an der Studie nicht teilgenommen
haben. Abb. 2 gibt die Häufigkeit an, mit der bestimmte Begründungen für die Nicht-Teilnahme von
den Eltern bzw. den Jugendlichen selber oder, für den Fall, dass kein Kontakt mit
ihnen zustande kam, vom Untersuchungsteam genannt wurden. Am häufigsten wurden inhaltliche
(kein Interesse, vom Sinn und Zweck der Studie nicht überzeugt) und zeitliche Gründe
für die Ablehnung genannt. 2,7 % der ausgewählten Probanden waren Totalverweigerer,
2,5 % sind zum vereinbarten Termin nicht erschienen. Aus gesundheitlichen Gründen
hat nur 1,0 % an der Studie nicht teilgenommen. Von 11,6 % Testpersonen der bereinigten
Bruttostichprobe fehlt jedoch eine Begründung für die Nicht-Teilnahme, da diese nie
erreicht worden sind.
Abb. 2 Gründe für die Nicht-Teilnahme.
Inhaltliche Gründe für eine Nicht-Teilnahme wurden vor allem von den 11- bis 17-Jährigen
(13,9 %), von Kindern und Jugendlichen bzw. deren Familien aus den Erhebungspoints
im Westen (11 %) sowie von solchen, die in ländlichen Gebieten leben (12,1 %), genannt.
Zeitliche Gründe kamen mit 9,1 % überdurchschnittlich häufig in den Points im Osten
sowie in der Winterzeit (9,6 %) vor. Gesundheitliche Gründe spielten vor allem in
den Wintermonaten eine Rolle (1,6 %). Nie erreicht wurden überdurchschnittlich häufig
0- bis 6-Jährige (14,8 %), Kinder und Jugendliche im Osten (13,3 %), solche, die in
städtischen Gebieten wohnen (15,3 %), sowie Personen, die für eine Untersuchung in
der Sommerzeit ausgewählt worden waren.
Variante B: Schulstichprobe
Die Gesamtresponse der Zugangsvariante Schule beträgt bei den 11- bis 15-Jährigen
73 % und liegt im Vergleich zur Response der gleichen Altersgruppe in der Variante
Einwohnermelderegister um 14 % höher. Abb. 3 zeigt, dass die Responsedifferenz von 8 % bei den 11-Jährigen über 13 bis 18 % bei
den 12- bis 14-Jährigen auf 20 % bei den 15-Jährigen steigt. Hinsichtlich der Response
besitzt die Schulvariante gegenüber der Einwohnermelderegistervariante einen beachtlichen
Vorteil.
Abb. 3 Vergleich Responserate Einwohnermelderegister vs. Schule.
Tab. 3 gibt alle wesentlichen Angaben zur Response der Schulvariante an. Die Responserate
beträgt in den städtischen Sample Points 76 % und liegt über der Response in den ländlichen
Points (70 %). Außerdem ist die Responserate im Westen mit 79 % signifikant höher
als im Osten (67 %). Dieser Unterschied von 12 % resultiert in erster Linie aus der
Differenz bei den 13- und 14-Jährigen, wo die Differenz mit 19 % am höchsten ist.
Auch bei den 11- und 12-Jährigen ist die Differenz mit jeweils 12 bzw. 15 % beträchtlich
hoch. Allein bei den 15-Jährigen zeigt sich ein umgekehrtes Bild, hier ist die Response
im Osten um 7 % höher als im Westen. Tendenziell ähnliche Unterschiede waren auch
in der Einwohnermelderegistervariante zu verzeichnen, die Höhe der Differenzen schwankte
jedoch zwischen 3 und 5 % und war nicht signifikant.
Tab. 3 Response - Variante Schule
|
gesamt |
Region |
Gemeindegröße |
|
|
|
Ost |
West |
Stadt |
Land |
Alter (in Jahren)
|
Probanden netto/brutto
|
Response
|
n = 266 |
n = 269 |
n = 304 |
n = 231 |
11
|
59/82 |
72 % |
67 % |
79 % |
66 % |
79 % |
12
|
72/99 |
73 % |
64 % |
79 % |
77 % |
67 % |
13
|
86/106 |
81 % |
71 % |
90 % |
89 % |
73 % |
14
|
58/83 |
70 % |
61 % |
80 % |
73 % |
67 % |
15
|
80/116 |
69 % |
72 % |
65 % |
72 % |
65 % |
> 15
|
40/49 |
82 % |
71 % |
88 % |
88 % |
50 % |
gesamt
|
395/535 |
74 % |
68 % |
80 % |
77 % |
70 % |
gesamt 11-15 Jahre
|
355/489
|
73 %
|
67 %
|
79 %
|
76 %
|
70 %
|
Responder vs. Non-Responder und Treffgenauigkeit der Stichprobenvarianten
Responder vs. Non-Responder und Treffgenauigkeit der Stichprobenvarianten
Ein weiteres Kriterium für die Beurteilung der beiden Stichprobenvarianten ist das
Vorkommen einer Stichprobenverzerrung bzw. eines Non-Response-Bias und dessen Wirkung
im Fall einer Nichtberücksichtigung auf die Validität (Treffgenauigkeit) der Ergebnisse.
Neben der Ausschöpfungsquote hängt die Stärke eines möglichen Non-Response-Bias davon
ab, ob sich Teilnehmer und Nicht-Teilnehmer hinsichtlich ausgewählter Variablen der
Erhebung unterscheiden.
Für die Bestimmung von Differenzen zwischen Teilnehmern und Nicht-Teilnehmern sowie
für die Berechnung eines möglichen Non-Response-Bias wurde im Pretest ein Kurzfragebogen
für die Nicht-Teilnehmer eingesetzt. Im Pretest des Kinder- und Jugendgesundheitssurveys
konnten bei der Stichprobenvariante Einwohnermelderegister 469 der 954 Nicht-Teilnehmer
nachträglich dazu gewonnen werden, einen Kurzfragebogen zu beantworten. Dieser Anteil
entsprach 22 % der bereinigten Bruttostichprobe, so dass insgesamt von knapp 80 %
der Bruttostichprobe Grundinformationen vorliegen. Demgegenüber haben 14 % der Personen
in der bereinigten Bruttostichprobe (75 von 120 Non-Respondern) in der Stichprobenvariante
Schule einen Kurzfragebogen ausgefüllt. Damit ergibt sich ein Anteil von 88 %, über
den Informationen zumindest über eine begrenzte Anzahl von Grundmerkmalen vorhanden
ist.
Auf der Basis des Kurzfragebogens wurden die Randverteilungen ausgewählter Merkmale
zwischen Teilnehmern und Nicht-Teilnehmern miteinander verglichen. Tab. 4 zeigt für die Population der 11- bis 15-Jährigen eine Auswahl der herangezogenen
Merkmale und dient auch der Darstellung der Differenzraten dieser Merkmale zwischen
Teilnehmern und Nicht-Teilnehmern (hierbei wird die Differenzrate als 100 * (Teilnehmer -
Nicht-Teilnehmer/Teilnehmer definiert).
Während hinsichtlich der geschlechtsdifferenzierten Zusammensetzung die teilnehmende
Population der Kinder und Jugendlichen sowohl in der Einwohnermelderegisterstichprobe
als auch in der Schulstichprobe kaum Unterschiede zur nicht-teilnehmenden Population
aufweist, sind in Bezug auf andere wichtige Merkmale (soziale Schicht, Staatsangehörigkeit,
gesundheitliche Risikofaktoren) signifikante Unterschiede zu beobachten.
Tab. 4 Randverteilungen ausgewählter Merkmale für Teilnehmer und Nicht-Teilnehmer
|
Einwohnermelderegisterstichprobe |
Schulstichprobe |
Variable |
Teilnehmer |
Nicht-Teilnehmer |
Differenz-Ratio |
Teilnehmer |
Nicht-Teilnehmer |
Differenz-Ratio |
|
(n = 384) |
(n = 161) |
|
(n = 353) |
(n = 62) |
|
Schulabschluss Mutter
|
|
|
|
|
|
|
einfacher + mittlerer |
70,6 % |
86,6 % |
-22,7 % |
77,5 % |
75,0 % |
3,2 % |
Schulabschluss Vater
|
|
|
|
|
|
|
einfacher + mittlerer |
66,4 % |
80,9 % |
-21,8 % |
75,1 % |
82,9 % |
-10,4 % |
Berufstätigkeit Mutter
|
|
|
|
|
|
|
voll berufstätig |
43,1 % |
40,3 % |
6,5 % |
41,2 % |
35,2 % |
14,6 % |
Berufstätigkeit Vater
|
|
|
|
|
|
|
voll berufstätig |
82,3 % |
78,6 % |
4,5 % |
83,3 % |
75,5 % |
9,4 % |
Kind wohnt bei
|
|
|
|
|
|
|
Eltern |
66,8 % |
68,8 % |
-3,0 % |
67,4 % |
74,1 % |
-9,9 % |
Staatsangehörigkeit
|
|
|
|
|
|
|
andere |
3,2 % |
3,8 % |
-18,8 % |
3,2 % |
10,2 % |
-218,8 % |
Gewicht des Kindes
|
|
|
|
|
|
|
Mittelwert |
52,74 |
50,29 |
4,6 % |
53,93 |
58,2 |
-7,9 % |
Bei der Einwohnermelderegisterstichprobe ist die Schulbildung der Mutter bei den Non-Respondern
als schlechter einzustufen. So haben 86,6 % der Non-Responder eine einfache oder mittlere
Schulbildung, bei den Respondern sind es nur 70,6 %. Die Differenzrate zwischen Respondern
und Non-Respondern beträgt -22,7 %. Beim Schulabschluss des Vaters zeichnet sich ein
ähnliches Bild ab. Hinsichtlich der Berufstätigkeit waren sowohl bei den Müttern als
auch bei den Vätern die Vollbeschäftigten stärker bei den Nicht-Teilnehmern repräsentiert.
Hinsichtlich der Staatsangehörigkeit, der Frage: „Bei wem wohnt das Kind?” sowie der
Merkmale mit Bezug auf gesundheitliche Risikofaktoren (Rauchen, Gewicht) existieren
keine großen Unterschiede zwischen Teilnehmern und Nicht-Teilnehmern.
Bei der Schulstichprobe unterscheiden sich die Teilnehmer hinsichtlich des Schulabschlusses
der Mutter kaum von den Nicht-Teilnehmern, der Unterschied bei den Vätern bleibt jedoch
bestehen. So haben 75,1 % der Väter bei den Teilnehmern einen einfachen oder mittleren
Schulabschluss, bei den Nicht-Teilnehmern sind es 82,9 %. Die Unterschiede bei der
Berufstätigkeit der Eltern sind beim Feldzugang Schule stärker, wobei dies am extremsten
bei den Müttern zu beobachten ist. Ist der Anteil der voll berufstätigen Mütter bei
den Teilnehmern 41,2 %, so sinkt dieser Anteil bei den Nicht-Teilnehmern auf 35,2
%. Bei der Frage: „Bei wem lebt das Kind?” sind auch stärkere Unterschiede als bei
der Einwohnermelderegisterstichprobe zu verzeichnen. Im Gegensatz zur Variante Einwohnermelderegister
existiert ein wesentlicher Unterschied beim Anteil der Ausländer in der Teilnehmer-
und Nicht-Teilnehmer-Population. Während bei den Non-Respondern die Ausländer 10,2
% ausmachen, sind es bei den Teilnehmern nur 3,2 %, die keine deutsche Staatsangehörigkeit
haben. Hinsichtlich der Merkmale mit Bezug auf gesundheitliche Risikofaktoren sind
bei der Schulstichprobe auch stärkere Unterschiede zu beobachten. Das mittlere angegebene
Körpergewicht der nicht-teilnehmenden Jugendlichen ist um ca. 4,3 kg höher als das
der Teilnehmer. Hier ist jedoch zu beachten, dass das eine das angegebene, subjektiv
eingeschätzte Gewicht ist, während das andere gemessen wurde.
Stichprobenfehler und Präzision der Design-Varianten
Stichprobenfehler und Präzision der Design-Varianten
Ein weiteres Kriterium für die Beurteilung der beiden Stichprobenvarianten (geschichtetes
Random-Design vs. geschichtetes Random-Cluster-Design) ist der Stichprobenfehler.
Der Stichprobenfehler lässt sich durch den Standardfehler des Mittelwerts und den
Design-Effekt (Deff) bestimmen. Der Standardfehler bzw. standard error (se) des Mittelwerts
ist ein Maß für die Präzision, mit der sich der Mittelwert oder der Anteilswert eines
Merkmals an der Grundgesamtheit mithilfe der untersuchten Stichprobe schätzen lässt.
Je größer die Streuung einer Stichprobe ist, desto größer ist auch der Standardfehler
und desto ungenauer ist auch die Mittelwertschätzung. Neben der Streuung variiert
der Standardfehler auch mit der Stichprobengröße, d. h., bei steigender Stichprobengröße
verringert sich der Standardfehler. Große Stichproben mit geringer Streuung liefern
deshalb präzisere Ergebnisse [Kish 1965].
Der Design-Effekt (Deff) beschreibt für komplexe Stichprobendesigns den Einfluss des
Ziehungsverfahrens auf die Effizienz der Stichprobe. Der Deff-Wert wird als das Verhältnis
der Varianz des eingesetzten komplexen Stichprobendesigns zur Varianz einer einfachen
Zufallsauswahl (Random-Design) berechnet. Es handelt sich also um eine Maßzahl für
die relative Effizienz eines komplexen Stichprobendesigns im Vergleich zu einem einfachen
Random-Design. Ein Deff-Wert von 1 impliziert eine gleiche Effizienz beider Designs.
Wenn der Deff-Wert unter 1 liegt, so ist die Varianz des Random-Designs größer als
die des komplexen Designs, so dass das komplexe Design eine größere Effizienz aufweist.
Der umgekehrte Schluss ist für Deff-Werte größer als 1 zu ziehen. Bei einem Deff-Wert
von 2 wird beispielsweise beim Random-Design im Vergleich zum komplexen Design die
Hälfte der Probanden gebraucht, um die gleiche Präzision der Ergebnisse zu erreichen.
Die benötigte Anzahl der Probanden in einem Random-Design wird - um die gleiche Präzision
wie in einem komplexen Design zu erreichen - als „Effective n” bezeichnet [Kalton 1983].
Für den Vergleich der Stichprobendesigns wurde bei beiden Varianten die Gruppe der
11- bis 15-jährigen Probanden herangezogen. Analysiert wurde ein Set von Items (des
Eltern- und Kinderfragebogens), aus dem hier beispielhaft zwei Variablen dargestellt
werden sollen (Tab. 5). Die Berechnungen wurden mit dem Statistikprogramm SAS durchgeführt, das bei der
Kalkulation von Varianz und Standardfehlern das Stichprobendesign berücksichtigt.
Bei den untersuchten Variablen handelt es sich um die Anzahl der Arztbesuche des Kindes
in den letzten zwölf Monaten (Angabe der Eltern ergänzt durch Angaben der Kinder/Jugendlichen)
sowie das Vorliegen mindestens eines Unfalls des Kindes in den letzten zwölf Monaten
(Angabe des Kindes/Jugendlichen). Während sich der Standardfehler bei den Arztbesuchen
auf den Mittelwert der Häufigkeiten bezieht, handelt es sich bei den Unfällen um den
Anteilswert.
Tab. 5 Vergleich der Stichprobenvarianten - Standardfehler und Design-Effekt
|
|
|
|
|
Konfidenzintervall |
|
|
|
Merkmal |
Zugang |
Design |
Mittelwert/Anteil |
Standardfehler |
untere Grenze |
obere Grenze |
Deff |
n im Sample |
effective n |
Arztbesuche |
EMR[*]* |
stratifiziert |
5,03 |
0,358 |
4,33 |
5,73 |
1,00 |
342 |
342 |
random |
5,03 |
0,359 |
4,33 |
5,73 |
|
342 |
|
Schule |
cluster |
5,39 |
0,538 |
4,34 |
6,44 |
1,86 |
322 |
173 |
random |
5,39 |
0,395 |
4,62 |
6,16 |
|
322 |
|
Unfälle |
EMR*
|
stratifiziert |
42,2 % |
0,0268 |
36,9 % |
47,5 % |
1,00 |
342 |
342 |
random |
42,2 % |
0,0268 |
36,9 % |
47,5 % |
|
342 |
|
Schule |
cluster |
38,9 % |
0,0358 |
31,9 % |
45,9 % |
1,73 |
322 |
186 |
random |
38,9 % |
0,0272 |
33,6 % |
44,2 % |
|
322 |
|
* Einwohnermelderegister
|
Bei beiden Items ist der Standardfehler des Mittelwerts beim geschichteten Random-Cluster-Design
deutlich höher als beim stratifizierten Random-Design (Arztbesuche 0,538 vs. 0,358;
Unfälle 0,0358 vs. 0,0268). Da die Items in der Schulvariante eine höhere Varianz
aufweisen, sind die Konfidenzintervalle für die Mittelwertschätzung (95 %) deutlich
breiter als in der Einwohnermelderegisterstichprobe. Damit wird deutlich, dass die
Cluster-Stichprobe den Mittelwert der Grundgesamtheit weniger präzise schätzt als
die stratifizierte Variante. Wie zudem die Deff-Werte veranschaulichen, ist das Cluster-Design
zugleich weniger effektiv als das einfache Random-Design. Denn bei beiden Items ist
der Deff-Wert in der Schulvariante deutlich größer als 1. Mit 1,86 bzw. 1,73 liegen
die Deff-Werte zudem nahe 2. Das bedeutet, dass die Cluster-Stichprobe im Hauptsurvey
fast doppelt so groß sein müsste wie die Random-Stichprobe, um eine ähnlich geringe
Varianz zu erreichen.
Schlussfolgerungen und Empfehlungen für die Hauptphase
Schlussfolgerungen und Empfehlungen für die Hauptphase
Beim Einwohnermelderegister wurden in den vorgesehenen 32 Untersuchungswochen 1235
Probanden untersucht, d. h. im Durchschnitt 39 Probanden pro Woche. In der Schule
nahmen insgesamt 395 Jugendliche in zwölf Wochen teil. Durchschnittlich konnten damit
33 Jugendliche pro Woche untersucht werden. Dementsprechend wird im Fall eines Feldzugangs
über die Schule ein größerer Zeitraum für die Untersuchung einer bestimmten Zahl von
Probanden benötigt als vergleichsweise beim Einwohnermelderegisterzugang, was zu höheren
Untersuchungskosten pro Teilnehmer führt.
Durch das Heranziehen ganzer Klassen hängt die Altersstruktur der realisierten Nettostichprobe
nicht nur von der Ausschöpfung, sondern auch von der altersspezifischen Besetzung
der ausgesuchten Klassen ab. Die fehlende rechtzeitige Information über die altersspezifische
Besetzung der Klassen zum Zeitpunkt der Untersuchung in der jeweiligen Schule und
die daraus resultierende Komplexität der Stichprobenplanung sind ein relevanter Nachteil
der Schulvariante.
Hinsichtlich der Response besitzt jedoch die Schulvariante gegenüber der Einwohnermelderegistervariante
einen beachtlichen Vorteil. Bei einer differenzierten Betrachtung unter Einbeziehung
regionaler Aspekte relativiert sich jedoch der Responsevorteil der Schulvariante.
Im Fall der Durchführung der Hauptphase auf der Basis einer Schulstichprobe ist eine
Verzerrung der Stichprobe zu erwarten, die nur durch eine Gewichtung aufgehoben werden
kann. Dieses Problem ist als wesentlicher Nachteil der Schulvariante zu sehen.
Insgesamt lässt sich festhalten, dass in beiden Varianten merkmalspezifische Verzerrungen
vorkommen. Während jedoch bei der Einwohnermelderegisterstichprobe diese nur soziodemographische
Merkmale betreffen, die z. B. durch den gezielten Einsatz von Incentives und/oder
einer Gewichtung der Daten behoben werden können, weist die Schulstichprobe darüber
hinaus weitere Merkmalsgruppen mit Verzerrungen auf, wie gesundheitliche Risikofaktoren,
die nicht ohne weiteres korrigiert werden können.
Die Analyse der im Pretest erhobenen Daten bestätigte die in der Literatur häufig
zu treffende Hypothese, dass Klumpenstichproben gegenüber geschichteten Random-Designs
einen Nachteil in Bezug auf die Höhe des Stichprobenfehlers und der damit zusammenhängenden
Präzision der Ergebnisse aufweisen.
Aufgrund der oben genannten und der hier nicht diskutierten logistischen Unterschiede
[Kurth et al. 2002] der beiden Varianten empfiehlt es sich, in der Hauptphase auch für die Altersgruppe
der 11- bis 15-Jährigen ein Einwohnermelderegisterdesign auszuwählen.