Zusammenfassung
Zielsetzung Die lidA-Studie verknüpft Befragungsdaten mit individuellen Krankenkassendaten (KK-Daten).
Es wird analysiert, zu welchen sozialen und gesundheitlichen Selektionseffekten es
kommt, wenn nicht allen Befragten individuelle KK-Daten zugespielt werden können.
Ein individuelles Datenlinkage setzt das Probandeneinverständnis und die Teilnahme
seiner Kasse voraus.
Methodik Die realisierte Zuspielung individueller KK-Daten wurde als abhängige Variable einer
multivariaten binären logistischen Regression definiert. Insgesamt wurden 21 (1. Befragung)
bzw. 22 Faktoren (2. Befragung) analysiert, die mutmaßlich Einfluss auf die Zuspielungschancen
haben.
Ergebnisse Die Prävalenzen sozialer und gesundheitlicher Merkmale waren fast identisch in den
Gruppen mit und ohne zugespielte Krankenkassendaten. Die logistische Regression fand
signifikante Einflussgrößen in der ersten Befragung bezogen auf eine räumliche Kategorisierung
(BIK), die Einkommensgruppe „1000 bis unter 2000 Euro“ und die Teilzeitarbeit. Nur
die Fach-/Hochschulreife zeigte in beiden Wellen gegenüber der niedrigsten Bildungsstufe
signifikante Assoziationen (OR W1: 1,63; OR W2: 1,83). Bildung sowie Beruf (Blossfeld)
zeigten als Merkmalskomplex in beiden Wellen einen signifikanten Einfluss.
Schlussfolgerung Ein Linkage von KK- mit Befragungsdaten ist in der lidA-Studie fast selektionsfrei
realisiert, trotz einer Datenlieferung für nur 21 % bzw. 24 % der Probanden. Alle
Datenlinkage-Studien mit KK-Daten sollten deren Selektivität prüfen.
Abstract
Aim Within the scope of the lidA study, survey data are linked with individual statutory
health insurance claims data (SHI data). The following paper investigates the social
and health selection effects that occur if linkage is incomplete. Linkage of individual
data requires written consent of the individual and participation of the respective
SHI funds.
Method The actual linkage of SHI data was defined as the dependent variable in a multivariate
binary logistic regression. In total, 21 (1. wave) resp. 22 factors (2. wave) that
presumably influence the probability of a successful linkage were analyzed.
Results Prevalence rates of social and health-related variables are very similar in groups
with and without SHI data. In the logistic regression, significant influencing factors
were found for the data of the first wave related to spatial categorization (BIK region),
the income group „1000 to below 2000 Euro“ and part-time work. Only higher education
has shown significantly associations in both waves compared to the lowest level (OR
W1: 1,63; OR W2: 1,83). Education and occupational classification (Blossfeld) significantly
influence the chance of a successful linkage in both waves.
Conclusion SHI data can be linked to survey data with almost no bias, although SHI data were
available for only 21 % or 24 % of all the participants. All studies focusing on data
linkage with SHI data should analyze their selectivity.
Schlüsselwörter
Datenlinkage - Primärdaten - Sekundärdaten - Krankenkassendaten - Selektivität
Key words
data linkage - primary data - secondary data - claims data - selectivity