Gesundheitswesen 2005; 67: 132-136
DOI: 10.1055/s-2005-858253
Originalarbeit

© Georg Thieme Verlag KG Stuttgart · New York

Wie gut können Haplotypen in den populationsbasierten KORA-Studien rekonstruiert werden?

How About the Uncertainty in the Haplotypes in the Population-Based KORA Studies?I. M. Heid1 , C. Lamina1 , F. Bongardt1 , G. Fischer1 , N. Klopp1 , C. Huth1 , H. Küchenhoff2 , F. Kronenberg1, 3 , H. E. Wichmann1 , T. Illig1
  • 1Institute of Epidemiology, GSF National Research Center for Environment and Health, Neuherberg, Germany
  • 2Department of Statistics, Ludwig-Maximilians-Universtität München, Germany
  • 3Innsbruck Medical University, Department of Medical Genetics, Molecular and Clinical Pharmacology, Division of Genetic Epidemiology, Innsbruck, Austria
Further Information

Publication History

Publication Date:
19 July 2005 (online)

Preview

Zusammenfassung

In den KORA-Surveys werden derzeit verschiedene Kandidatengene, die in Zusammenhang mit Typ 2 Diabetes, Herzinfarkt, Atherosklerose, Adipositas und anderen Erkrankungen stehen, untersucht. Hierbei werden SNPs (Single Nucleotide Polymorphisms, Einzelbasenaustausche) in verschiedenen Genen bei den Probanden der Querschnittstudie genotypisiert. Ferner gewinnen Haplotypen an Bedeutung: Haplotypen sind Kombinationen von Allelen innerhalb von bestimmten Abschnitten eines Chromosomenstrangs. Die Betrachtung solcher Haplotypen in genetischen Assoziationsstudien ist oft effizienter als die Betrachtung der einzelnen SNPs. Ein statistisches Problem ist hierbei die Rekonstruktion der Phaseninformation: Bei der Genotypisierung werden nur die Allele (also die Ausprägungen) eines Individuums an den SNPs bestimmt, jedoch nicht, welche Base auf welchem Chromosomenstrang angesiedelt ist. Verschiedene statistische Haplotyp-Rekonstruktionsverfahren ermöglichen die Identifizierung der wahrscheinlichsten Haplotypen. Dabei ist ein gewisser Prognosefehler unausweichlich. Auch Genotypisierungsfehler können zur Unsicherheit in den Haplotypen beitragen. Dieser Genotypfehler kann von Bedeutung werden, selbst wenn der Genotypfehler je SNP sehr klein ist. Dies liegt daran, dass mehrere SNPs an den Haplotypen beteiligt sind. Ein Ziel dieses Projekts ist die Quantifizierung der Haplotyp-Unsicherheiten bei Genen, die in KORA untersucht wurden. Wir verwenden einerseits Computersimulationen basierend auf den in den KORA-Probanden beobachteten Haplotypen und deren Häufigkeiten. Andererseits vergleichen wir Ergebnisse mit Simulationen basierend auf mathematischen Modellen zur Evolution („coalecent models”). Diese Unsicherheiten in den Haplotypen können dazu führen, dass vorhandene Assoziationen zwischen Gen und Erkrankung nicht gefunden werden, da die Unsicherheit in den Haplotypen den Unterschied der Haplotyp-Häufigkeiten zwischen Erkrankten und Nichterkrankten verwischt. Das Ausmaß dieses Problems und Lösungsmöglichkeiten aufzuzeigen, ist das zweite Ziel dieses Projekts.

Abstract

In the KORA surveys, numerous candidate genes in the context of type 2 diabetes, myocardial infarction, atherosclerosis or obesity are under investigation. Current focus is on genotyping single nucleotide polymorphism (SNPs). Haplotypes are also of increasing interest: haplotypes are combinations of alleles within a certain section of one chromosome. Analysing haplotypes in genetic association studies is often more efficient than studying the SNPs separately. A statistical problem in this context is the reconstruction of the phase: genotyping the SNPs determines the alleles of an individual at one particular locus of the DNA, but does not reveal which allele is located on which one of the two chromosomes. This information is required when talking about haplotypes. There are statistical approaches to identify the most likely two haplotypes of an individual given the genotypes. However, a certain error in prognosis is unavoidable. There are also errors in the genotypes. These errors are assumed to be small for one SNP but can accumulate over the SNPs involved in one haplotype and thus can induce further uncertainty in the haplotype. It is therefore the aim of our project to quantify the uncertainties in the haplotypes particularly for genes investigated in the KORA surveys. We conduct computer simulations based on the haplotypes and their frequencies observed in the KORA individuals and compare the results with simulations based on mathematical modelling of the evolutionary process (”coalescent models”). The uncertainties in the haplotypes have an impact on the search for association between genes and disease: an association may not be detected as the haplotype uncertainty obscures the haplotype frequency differences between cases and controls. It is a further aim of our project to elucidate the extent of this problem and to develop strategies for reducing it.

Literatur

Iris M. Heid

GSF - Forschungszentrum für Umwelt und Gesundheit, Institut für Epidemiologie

Ingolstädter Landstraße 1

85764 Neuherberg

Email: heid@gsf.de