Linkage Disequilibrium and Transmission Distortion Affecting Human Chromosome 6P Linkage Disequilibrium and Transmission Distortion Affecting Human Chromosome 6p Dissertation zur Erlangung des Grades des Doktors der Naturwissenschaften (Dr. rer. nat.) eingereicht am Fachbereich Biologie, Chemie, Pharmazie der Freien Universität Berlin vorgelegt von Pablo Sandro Carvalho Santos aus Brasília Februar 2010 Diese Dissertation entspricht der zwischen Februar 2006 und Februar 2010 im Institut für Immungenetik, Charité – Universitätsmedizin Berlin, unter Betreuung von Prof. Dr. rer. nat. Andreas Ziegler sowie von Dr. rer. nat. Barbara Uchanska-Ziegler durchgeführten Forschungsarbeit. This thesis is based on research conducted between February 2006 and February 2010 at the Institut für Immungenetik, Charité – Universitätsmedizin Berlin, in Berlin, Germany, under supervision of Prof. Dr. rer. nat. Andreas Ziegler and Dr. rer. nat. Barbara Uchanska-Ziegler. Even if this is allegedly the most widely read part of a PhD thesis, I do encourage you all to dedicate some time to the next chapters. It took me four years to write it, and it is an interesting work, in my opinion. Thank you all. 4 Zusammenfassung Sowohl die jüngste Entwicklung neuer Technologien für die Hochdurchsatzsequenzierung und -genotypisierung von Organismen als auch die Erzeugung neuer Werkzeuge für großflächige genomische Analysen, die in letzter Zeit von verschiedenen Forschungsinstituten weltweit zur Verfügung gestellt wurden, haben die Art der Fragestellungen in den verschiedenen Arbeitsfeldern der Genetik stark beeinflußt. Die vorliegende Arbeit ist ein Beispiel für die Nutzung dieser Ressourcen in Verbindung mit traditionellen Labormethoden, um sich zwei Themenfeldern in den Bereichen Immun- und Populationsgenetik zu nähern: einerseits den mit dem Haupthistokompatibilitätskomplex gekoppelten Geruchsrezeptorgenen (aus dem Englischen, major histocompatibility complex-linked olfactory receptor genes, MHC-linked OR), und andererseits dem Phänomen der Allelweitergabedistorsion (transmission distortion, TD). Das Konzept des Kopplungsungleichgewichts (linkage disequilibrium, LD) ist für die Diskussion beider Themenfelder grundlegend. Mit Bezug auf die MHC-OR Gene präsentiert diese Arbeit eine detaillierte Beschreibung des LD Profils innerhalb der OR Gene sowie zwischen ihnen und dem MHC. Durch Analyse der OR Polymorphismen und konservierter MHC-Haplotypen sowie der Genotypisierung einer Kohorte von Raucherinnen und Nichtraucherinnen konnten wir den Zusammenhang zwischen einem OR Polymorphismus und dem Rauchverhalten europäischstämmiger Frauen beschreiben. Wir schilderten genotypische und phänotypische Variationen der MHC-OR Gene bei achtzehn menschlichen Zelllinien, indem wir neue Polymorphismen und OR Allele bestimmten, und damit die Grundlage für die Einschätzung der funktionalen Partizipation von MHC-linked OR bei der Partnerwahl schufen. Darüber hinaus führten wir einen chromosomalen und phylogenetischen Vergleich von MHC-OR Genen bei vierzehn Wirbeltierspezien durch und konnten Schlussfolgerungen über die phylogenetische Geschichte der Genfamilien und Tierarten ziehen. Bezüglich TD konnten wir dieses Phänomen durch eine reine in silico-analyse in einer Region des menschlichen Chromosoms 6p ermitteln, welche die Transkriptionsfaktorgene SUPT3H (suppressor of Ty 3 homolog), RUNX2 (runt-related transcription factor 2) sowie mikro RNA MIR586 beherbergt. In einer anschließenden Untersuchung, in der wir eine große unabhängige südamerikanische Kohorte genotypisierten, konnten wir die Anwesenheit von TD in diesem chromosomalen Segment, zumindest bei europäischstämmigen Populationen, bestätigen. Aufgrund der hohen Bedeutung von RUNX2 (und den entsprechenden 5 Proteinisoformen) haben unsere Erkenntnisse Auswirkungen auf die Interpretation einer Reihe von früheren Studien, die dieses Gen mit verschiedenen Phänotypen wie Krebs, Knochendichte und Entwicklungsstörungen in Verbindung brachten. Diese Ergebnisse wurden in elektronischen Dateien für den Internet-basierenden Genome Browser des HapMap Projekts zusammengestellt, um sie im genomischen Kontext sichtbar werden zu lassen und folglich einen ersten Schritt in Richtung einer genomweiten TD Ressource zu unternehmen. Zusätzlich fanden wir heraus, dass TD mit LD korrespondiert und stellten die Hypothese auf, TD könnte die LD „Landschaft“ des Genoms aktiv gestalten. Schließlich weisen unsere Ergebnisse auf ein potenzielles technisches Problem mit der Datenbank des HapMap Projektes hin, das wir vorschlugen bei zukünftigen Erweiterungen der Datenbank zu berücksichtigen. Summary The recent development of new technologies for high throughput sequencing and genotyping of organisms and individuals, as well
