Deciphering the Genetic Basis of Spanish Familial Testicular Cancer
Total Page:16
File Type:pdf, Size:1020Kb
Departamento de Bioquímica Deciphering the genetic basis of Spanish familial testicular cancer Tesis doctoral Beatriz Paumard Hernández Madrid, 2017 Departamento de Bioquímica Facultad de Medicina Universidad Autónoma de Madrid Deciphering the genetic basis of Spanish familial testicular cancer Tesis doctoral presentada por: Beatriz Paumard Hernández Licenciada en Biología por la Universidad Autónoma de Madrid (UAM) Director de la Tesis: Dr. Javier Benítez Director del Programa de Genética del Cáncer Humano (CNIO) Jefe del Grupo de Genética Humana (CNIO) Grupo de Genética Humana Programa de Genética del Cáncer Humano Centro Nacional de Investigaciones Oncológicas (CNIO) Dr. Javier Benítez Ortiz, Director del grupo de Genética del Cáncer Humano del Centro Nacional de Investigaciones Oncológicas (CNIO) CERTIFICA: Que Doña Beatriz Paumard Hernández, Licenciada en Biología por la Universidad Autónoma de Madrid, ha realizado la presente Tesis Doctoral “Deciphering the genec basis of Spanish familial testicular cáncer” y que a su juicio reúne plenamente todos los requisitos necesarios para optar al Grado de Doctor en Bioquímica, Biología Molecular, Biomedicina y Biotecnología, a cuyos efectos será presentada en la Universidad Autónoma de Madrid. El trabajo ha sido realizado bajo mi dirección, autorizando su presentación ante el Tribunal calificador. Y para que así conste, se extiende el presente certificado, Madrid, Junio 2017 Fdo: Director de la Tesis Fdo: Tutor de la Tesis VoBo del Director Dr.Javier Benítez Ortiz La presente Tesis Doctoral se realizó en el Grupo de Genética Humana en el Centro Nacional de Investigaciones Oncológicas (CNIO) de Madrid durante los años 2013 y 2017 bajo la supervisión del Dr. Javier Benítez Las siguientes becas, ayudas y proyectos han permitido la realización de esta Tesis Doctoral: “La Caixa”- Severo Ochoa International Phd Programmme at CNIO Proyecto FIS PI12/0070 BRIDGES Project (H2020) Summary / Resumen SUMMARY Testicular cancer is a frequently occurring disease among adult males, and it accounts for 1-2% of all male tumors. It can be classified into different types of cancer: germ cell tumors (GCT), which represent 98% of all cases, and tumors involving the gonadal stromal tumors and secondary tumors of the testes. The incidence of Testicular Germ Cell Tumors (TGCTs) has been increasing for the past decades, although the etiology of the disease and the reasons of its increased incidence remain unknown. Environmental factors, in particular exposure to endocrine disruptors during embryogenesis and perinatal life are suspected culprits. It is likely that genetic factors also play an important role in TGCT formation, as the estimated heritability, 48.9%, is the third highest among all cancers, and the Familial Testicular Germ Cell Tumor (FTGCT) risk is 2-fold higher than what is typical for more common cancers such as breast, colorectal and prostate cancer. Several candidate gene approaches failed to identify high susceptibility genes. In fact, in the last years scientists have come to believe that a polygenic model fits better with the genetic landscape of the disease, although the idea of polygenic susceptibility does not fit in with a history of familial aggregations in a disease. Due to the absence of information about the genetic basis of this disease, our objective was to identify high/moderate or low susceptibility genes using whole exome sequencing (WES) and case-control studies considering both monogenic and polygenic models of inheritance. These studies will help to increase our knowledge about the genetic basis of the disease and may have a significant impact on its prevention, early diagnosis and a possible treatment. The hypothesis of the monogenic model was tested using a pipeline previously described by our group, while the polygenic model was studied by performing family-based association tests in which we evaluated the level of additive and cumulative effects our variants could have in the familial aggregation of the disease. DNA of a group of 19 families (71 individuals) was sequenced with an Illumina HiSeq 2000 sequencer. Based on the analysis assuming both patterns of inheritance, a total of 120 candidate variants were evaluated in the case-control study performed in 391 sporadic cases and 382 healthy Spanish controls. In order to increase the size sample, we used data from the public database of the Spanish Center for Biomedical Research on Rare Diseases (CIBERER), which contains WES data of 788 unaffected individuals, and to perform statistical analysis. In this discovery analysis, 27 variants gave significant results and two of them (located in the VNN1 and SLC22A16 genes, which are both involved in spermatogenesis) were later on replicated in a large series studied in the English population. Moreover, the variant of the SLC22A16 gene appears to be specifically associated with the development of Seminoma germ cell tumors. In summary, our results present two new susceptibility risk genes whose variants are potential candidates for being associated with the development of familial testicular cancer. RESUMEN El cáncer de testículo es una enfermedad frecuente en hombres adultos, representa en torno al 1-2% de todos los tumores masculinos. Existen diferentes tipos de cáncer testicular: los tumores germinales que representan el 98% de todos los casos, los tumores estromales y secundarios. La incidencia de tumores germinales de testículo se ha incrementado en las últimas décadas, aunque su etiología y causas son desconocidas. Los factores ambientales, y en particular la exposición a factores endocrinos durante el proceso de embriogénesis en la etapa perinatal, son los más señalados como responsables. Además, es probable que los factores genéticos, desempeñen también un papel importante en la formación de este tipo de tumores, ya que la herencia estimada es del 48.9%, la tercera más alta de todos los canceres, y el riesgo de los casos familiares, es 2 veces superior al de los canceres más comunes, como mama, colon o próstata. Varios estudios de aproximación a genes candidatos han fracasado en la identificación de genes de alta susceptibilidad. De hecho, durante los últimos años se ha fomentado la idea de que un modelo poligénico sería el que mejor se ajustaría para explicar el entorno genético de la enfermedad, aunque este modelo en principio no contempla una posible agregación familiar. La carencia de información acerca de las bases genéticas de esta enfermedad, es la razón por la que nos planteamos el estudio para la identificación de genes de alta, moderada y baja susceptibilidad mediante la técnica de secuenciación masiva de exoma y estudios de asociación de caso control, para ambos modelos de herencia monogénico y poligénico. Estos estudios nos ayudaran a mejorar nuestro conocimiento acerca de las bases genéticas de la enfermedad, así como para la prevención, diagnóstico temprano y posible tratamiento de los pacientes. La hipótesis del modelo monogénico fue analizada mediante un sistema de filtrado descrito previamente por nuestro grupo, mientras que, para el estudio del modelo poligénico, se utilizaron estudios de asociación basados en patrones familiares, en los que evaluamos el efecto aditivo y acumulativo que nuestras variantes podían tener sobre la agregación familiar. Un grupo de 19 familias (71 individuos) fue secuenciado con el HiSeq2000. Del análisis de ambos patrones de herencia se obtuvieron un total de 120 variantes candidatas que se estudiaron en el ensayo de caso control realizado en 391 casos esporádicos y 382 controles sanos españoles. Con el fin de incrementar nuestro tamaño muestral, decidimos utilizar la información de la base de datos pública española del Centro de Investigación Biomédica en Red Enfermedades raras (CIBERER,) que contiene datos de secuenciación de exoma de 788 individuos, y llevar acabo los análisis estadísticos. De este primer estudio, 27 variantes resultaron significativas, pero de estas, solo de dos se replicaron los resultados en población inglesa. Las dos variantes, se encuentran en los genes VNN1 y SLC22A16, ambos implicados en el proceso de espermatogénesis, y una de ellas asociada específicamente al diagnóstico clínico de tumor germinal seminomatoso. En conclusión, nuestro estudio demuestra que existen dos nuevos genes de susceptibilidad cuyas variantes son posibles candidatas de conferir riesgo al desarrollo del cáncer familiar testicular Table of contents ABBREVIATIONS……………………………………………………………………………...21 INTRODUCTION…………………………………………………………………………….....31 1. DEVELOPMENT OF THE TESTES………………………………………………………….33 1.1 Gonadal development.…………………………………………...…………………...33 1.2 Genetic differentiation program…………………………...………………………....34 1.3 Differentiation during testis organogenesis…………………………………………..36 1.4 Function…………………………………..………………………………….……….38 1.4.1 Reproductive system……………………………………………………….38 1.4.2 Endocrine system…………………………………………………………..39 2. TESTICULAR CANCER……………………………………………………………………...40 2.1 Testicular germ cells tumors (TGCT)..…………………………………………........40 2.2 Types of TGCT……………………………………………………………………….42 2.3 Epidemiology…………………………………………………………………………42 2.4 Risk factors…………………………………………………………………………...44 3. GENETIC LANDSCAPE……………………………………………………………………...46 3.1 Family and Twin Studies ……………………………………………………………46 3.2 Approaches to find out the genetic predisposition to TGCT ………………………..47 3.3 Mutational spectrum…………………………………………………………………48 OBJECTIVES………………………………………………………………………………...….53 MATERIALS AND METHODS………………………………………………………………..57 1. PATIENTS