Identification de variants génétiques rares aux loci 1p13 et 8q22 dans la maladie osseuse de Paget Les gènes CTHRC1 et TM7SF4 associés à la maladie osseuse de Paget

Mémoire

Mariejka Beauregard

Maîtrise en physiologie-endocrinologie Maître ès sciences (M. Sc.)

Québec, Canada © Mariejka Beauregard, 2013

ii

Résumé

CONTEXTE: La maladie osseuse de Paget (MOP) est transmise sur un mode autosomique dominant dans 30% des cas. Les mutations de SQSTM-1 expliquent 37% des formes familiales, ce qui suggère la présence d’autres loci.

OBJECTIFS: Identifier des variants rares (VR) de gènes candidats situés aux nouveaux loci 1p13 et 8q22.

Rechercher une association génétique de la MOP avec ces gènes candidats dans la population canadienne- française.

MÉTHODES: Certains gènes candidats à la MOP aux loci 1p13 et 8q22 ont été sélectionnés, puis séquencés dans un échantillon de découverte. La fréquence de l’allèle mineur d’un VR devait être inférieure à 0,05. 4 VR ont été génotypés chez 240 cas et 297 témoins.

RÉSULTATS: 74 VR ont été identifiés. Un VR (TM7SF4; rs62620995; Leu397Phe) était prédit dommageable par 2 outils d’analyse in silico. rs35500845 (CTHRC1) et rs62620995 (TM7SF4) étaient associés à la MOP de façon statistiquement significative.

Mot clés : Maladie osseuse de Paget, Remodelage osseux, Variants rares, Polymorphismes nucléotidiques simples (SNPs), CTHRC1, TM7SF4 (DC-STAMP), Population canadienne-française, Population à effet fondateur.

iii

Abstract

BACKGROUND: Paget's disease of bone (PDB) is transmitted through autosomal dominant mode of inheritance in 30 percent of cases. Mutations of the SQSTM-1 account for 37 percent of familial forms of PDB, suggesting the involvement of other loci.

PURPOSE: Identify rare variants (RV) of candidate located on new loci 1p13 and 8q22.

Search for a genetic association of PDB with these candidate genes in the French-Canadian population.

METHODS:

We selected candidate genes on 1p13 and 8q22 loci and sequenced them in a discovery sample. RV was defined by a minor allele frequency less than 0.05. 4 RV were genotyped in 240 PDB patients and 297 healthy individuals.

RESULTS: 74 RV were identified. One RV (TM7SF4; rs62620995; Leu397Phe) was predicted to be damaging by two in silico analysis tools. rs35500845 (CTHRC1) and rs62620995 (TM7SF4) were statistically associated with PDB.

KEY WORDS: Paget’s disease of bone, bone remodelling, rare variants, polymorphisms, SNP, CTHRC1, TM7SF4, DC-STAMP, French Canadian population, founder effect population

v

Remerciements

Je tiens d’abord à remercier ma directrice de recherche, Dre Laëtitia Michou, qui m’a transmis sa passion pour la recherche. Elle a su me laisser suffisamment d’autonomie, tout en me fournissant l’encadrement requis à ma progression. Elle m’a fourni plusieurs opportunités d’apprentissage uniques et inestimables, tant aux plans clinique que scientifique (et parfois même culturel!), et m’a ainsi montré la réalité d’une chercheure-clinicienne. L’enseignement reçu de sa part dépasse largement les limites de mon projet de recherche.

Je remercie Dr Jacques P Brown et Dr Jean Morissette, fondateurs du laboratoire au sein duquel j’ai réalisé mes travaux, de m’avoir fait bénéficier de leur expertise et de m’avoir prodigué de judicieux conseils.

Je remercie mes évaluateurs qui ont accepté de lire ce mémoire et de contribuer à mes apprentissages en me partageant leurs commentaires.

Je remercie Édith Gagnon de m’avoir montré comment réaliser les différentes manipulations nécessaires à mon projet et de m’avoir grandement aidée dans la prise en charge de mes nombreux «boulets»!

Je remercie Julie Parrot d’avoir répondu, toujours aussi efficacement et agréablement, à mes multiples questions et demandes d’ordre administratif.

Je remercie tous les membres de l’équipe du séquençage pour votre travail efficace et professionnel.

Je remercie Claudia, Davy, Iris et Sabrina sans qui je n’aurais pu apprécier autant mes journées au sous-sol du bloc S. Nous avons bien ri ensemble! Vous me manquez déjà. Je vous souhaite bonne chance dans vos projets actuels et futurs.

Merci papa pour ton aide précieuse à plusieurs étapes de la rédaction du mémoire et ta confiance inébranlable en mes capacités. Merci maman de m’avoir accompagnée en congrès, de m’avoir aidée à prendre des bonnes décisions, et d’avoir enduré nos nombreuses discussions scientifiques père-fille! Merci Ben d’avoir partagé de nombreuses heures de travail avec moi et de m’encourager à me réaliser. Merci à vous trois de m’avoir démontré votre soutien par toutes vos attentions pendant mes périodes de travail et de m’avoir distraite aux moments opportuns!

Finalement, j’aimerais remercier les organismes suivants sans lesquels ce projet n’aurait pu être réalisé : le Fonds de recherche du Québec – Santé, les Instituts de recherche en santé du Canada, la fondation du CHUQ, le Groupe de Recherche en Maladies Osseuses, la Fondation canadienne pour l’innovation, l’université Laval et le Centre de Recherche du CHUQ (CHUL).

vii

Table des matières

Résumé ...... iii

Abstract ...... v

Remerciement ...... vii

Table des matières ...... ix

Liste des tableau ...... xiii

Liste des figures ...... xv

Liste des annexes ...... xvii

1. MISE EN CONTEXTE ET REVUE DE LA LITTÉRATURE ...... 1

1.1. GÉNÉTIQUE DES MALADIES COMPLEXES; Un défi imposant ...... 1

1.1.1. Composition et diversité du génome ...... 1

1.1.2. Variations génétiques ...... 2

1.1.3. Maladies monogéniques ...... 3

1.1.4. Maladies complexes ...... 3

1.1.4.1. Maladies communes – Variants communs ...... 3

1.1.4.2. Maladies communes – Variants rares ...... 4

1.1.4.2.1. Influence de la sélection naturelle sur la fréquence des variants génétiques ...... 4

1.1.4.2.2. Impact fonctionnel des variants rares ...... 5

1.1.4.2.3. Méthodes de détection des variants rares ...... 6

1.1.4.2.4. Maladies à début tardif et variants rares...... 8

1.1.4.2.5. Population canadienne-française et variants rares ...... 9

1.2. MALADIE DE PAGET; Une maladie du remodelage osseux ...... 9

1.2.1. Tissu osseux normal ...... 9

1.2.2. Aperçu général de la maladie osseuse de Paget ...... 11

1.2.3. Épidémiologie ...... 11

1.2.4. Présentation clinique ...... 13

1.2.5. Caractéristiques de l’os et des cellules osseuses pagétiques ...... 14

ix 1.2.6. Étiologie ...... 17

1.2.6.1. Composante environnementale ...... 17

1.2.6.1.1. Hypothèse virale ...... 17

1.2.6.1.2. Alimentation ...... 19

1.2.6.1.3. Substances toxiques ...... 20

1.2.6.2. Composante génétique ...... 20

1.2.6.2.1. Régions chromosomiques liées à la MOP ...... 20

1.2.6.2.2. Mutations du gène SQSTM1 ...... 21

1.2.6.2.3. Gènes impliqués dans les maladies apparentées à la MOP ...... 23

2. HYPOTHÈSES ET OBJECTIFS ...... 27

3. INDIVIDUS ET MÉTHODES ...... 29

3.1. INDIVIDUS ...... 29

3.2. RÉPLICATION DE L’ASSOCIATION GÉNÉTIQUE DES LOCI 1p13 ET 8q22 AVEC LA MOP DANS LA POPULATION CANADIENNE-FRANÇAISE ...... 29

3.3. SÉLECTION DES GÈNES CANDIDATS ...... 29

3.4. RECHERCHE DE VARIANTS RARES DANS LES GÈNES CANDIDATS SÉLECTIONNÉS ...... 30

3.5. CARACTÉRISATION IN SILICO DES VARIANTS GÉNÉTIQUES ...... 31

3.6. ÉTUDE DE SÉGRÉGATION INTRA-FAMILIALE ...... 32

3.7. ÉTUDE D’ASSOCIATION GÉNÉTIQUE CAS-TÉMOINS ...... 32

3.8. ANALYSES STATISTIQUES ...... 33

4. RÉSULTATS ...... 37

4.1. ÉTUDE DE RÉPLICATION DES ASSOCIATIONS GÉNÉTIQUES ENTRE LA MOP ET LES LOCI 1p13 ET 8q22 DANS LA POPULATION CANADIENNE-FRANÇAISE ET RECHERCHE D‘ASSOCIATION GÉNOTYPE - PHÉNOTYPE ...... 37

4.2. IDENTIFICATION DE VARIANTS GÉNÉTIQUES AU SEIN DES MEILLEURS GÈNES CANDIDATS À LA MOP ...... 41

4.2.1. Sélection de 10 gènes candidats ...... 41

4.2.2. Répartition des variants génétiques identifiés selon la fréquence de l’allèle mineur...... 43 x

4.2.3. Répartition des variants rares identifiés chez des individus atteints par la MOP selon leurs localisations chromosomique et génique ...... 47

4.2.4. Description détaillée des 74 variants rares identifiés ...... 48

4.2.4.1. Gène ALX3 (Homeobox aristaless-like 3) ...... 48

4.2.4.2. Gène AMPD2 (Adenosine monophosphate deaminase 2) ...... 48

4.2.4.3. Gène CSF1 (Colony stimulating factor 1) ...... 49

4.2.4.4. Gène CTHRC1 (Collagen triple helix repeat containing 1) ...... 49

4.2.4.5. Gène EPS8L3 (Epidermal growth factor receptor kinase substrate 8-like protein 3) ...... 50

4.2.4.6. Gène GSTM3 (Glutathione s-transferase mu 3 (brain)) ...... 51

4.2.4.7. Gène GSTM4 (Glutathione s-transferase mu 4) ...... 52

4.2.4.8. Gène LRP12 (Low density lipoprotein receptor-related protein 12) ...... 52

4.2.4.9. Gène PSMA5 (Proteasome subunit, alpha type 5) ...... 53

4.2.4.10. Gène TM7SF4 (DC-STAMP) (Transmembrane 7 superfamily member 4, (Dendritic cell specific transmembrane protein)) ...... 53

4.3. ÉTUDE DE LA SÉGRÉGATION INTRA-FAMILIALE ...... 54

4.4. ÉTUDE D’ASSOCIATION GÉNÉTIQUE ...... 56

5. DISCUSSION ...... 61

5.1. ASSOCIATION GÉNÉTIQUE ENTRE LA MOP ET LES LOCI 1P13 ET 8Q22 DANS LA POPULATION CANADIENNE-FRANÇAISE ...... 61

5.2. IDENTIFICATION DE VARIANTS GÉNÉTIQUES RARES AU SEIN DES GÈNES CANDIDATS À LA MOP SITUÉS AUX LOCI 1p13 ET 8q22...... 63

5.3. ASSOCIATION GÉNÉTIQUE ENTRE LA MOP ET DEUX VARIANTS GÉNÉTIQUES DU LOCUS 8q22 ...... 63

5.3.1. Association allélique entre la MOP et le gène CTHRC1, gène codant pour une protéine impliquée dans la prolifération et la différenciation de cellules précurseurs d’ostéoblastes ...... 63

5.3.2. Association génotypique entre la MOP et le gène TM7SF4, codant pour une protéine impliquée dans la multinucléation des ostéoclastes ...... 65

5.4. RETOUR SUR LA MÉTHODE UTILISÉE POUR EXPLORER LE RÔLE DE VARIANTS GÉNÉTIQUES RARES DANS LA SUSCEPTIBILITÉ GÉNÉTIQUE À UNE MALADIE ...... 66

xi 5.4.1. Limites de l’étude et améliorations potentielles ...... 66

5.4.2. Forces de l’étude ...... 70

5.5. DÉMARCHES COMPLÉMENTAIRES ...... 70

5.6. INTÉRÊTS ET APPORTS DE L’ÉTUDE ...... 71

6. CONCLUSION ...... 73

Bibliographie ...... 75

Bases de données ...... 89

Outils de prédiction in silico ...... 89

Autres outils de prédiction ...... 89

xii

Liste des tableaux

Tableau 1. Loci associés à la MOP via deux études pangénomiques d’association ...... 24

Tableau 2. Réplication de l’association génétique des loci 1p13 et 8q22 avec la MOP dans la population canadienne-française ...... 38

Tableau 3. Sélection des gènes candidats potentiels à la MOP ...... 42

Tableau 4. Nouveaux variants rares identifiés ...... 44

Tableau 5. Variants rares sélectionnés pour l’étude de la ségrégation intra- familiale ...... 55

Tableau 6. Résultats de l’étude d’association génétique par variant rare ou par groupe de variants rares ...... 57

Tableau 7. Comparaison des fréquences de l’allèle mineur des quatre variants communs associés avec la MOP chez des individus non mutés appartenant à différentes populations ...... 62

xiii

Liste des figures

Figure 1. Structure d’un gène ...... 1

Figure 2. Variations génétiques ...... 2

Figure 3. Distributions possibles des variants rares ...... 6

Figure 4. Fonctions des diverses cellules osseuses au sein de l’unité de remodelage osseux ...... 10

Figure 5. Système RANK RANKL OPG ...... 11

Figure 6. Déformations osseuses dans la maladie osseuse de Paget ...... 13

Figure 7. Phases d’évolution du remodelage osseux dans la maladie osseuse de Paget ...... 15

Figure 8. Architecture en microscopie optique de l’os sain et de l’os pagétique ...... 16

Figure 9. Architecture en microscopie à balayage de l’os sain et de l’os pagétique ...... 16

Figure 10. Ostéoclaste pagétique hypermultinucléé ...... 17

Figure 11. Domaines de la protéine SQSTM1 ...... 21

Figure 12. Étapes décisionnelles pour la sélection des variants génétiques à étudier ...... 34

Figure 13. Nombre de variants génétiques identifiés en fonction de la fréquence de l'allèle mineur du variant génétique selon EntrezSNP ...... 45

Figure 14. Répartition des variants génétiques rares identifiés selon leur localisation génique ...... 47

Figure 15. Conservation de la méthionine (M) en position 35 de la protéine EPS8L3 ...... 50

Figure 16. Conservation de l’acide glutamique (E) en position 240 de la protéine EPS8L3 ...... 51

Figure 17. Conservation de la valine (V) en position 650 de la protéine LRP12 ...... 53

Figure 18. Conservation de l’acide aminé leucine (L) en position 397 de la protéine TM7SF4 ...... 54

Figure 19. Ségrégation intrafamiliale du variant AMPD 2_6 ...... 56

xv

Liste des annexes

Annexe A : Amplification et séquençage ...... 91

Annexe B : Tissu osseux ...... 97

Annexe C : Étude des associations génotype-phénotype entre la MOP et les variants communs associés dans la population canadienne-française ...... 99

Annexe D : Gènes situés dans les intervalles génomiques étudiés ...... 103

Annexe E : Variants génétiques identifiés au cours de l’étude ...... 105

xvii

1. MISE EN CONTEXTE ET REVUE DE LA LITTÉRATURE

1.1. GÉNÉTIQUE DES MALADIES COMPLEXES; Un défi imposant

1.1.1. Composition et diversité du génome Le génome contient plus de trois milliards de paires de bases azotées. Les quatre différentes bases azotées soit l’adénine, la cytosine, la guanine et la thymine s’enchaînent dans un ordre qui est précisément défini. La molécule d’ADN qui en résulte mesure environ deux mètres. Elle se replie sur elle-même afin de pouvoir être contenue dans le noyau de chaque cellule. Environ cinq pour cent de cette longue molécule forment les quelque 20 000 gènes du génome, constitués de régions régulatrices, d’exons et d’introns. (Figure 1) Les exons, soit les segments de gènes qui encodent les protéines, représentent environ 1 % du génome. (Marian, 2012) D’autres segments du génome, comptant pour environ 2 % du génome ont été conservés à travers les espèces, ce qui suggère qu’ils sont importants pour la fonction de la molécule d’ADN. (Wright, 2005) La fonction de plus de 95 % du génome demeure donc inconnue à ce jour.

Figure 1. Structure d’un gène

Figure adaptée de Alexa Plateform, http://www.alexaplatform.org

Environ 0,1 % du génome diffère entre deux individus. (Marian, 2012) Un changement de nucléotide se produit à environ toutes les 1000 à 1250 paires de bases (pb), ce qui fait que chaque individu possède entre trois et quatre millions de variations dans sa séquence d’ADN par rapport à la séquence standard. (Marian, 2012; Wright, 2005) Il est estimé qu’environ 3,5 millions de ces variants sont des polymorphismes nucléotidiques simples (SNPs). De ce nombre, entre 10 000 et 50 000 entraînent un changement d’acide aminé. Plus de deux tiers de ces variants sont considérés comme délétères, pour la fonction des protéines encodées. (Marian, 2012; Wright, 2005) Cette diversité du génome, responsable de la diversité des phénotypes observés dans l’espèce humaine, a pour objectif de permettre des adaptations en présence de conditions difficiles telles que les infections, la famine ou les climats extrêmes. (Wright, 2005) Toutefois, certaines variations génétiques s’avèrent nocives et peuvent causer ou favoriser le développement de certaines maladies. (Iyengar et Elston, 2007)

1 1.1.2. Variations génétiques Les mutations et les polymorphismes sont deux types de variations génétiques. (Figure 2) Les mutations sont des altérations peu fréquentes de la séquence normale de l’ADN qui ont des répercussions fonctionnelles délétères. Les polymorphismes sont des variations de la séquence d’ADN fréquentes au sein de la population qui ont des effets fonctionnels mineurs ou nuls. Généralement, pour qu’un variant génétique soit considéré comme un polymorphisme, sa fréquence de l’allèle mineur (MAF) dans la population doit être supérieure à 1 %. (Frazer et al., 2009) Dans la littérature, les polymorphismes sont subdivisés en plusieurs catégories en fonction de leur MAF. Généralement, les variants dont la MAF est inférieure à 5 % sont considérés comme ayant une faible MAF. Le seuil empirique de MAF caractérisant les variants rares varie selon les auteurs. Ainsi, Gorlov (2008) le fixe à 5 %, Bodmer (2008) à 3 % et Frazer (2009) à 1 %. Plusieurs autres catégorisations de variants ont été suggérées pour raffiner la description des variants dont les MAFs se situent entre 0,1 % et 5 % (eg. variant rare, variant très rare, variant de faible fréquence, variant non-commun, variant moins commun, variant privé, variant sub-polymorphiques etc.), mais elles sont peu reprises par des auteurs différents de ceux les ayant définies. Comme les MAF des variations génétiques se répartissent selon un continuum, il existe assurément un chevauchement entre les différentes catégories de variants. (Bodmer et Bonilla, 2008) Dans le présent mémoire, les variants génétiques dont la MAF était inférieure à 5% ont été considérés comme des variants rares.

Figure 2. Variations génétiques

2

1.1.3. Maladies monogéniques Les maladies monogéniques, aussi appelées maladies mendéliennes ou monofactorielles, sont causées par la mutation d’un seul gène. La pénétrance élevée de ces mutations causales fait en sorte que le mode de transmission de ces maladies est généralement facile à élucider en observant le pedigree d’une famille touchée par la maladie. Environ 1 à 2 % de la population est affectée par une maladie monogénique. (Wright, 2005) Ces maladies causées par l’altération d’un seul gène ne représentent donc qu’une faible proportion des maladies pour lesquelles une composante héréditaire est observée. Par exemple, il est estimé qu’environ 5 % des cas de cancers communs sont causés par la dysfonction d’un seul gène, ce qui ne représente qu’une très faible proportion des cancers pour lesquels il existe une composante héréditaire. (Bodmer et Tomlinson, 2010)

1.1.4. Maladies complexes Il semble que la plupart des maladies qui manifestent une composante héréditaire résultent plutôt de l’interaction entre plusieurs facteurs génétiques et environnementaux. (Marian, 2012) Ces maladies complexes ou multifactorielles affectent plus de la moitié de la population à un moment de la vie. (Wright, 2005) Puisque les fréquences alléliques et les effets des variants génétiques sont probablement répartis selon un continuum, il est suggéré que des variants génétiques communs et des variants génétiques rares contribuent à la génération des phénotypes complexes. (Marian, 2012)

1.1.4.1. Maladies communes – Variants communs L’hypothèse Maladies communes - Variants communs stipule que les maladies complexes ainsi que la diversité des phénotypes observables entre les espèces du règne animal résultent d’un grand nombre de variants communs, qui possèdent chacun un effet modéré sur le développement du phénotype observé. (Marian, 2012) L’association de variants communs avec plusieurs maladies complexes a été recherchée au moyen de grandes études pangénomiques d’association. Malheureusement, les limites de ce type d’étude ont rapidement été constatées. D’abord, les loci détectés par ces études pangénomiques d’association n’expliquent qu’une petite partie de l’héritabilité qui se définit comme la variation phénotypique attribuée aux différences génotypiques. (Gibson, 2012) En effet, la plupart des variants communs associés à des maladies qui ont été identifiés jusqu’à maintenant confèrent un risque relativement faible de développer la maladie, avec des rapports de cote qui varient entre 1,1 et 1,5. (Manolio et al., 2009) Par exemple, une très large étude pangénomique d’association a identifié 18 variants communs associés avec le diabète de type 2 qui, ensemble, n’expliquaient que 6 % de l’héritabilité de cette maladie. (Cirulli et Goldstein, 2010) De même, les variants communs associés aux cancers les plus communs n’expliquent qu’environ 10 % du risque relatif familial de développer le cancer étudié. (Bodmer et Tomlinson, 2010) Les effets mineurs des variants identifiés par ces études limitent leur intérêt clinique. (Marian, 2012) Aussi, les variants communs associés à une maladie via ces études pangénomiques ne sont généralement pas la cause de la maladie étudiée; en

3 revanche, ils sont souvent en déséquilibre de liaison avec les variants causaux. (Marian, 2012) Malheureusement, les variants causaux responsables de l’association génétique sont rarement identifiés. (Cirulli et Goldstein, 2010) Ensuite, les immenses cohortes nécessaires à la réalisation de telles études font en sorte que le phénotypage rigoureux des individus étudiés est difficile et que des individus d’origines ethniques différentes sont souvent inclus dans les études. (Manolio et al., 2009) De plus, l’étude d’un très grand nombre de marqueurs génétiques nécessite l’utilisation de niveau de signification statistique très contraignant afin de compenser les multiples hypothèses statistiques vérifiées, ce qui réduit la chance de détecter des loci faiblement impliqués dans la pathogenèse d’une maladie. (Bodmer et Bonilla, 2008)

Malgré leurs nombreuses limites, les études pangénomiques d’association ont permis de déceler de nouvelles pistes physiopathologiques impliquées dans certaines maladies. La possibilité de découvrir de nouvelles pistes à explorer constitue un avantage majeur comparativement aux études qui adoptent une approche par «gènes candidats» puisque la sélection des gènes étudiés par ces approches est souvent basée sur des connaissances incomplètes à propos des maladies étudiées. (Manolio et al., 2009)

1.1.4.2. Maladies communes – Variants rares Après avoir constaté que les variants communs découverts via des études pangénomiques d’association ne parvenaient pas à expliquer toute l’héritabilité de maladies complexes, il a été suggéré que les variants génétiques rares, les variants structuraux et les interactions gène-gène pouvaient expliquer en partie l’héritabilité non décelée par ce type d’étude. L’hypothèse Maladies communes - Variants rares s’oppose à l’hypothèse Maladies communes - Variants communs et suggère qu’une partie significative de la susceptibilité génétique aux maladies communes est reliée aux effets de multiples variants dont les MAFs se situent entre celles des mutations et celles des variants communs. Ces variants rares seraient indépendants les uns des autres et confèreraient chacun une augmentation significative du risque relatif de développer une maladie. Cette augmentation du risque relatif serait plus élevée que celle attribuable aux variants communs associés à une même maladie. (Bodmer et Bonilla, 2008)

1.1.4.2.1. Influence de la sélection naturelle sur la fréquence des variants génétiques Le modèle Maladies communes – Variants rares est basé sur la prémisse selon laquelle les variants responsables du développement de maladies héréditaires ont un impact négatif sur la fonction de gènes (ou de régions intergéniques) et sont donc partiellement éliminés par la sélection naturelle. De ce fait, ils ne peuvent pas être fréquents au sein de la population. (Gibson, 2012; Gorlov et al., 2011) Les données empiriques obtenues jusqu’à maintenant sur la génétique des populations sont en faveur de cette hypothèse. D’abord, la très grande majorité des variants non synonymes délétères pour la fonction d’un gène ont une

4

fréquence inférieure à un pour cent. (Wright, 2005) De plus, une relation inverse entre la MAF des variants génétiques et la sévérité du dommage causé à la protéine encodée est observée; les variants non synonymes qui altèrent sévèrement la structure des protéines encodées sont généralement moins fréquents que les variants synonymes ou neutres. (Gorlov et al., 2011) Aussi, le ratio intronique des polymorphismes non synonymes1 augmente radicalement lorsque les polymorphismes étudiés possèdent une MAF inférieure à 5 %. (Gorlov et al., 2008) Finalement, les variants les plus rares ont généralement les effets de taille les plus élevées. Ensemble, ces observations suggèrent que les polymorphismes fonctionnels sont soumis à la sélection. (Gorlov et al., 2011)

1.1.4.2.2. Impact fonctionnel des variants rares Plusieurs variants génétiques rares interagissent probablement pour entraîner un phénotype. Selon les résultats d’une simulation, 80 variants ayant une MAF entre 0,7 % et 5 % et pour lesquels le risque relatif varie entre 1,6 et 4 seraient nécessaires pour expliquer 40 % de l’héritabilité d’une maladie commune. (Gorlov et al., 2011) Plusieurs modèles de répartition des variants rares ont été créés pour tenter d’élucider leur effet fonctionnel. (Figure 3) Selon le modèle A, un variant causal serait plus fréquent chez les individus atteints que chez les témoins. Selon le modèle B, les variants agiraient en synergie pour contribuer à un phénotype; les individus atteints auraient donc plus de chance de partager des variants fonctionnels que les individus témoins, chez qui les variants sont distribués de façon aléatoire. Selon le modèle C, les individus atteints seraient porteurs d’un plus grand nombre de variants rares que les individus témoins dans certaines régions génomiques précises. (Bansal et al., 2010) Les données acquises jusqu’à maintenant sur les variants rares ne permettent pas de favoriser l’un de ces modèles.

1 Ratio intronique des polymorphismes non synonymes : Rapport entre le nombre de polymorphismes non synonymes et le nombre de polymorphismes introniques. En absence de sélection naturelle, ce rapport devrait demeurer constant pour toutes les catégories de fréquence de l’allèle mineur (MAF) considérées.

5 Figure 3. Distributions possibles des variants rares

Figure adaptée de Bansal (2010)

1.1.4.2.3. Méthodes de détection des variants rares Il est estimé que chaque gène compte plus de deux polymorphismes délétères dont la MAF est inférieure à 5 %. (Gorlov et al., 2008) Malheureusement, les études pangénomiques d’association ne sont d’aucune aide pour l’étude de tels variants rares puisqu’elles ne permettent pas la détection de nouveaux variants et qu’elles étudient des variants dont la MAF est supérieure à 5% afin d’obtenir une puissance suffisante à la détection d’association. (Manolio et al., 2009) De plus, la pénétrance des variants rares est nettement inférieure à 50 %, ce qui n’est pas suffisant pour causer une concentration de cas dans une même famille. De ce fait, leur détection via des études de liaisons génétiques, utiles pour la détection de régions chromosomiques liées aux maladies mendéliennes, est aussi impossible. (Bodmer et Bonilla, 2008; Bodmer et Tomlinson, 2010)

Une des méthodes fréquemment utilisées aujourd’hui pour identifier des variants rares consiste à séquencer des régions génomiques dans lesquelles des variants communs ont été associés à une maladie au moyen d’études pangénomiques d’association. (Manolio et al., 2009) En effet, il est possible que des variants communs pour lesquels une association a été identifiée soient en déséquilibre de liaison2 avec un ou plusieurs variants rares responsables de l’association. L’association observée entre une maladie et un variant commun auquel un faible risque relatif est attribué pourrait en fait résulter de quelques variants rares expliquant une partie importante de la susceptibilité à la maladie chez un faible nombre d’individus. (Cirulli et Goldstein, 2010; Gibson, 2012) Autrement dit, le risque attribuable aux variants rares causaux pourrait être très supérieur à celui attribué initialement au variant commun identifié grâce à une étude pangénomique d’association. La dilution de l’effet du variant rare parmi plusieurs individus non porteurs du variant rare qui, par ailleurs,

2 Déséquilibre de liaison : Ségrégation non aléatoire de marqueurs génétiques au sein d’une population. Le déséquilibre de liaison diminue lorsque la distance physique entre les marqueurs augmente. (Gibson, 2004, précis de génomique)

6

partagent un même variant commun, pourrait expliquer que le risque attribuable au variant commun associé à la maladie soit inférieur au risque attribuable au variant rare causal. (Dickson et al., 2010)

Il a été suggéré qu’un variant rare responsable d’une association entre une maladie et un variant commun pourrait être situé à des millions de paires de bases du variant commun pour lequel une association a été identifiée en premier lieu. (Dickson et al., 2010) Une autre hypothèse stipule que de multiples variants rares pourraient se retrouver sur le même haplotype et être responsable de l’association significative entre le variant commun et la maladie. La région autour d’un variant commun associé à une maladie qui contient potentiellement un variant rare causal peut donc être assez étendue. Afin de réduire l’ampleur de la tâche de séquençage, il a été suggéré de débuter la recherche de variants rares causaux en séquençant les meilleurs gènes candidats situés dans une région associée à une maladie. Les gènes qui jouent un rôle dans des processus physiopathologiques impliqués dans le développement de la maladie étudiée sont certainement de bons gènes candidats pour la recherche des variants rares causaux. (Bodmer et Bonilla, 2008)

Les variants identifiés lors d’études de reséquençage sont souvent caractérisés puis priorisés selon leur fréquence, leurs effets fonctionnels prédits, la présence d’un autre variant associé à la maladie étudiée à proximité ou la conservation au cours de l’évolution du nucléotide ou de l’acide aminé modifié. (Bodmer et Tomlinson, 2010) Les principaux effets fonctionnels observés sont l’altération de la régulation de l’expression génique via la transformation de sites de liaisons à un facteur de transcription, de microARNs ou de sites d’épissage et la transformation de la structure des protéines encodées. (Bansal et al., 2010; Marian, 2012) Des outils in silico permettent aussi de comparer les séquences de plusieurs organismes afin d’observer quelles régions sont conservées pendant l’évolution. Puisque ces régions ont été conservées grâce à la sélection négative, les variants qui altèrent des nucléotides ou les acides aminés correspondants sont probablement des effets délétères sur la fonction des gènes dans lesquels ils se trouvent. (Cooper et Shendure, 2011)

Les variants génétiques les plus intéressants parmi ceux identifiés peuvent ensuite être génotypés dans un plus grand échantillon afin d’étudier la présence d’une association génétique. Un variant rare dont la MAF diffère de façon statistiquement significative entre les individus atteints par la maladie et les témoins pourrait avoir un effet sur le développement de la maladie étudiée. Par contre, puisque la taille de l’échantillon requise pour démontrer une association entre une maladie et un variant augmente proportionnellement en fonction de 1/MAF et qu’elle augmente abruptement à mesure que le rapport de cote diminue, la taille de l’échantillon nécessaire pour démontrer une association est beaucoup plus élevée que celle requise pour identifier les variants rares. Afin de contrer cette difficulté, il est suggéré de regrouper certains variants pour les analyser ensemble. Cette approche peut faciliter l’observation d’association génétique, mais rend plus difficile l’atteinte

7 de l’objectif principal qui est d’identifier le variant causal. (Manolio et al., 2009) Pour l’instant, il n’existe pas de consensus sur les méthodes optimales de regroupement de variants. Toutefois, il semble logique de regrouper des variants ayant des MAFs semblables, faisant varier le risque de développer la maladie dans le même sens et appartenant aux mêmes gènes ou aux mêmes voies de signalisation.

Lorsqu’un variant rare est fortement soupçonné d’être impliqué dans le développement d’une maladie après ces différentes étapes, des expérimentations in vitro ou in vivo visant à observer les effets fonctionnels des variants rares identifiés peuvent être effectuées. Des résultats positifs sont de très forts arguments en faveur de la causalité des variants étudiés dans le phénotype étudié. Toutefois, ces expérimentations sont coûteuses et surtout très difficiles à réaliser dans un contexte approprié. En effet, selon le type de cellules utilisées, ainsi que l’organisme sur lequel sont effectuées les expérimentations, les résultats obtenus peuvent s’avérer négatifs malgré l’effet fonctionnel réel du variant étudié. L’action de certains variants peut dépendre de l’état de la chromatine, de l’interaction avec d’autres polymorphismes, de l’interaction avec l’environnement, ou de l’activation par un certain promoteur, ce qui fait qu’une expérimentation qui ne respecte pas certaines conditions précises peut donner des résultats faussement négatifs. De plus, puisque les méthodes d’expérimentations ont chacun leur seuil de sensibilité; un faible impact sur le processus testé peut ne pas être détecté. (Cooper et Shendure, 2011)

Beaucoup de travail est nécessaire dans ce nouveau domaine afin d’élaborer des stratégies efficaces pour déterminer les variants qui sont impliqués dans une maladie. La confirmation de l’implication de variants rares dans certaines maladies permettra d’élucider en partie leurs effets fonctionnels.

1.1.4.2.4. Maladies à début tardif et variants rares Les maladies qui n’altèrent pas le succès reproducteur, comme la maladie osseuse de Paget (MOP), pourraient être causées par des variants rares ou des variants communs puisque les variants causaux de ces maladies ne devraient pas être confrontés à la sélection naturelle. Or, plusieurs autres maladies à début tardif sont associées à des variants rares. Par exemple, moins de 10 variants communs figurent parmi plus de 1000 variations génétiques des gènes BRCA1 et BRCA2 associées au cancer du sein. (Wright, 2005) Le fait qu’un même variant exerce plusieurs fonctions différentes (effets pléïotropiques) pourrait expliquer que certaines maladies à début tardif soient tout de même associées majoritairement à des variants rares. En effet, les variants associés à des maladies à début tardif peuvent influencer d’autres traits qui diminuent le succès reproducteur. (Manolio et al., 2009) Par exemple, les gènes impliqués dans certains cancers à début tardif sont aussi impliqués dans le contrôle du cycle cellulaire, l’apoptose et l’angiogenèse, qui sont des processus soumis à la sélection négative. (Gorlov et al., 2008)

8

1.1.4.2.5. Population canadienne-française et variants rares Il est suggéré que la plupart des variants rares sont population spécifiques. Les populations à effets fondateurs, comme la population canadienne-française, dans lesquelles la dérive génétique3 a été favorisée sont donc potentiellement enrichies en variants rares. (Bodmer et Bonilla, 2008; Laberge, 2007; Manolio et al., 2009) Lorsque la MAF d’un variant est plus élevée dans une population à effet fondateur, il est plus facile de détecter une association entre une maladie et ce variant. (Bodmer et Bonilla, 2008) De plus, il est probable que des individus provenant d’une même population à effet fondateur partagent certains variants causaux. Il est aussi probable que ces individus aient été exposés à des facteurs extérieurs semblables, ce qui facilite la détection d’association entre une maladie et des variants qui nécessitent certaines expositions environnementales particulières pour exprimer leur effet. (Marian, 2012) L’utilisation d’une cohorte provenant d’une population à effet fondateur fait donc partie des stratégies pour tenter de surpasser les difficultés énoncées précédemment quant à l’étude des variants rares. (Bodmer et Bonilla, 2008; Manolio et al., 2009)

La population canadienne-française est une population de choix pour effectuer la recherche de variants génétiques rares. D’abord, il s’agit d’une population à effet fondateur. En effet, près de 80% de la population québécoise actuelle provient de quelque 8500 colons français venus s’établir en Nouvelle-France. Pour des raisons sociales et linguistiques, cette population est demeurée isolée pendant près de 300 ans. (Laberge, 2007) Aussi, jusqu’à récemment, les familles comportaient de nombreux enfants ce qui constitue un atout pour la recherche en génétique. Finalement, la conservation de registres religieux (naissance, mariage, décès) jusqu’aux premiers arrivants facilite grandement la reconstruction des pedigrees. (Gagnon, 2011)

1.2. MALADIE DE PAGET; Une maladie du remodelage osseux

1.2.1. Tissu osseux normal Le tissu osseux est un tissu dynamique qui s’adapte constamment à son environnement et aux contraintes mécaniques. Les os assurent plusieurs fonctions essentielles comme le soutien des organes et la protection du système nerveux central. Ils forment une réserve de certains minéraux et ils hébergent l’hématopoïèse. Avec les muscles, ils permettent le déplacement et le mouvement. (Clarke, 2008)

Deux types d’os peuvent être distingués d’un point de vue structural : l’os cortical, aussi appelé l’os compact et l’os trabéculaire, aussi appelé l’os spongieux. L’os cortical forme la couche externe des os. Sa grande densité confère à l’os sa force et sa rigidité. L’os trabéculaire est constitué de travées positionnées stratégiquement

3 Dérive génétique : Modification de la fréquence des allèles attribuable au hasard de la transmission. Plus la population est petite plus la probabilité est forte que le hasard entraîne une fréquence observée différente de celle attendue. (Gibson, 2004, précis de génomique)

9 pour résister aux contraintes mécaniques. Il assure un support structural sans alourdir inutilement l’os. On le retrouve aux extrémités des os longs (épiphyses) et dans certains os plats. (Clarke, 2008)

Il existe trois types de cellules osseuses; les ostéoblastes, les ostéoclastes et les ostéocytes. (Figure 4) Toutes trois sont impliquées dans la régulation du remodelage osseux qui est nécessaire pour extraire les minéraux de l’os ou de les y emmagasiner selon les besoins, tout en conservant un tissu osseux résistant adapté aux contraintes mécaniques. (Raisz, 1999) Les ostéoblastes sont des cellules d’origine mésenchymateuse qui forment l’os. Ils produisent notamment le collagène de type 1, la principale protéine formant la matrice osseuse. Ils disposent ces fibres de façon lamellaire, chaque lamelle étant orientée de façon perpendiculaire, ce qui confère à l’os sa solidité. (Marks et Popoff, 1988) Les ostéoclastes sont des cellules multinucléées, issues de la fusion de cellules circulantes mononuclées de la lignée monocyte/macrophage, qui résorbent l’os via la sécrétion d’ions hydrogènes et de différentes enzymes. (Raisz, 1999) Les ostéocytes sont des ostéoblastes emmurés dans la matrice osseuse lors de sa synthèse. Ces cellules ont été beaucoup moins étudiées que les ostéoblastes et les ostéoclastes malgré qu’elles représentent environ 90% des cellules osseuses. Elles seraient impliquées dans la régulation du remodelage osseux. (Bonewald, 2011)

Figure 4. Fonctions des diverses cellules osseuses au sein de l’unité de remodelage osseux

Figure adaptée de Longo (2011)

La différentiation des ostéoblastes à partir de cellules souches mésenchymateuses est principalement régulée par la voie de signalisation Wnt, alors que le recrutement, la différenciation et l’activation des ostéoclastes sont régulés par la voie de signalisation du NF-κB via l’interaction entre le récepteur RANK porté par les ostéoclastes et le ligand RANK (RANKL) exprimé par les ostéoblastes et les ostéocytes. Le récepteur leurre ostéoprotégérine (OPG), aussi sécrété par les ostéoblastes, inhibe l’interaction entre RANK et RANKL nécessaire à l’activation de la voie de signalisation du NF-κB. (Figure 5) (Caetano-Lopes et al., 2009; Udagawa et al., 2000)

10

Figure 5. Système RANK RANKL OPG

Figure adaptée de Kumar (2009)

1.2.2. Aperçu général de la maladie osseuse de Paget La maladie osseuse de Paget (MOP) est la deuxième maladie osseuse métabolique la plus fréquente après l’ostéoporose. (Roodman et Windle, 2005) Elle se caractérise par une augmentation focale du remodelage osseux qui résulte en la formation de tissu osseux dont l’architecture est anormale. Étrangement, l’atteinte osseuse demeure localisée aux os atteints et ne se propage pas aux os adjacents. (Roodman et Windle, 2005) La MOP se transmet selon un mode autosomique dominant avec un pénétrance incomplète dans environ un tiers des cas. (Morales-Piga et al., 1995; Siris et al., 1991) Actuellement, un seul gène causal de la maladie a été identifié; le gène Sequestosome-1 (SQSTM1). (Chung, 2011) Dans la population canadienne- française, la mutation de SQSTM1 la plus fréquente, soit la mutation P392L, a été identifiée chez 46 % des individus souffrant d’une forme familiale et 16 % des individus souffrant d’une forme sporadique de MOP, ce qui suggère l’implication d’autres gènes dans la maladie. (Laurin, 2002)

1.2.3. Épidémiologie Dans la littérature, la prévalence rapportée de la MOP chez les Caucasiens de plus de 55 ans varie entre 1 et 8 %, selon la région étudiée et l’année à laquelle les observations ont été effectuées. (Altman et al., 2000) La

11 MOP est fréquente en Europe de l’Ouest, en Amérique du Nord, en Australie et en Nouvelle-Zélande. (Cooper et al., 1999) Elle est plus rare en Scandinavie, en Irlande, au sud de l’Europe, en Afrique et en Asie. (Cooper et al., 2006; Siris et al., 1991) La prévalence globale la plus élevée a été observée en Grande-Bretagne. (Cooper et al., 1999)

L’incidence et la prévalence de la maladie augmentent avec l’âge. (Laurin et al., 2001) Dans une étude réalisée au Royaume-Uni, Van Staa et coll. (2002) ont observé que l’incidence de la MOP passait de 0,5 cas par 10 000 années-personnes pour les hommes âgés de 55 à 59 ans à 7,6 cas par 10 000 années-personnes chez les hommes de plus de 85 ans. En Grande-Bretagne, Cooper et coll. (1999) ont observé que la prévalence de la MOP s’étalait de 0,3%, pour les hommes âgés de 55 à 59 ans, à près de 7% pour les hommes de plus de 85 ans. Aux États-Unis, les prévalences sont semblables; la MOP touche de 1 à 3% des individus de plus de 40 ans et de 8 à 10% des individus de plus de 80 ans. (Siris et al., 1991)

Étonnamment, l’incidence, la prévalence et la sévérité de la MOP diminuent depuis plusieurs années. Une diminution de la mortalité attribuable directement à la MOP ou à une tumeur osseuse primaire chez des adultes de plus de 40 ans a été observée entre les années 1950 et 1970, suggérant une diminution de la fréquence de la maladie ou de la sévérité de l’atteinte osseuse. (Barker, 1984) Une diminution de 60% de la prévalence de la MOP a été observée en Grande-Bretagne entre 1974 et 1994, alors qu’en Nouvelle-Zélande, la prévalence de la maladie a diminué de moitié entre 1983 et 2002. (Cooper et al., 1999; Cundy, 2006) Aussi, en Angleterre, l’incidence a chuté de près de la moitié entre 1990 et 1997. (Van Staa et al., 2002) Bolland et coll. (2007) ont observé que les porteurs d’une mutation du gène SQSTM1 développaient la MOP plus tardivement que le parent porteur de la mutation et que leur maladie était moins sévère que celle du parent porteur. Aussi, des corrélations négatives ont été observées entre l’année de naissance et le taux sérique des phosphatases alcalines, le degré moyen d’extension de la maladie mesuré par scintigraphie osseuse et le nombre d’os atteints, suggérant que les individus plus jeunes souffrent d’une forme moins sévère de la maladie depuis quelques années. (Cundy, 2006)

Étonnamment, ni la prévalence, ni la sévérité de la maladie ne semblent diminuer en Italie. Au contraire, la prévalence de la MOP observée à Turin s’est élevée entre 1986 et 2002. À Sienne, le degré de sévérité de la maladie, déterminé par le nombre d’os atteints ou le degré d’extension de la maladie, est demeuré constant depuis les dernières années. Aussi, une forme sévère de la maladie caractérisée par un début précoce, une atteinte osseuse extensive et un risque plus élevé de dégénérescence tumorale des os atteints en ostéosarcome ou en tumeur à cellule géante est décrite chez les individus pagétiques originaires de la région de la Campanie. (Gennari et al., 2006; Rendina et al., 2006)

12

1.2.4. Présentation clinique La MOP est souvent diagnostiquée fortuitement lorsque des anomalies radiographiques ou scintigraphiques sont apparentes lors de l’investigation d’une autre condition ou lorsque des valeurs élevées de la phosphatase alcaline sérique sont obtenues lors d’un bilan biochimique de base. (Michou et Brown, 2011a) La MOP peut aussi être diagnostiquée lors d’un dépistage effectué chez un individu ayant des antécédents familiaux de MOP. (Falchetti et al., 2010)

Entre 10 et 30 % des personnes atteintes par la MOP sont symptomatiques. (Chung et Van Hul, 2012) Les manifestations les plus communes de la maladie sont la douleur osseuse et les déformations osseuses qui apparaissent tardivement au cours du processus pathologique. (Figure 6) (Lyles et al., 2001)

Figure 6. Déformations osseuses dans la maladie osseuse de Paget

Figures tirées de la Fondation Paget (www.paget.org) et de la collection personnelle du Dr Jacques P. Brown

Les parties du squelette qui sont les plus souvent atteintes sont, par ordre de fréquence, le bassin, le rachis, le crâne, le fémur, le tibia, l’humérus et la clavicule. Rarement, d’autres os, comme ceux formant les extrémités, peuvent être atteints. (Michou et al., 2006) Les complications de la MOP varient en fonction de l’os touché par la maladie. Les déformations osseuses peuvent causer des difficultés à marcher ou favoriser l’apparition précoce d’arthrose. (Michou et al., 2006; Singer, 2009; Theodorou et al., 2011) Malheureusement, les chirurgies impliquant un os pagétique sont particulièrement difficiles dû à l’hypervascularisation de l’os pagétique et aux déformations présentes; les résultats sont souvent décevants en raison de l’accélération de l’ostéolyse suite à l’intervention ou de la survenue d’un descellement de prothèse. (Lyles et al., 2001; Singer, 2009) Certains os, comme le fémur, le tibia et l’humérus sont prédisposés aux fractures pathologiques transverses en bâton de craie dont la guérison est problématique lorsqu’ils sont atteints par la MOP. (Singer,

13 2009; Theodorou et al., 2011) Aussi, l’atteinte de certains os du visage peut entraîner la déformation du visage, la perte de dent ou la malocclusion des mâchoires. (Singer, 2009)

Les os pagétiques sont plus à risque de développer certaines tumeurs osseuses comme les ostéosarcomes et les tumeurs à cellules géantes. (Singer, 2009; Theodorou et al., 2011) La dégénérescence de l’os pagétique en ostéosarcome est une complication grave de la MOP qui survient chez moins de 1 % des patients ayant une atteinte mono ou oligo-ostotique et chez 5 à 10 % des patients ayant une atteinte polyostotique. (Theodorou et al., 2011)

Certaines complications extra-osseuses sont possibles dans la MOP. Des troubles neurologiques, comme des céphalées, des problèmes auditifs, des paralysies de nerfs crâniens, des compressions de racines nerveuses ou une sténose spinale peuvent survenir lorsque le crâne ou une vertèbre sont affectés par la MOP. (Michou et Brown, 2011b; Singer, 2009) Aussi, les individus atteints par la MOP peuvent manifester des complications cardiovasculaires secondaires aux calcifications artérielles ou coronariennes importantes chez les individus pagétiques, ou à l’augmentation du débit cardiaque en raison de l’importante vascularisation dont bénéficient les os pagétiques. (Laroche et Delmotte, 2005; Singer, 2009; Strickberger et al., 1987)

1.2.5. Caractéristiques de l’os et des cellules osseuses pagétiques La MOP est caractérisée par une augmentation focale et couplée du remodelage osseux; la résorption osseuse est accélérée et la formation osseuse est à la fois accélérée et désorganisée. (Ralston, 2008) Habituellement, les lésions ostéolytiques (lésions en V aux os longs, ostéoporose circonscrite au crâne) précèdent les lésions sclérotiques, l’élargissement de l’os et l’épaississement du cortex. (Figure 7) (Michou et Brown, 2011a) La désorganisation de la formation osseuse est responsable de la présence d’os tissé, moins solide que l’os lamellaire qui compose habituellement le tissu osseux des adultes non atteints par la MOP. (Figure 8 et 9) (Chung et Van Hul, 2012) La moelle osseuse d’un os pagétique est parfois fibrosée et envahie par la vascularisation. Comme mentionné plus tôt, la maladie ne se propage pas aux os adjacents. L’atteinte d’autres os après que le diagnostic ait été posé demeure très rare. (Roodman et Windle, 2005)

14

Figure 7. Phases d’évolution du remodelage osseux dans la maladie osseuse de Paget

Figure adaptée de Kumar (2009)

15 Figure 8. Architecture en microscopie optique de l’os sain et de l’os pagétique

a) Os sain lamellaire b) Os pagétique tissé Figures tirées de Roodman (2005)

Figure 9. Architecture en microscopie à balayage de l’os sain et de l’os pagétique

a) Os sain b) Os pagétique

Figures tirées de la Fondation Paget (www.paget.org)

Les ostéoclastes d’individus pagétiques sont plus nombreux, plus volumineux et possèdent plus de noyaux que des ostéoclastes normaux. En effet, ils peuvent contenir jusqu’à 100 noyaux, alors qu’un ostéoclaste normal en contient entre trois et 20. (Figure 10) (Roodman et Windle, 2005) Leur survie serait augmentée dû à un dérèglement du mécanisme de l’apoptose. (Michou et Brown, 2011a) Ces ostéoclastes contiennent parfois des inclusions nucléaires de nature indéterminée qui pourraient correspondre à des nucléocapsides de paramyxovirus ou à des agrégats de protéines non dégradées. (Mills et Singer, 1976; Ralston, 2008; Rebel et al., 1976)

16

Figure 10. Ostéoclaste pagétique hypermultinucléé

a) Ostéoclaste sain multinucléé b) Ostéoclaste pagétique hypermultinucléé

Figures tirées de Roodman (2005)

Les précurseurs d’ostéoclastes pagétiques forment des ostéoclastes en présence de concentrations de

1,25-(OH)2D3 et de RANKL très inférieures à celles nécessaires à la formation d’ostéoclastes à partir de précurseurs normaux. (Neale et al., 2000) Des niveaux plus élevés de TAF12 (anciennement TAFII-17), un coactivateur du récepteur de la vitamine D (VDR) qui augmente la sensibilité du VDR à la 1,25-(OH)2D3, expliquent en partie l’hypersensibilité à la 1,25-(OH)2D3 des précurseurs d’ostéoclastes pagétiques qui expriment la protéine de la nucléocapside du virus de la rougeole selon Kurihara. (Kurihara et al., 2004)

Peu d’études ont porté sur le rôle des ostéoblastes dans le développement de la MOP jusqu’à maintenant. Ces ostéoblastes sont morphologiquement normaux, mais plus nombreux et plus actifs que les ostéoblastes sains. (Roodman et Windle, 2005)

1.2.6. Étiologie

1.2.6.1. Composante environnementale

1.2.6.1.1. Hypothèse virale Il a été suggéré qu’une infection virale chronique pouvait contribuer à la pathogenèse de la MOP. (Mills et Singer, 1976) Des inclusions nucléaires et cytoplasmiques semblables aux nucléocapsides des paramyxovirus ont d’abord été observées dans les ostéoclastes de patients pagétiques grâce à la microscopie électronique. (Rebel et al., 1976) Puis, des transcrits, des protéines et des antigènes appartenant à cette classe de virus ont été identifiés dans des ostéoclastes de patients pagétiques à l’aide de techniques comme

17 l’immunohistochimie, l’hybridation in situ et la réaction en chaîne par polymérase (PCR) in situ. (Roodman, 2010)

Récemment, une équipe a observé que le gène encodant la nucléocapside du virus de la rougeole (MVNP) était exprimé dans la moelle osseuse de huit patients pagétiques sur dix et que tous les précurseurs d’ostéoclastes des patients exprimant le MVNP formaient des ostéoclastes ayant un phénotype pagétique complet. (Kurihara et al., 2011) Étonnamment, les ostéoclastes formés in vivo à partir de précurseurs provenant de patients ayant un phénotype clinique pagétique confirmé, mais dont la moelle n’était pas infectée par le MVNP n’arboraient pas toutes les caractéristiques des ostéoclastes pagétiques (phénotype cellulaire pagétique incomplet). Ces ostéoclastes ne démontraient pas d’hypersensibilité à la 1,25-(OH)2D3, ils n’étaient pas hypermultinucléés et ils ne produisaient pas de plus grandes quantités d’IL-6 que les ostéoclastes sains. Toutefois, leur activité basale était augmentée dû à une hypersensibilité au RANKL. (Kurihara et al., 2011) Une souris transgénique exprimant l’équivalent de la mutation humaine P392L de la protéine p62 (p62P394LKI) et exprimant le gène MVNP dans ses cellules de la lignée ostéoclastique a développé des ostéoclastes ayant un phénotype cellulaire pagétique complet. L’hypersensibilité de ces ostéoclastes au RANKL serait attribuable

à la mutation, alors que la multinucléation, l’hypersensibilité à la 1,25-(OH)2D3, la surexpression de TAF12 et la production accrue d’IL-6 seraient attribuables au MVNP. (Kurihara et al., 2011)

Il a été montré que le virus en cause dans la maladie de Carré, le «canine distemper virus», induisait transitoirement l’ostéoclastogénèse dans les cellules précurseurs en culture, grâce à l’activation de la voie de signalisation du NF-κB. Bien qu’un effet transitoire ne puisse expliquer le développement retardé de la MOP, il a été suggéré que ce virus puisse avoir des effets à long terme sur d’autres protéines surexprimées dans la MOP et qu’il pourrait, de cette façon, lui aussi contribuer à la pathogenèse de la maladie. (Michou et Brown, 2011a) Dans cette optique, il est intéressant de noter qu’en Grande Bretagne, l’incidence de l’infection par la maladie de Carré a diminuée drastiquement grâce à la vaccination débutée en 1950 et que l’arrivée de la vaccination concorde avec le déclin de la prévalence de la maladie dans cette région. (Cooper et al., 1999)

Une association a aussi été observée entre la MOP et les contacts fréquents avec les animaux. Dans l’étude réalisée par Lopez-Abente, les contacts avec les chats, les chiens et les bovins ont été identifiés comme facteurs de risques de développer la maladie chez les Espagnols. (López-Abente et al., 1997) En Italie, une association significative entre la MOP et les contacts, présents ou antérieurs, avec des animaux, a aussi été observée chez les personnes habitant une région rurale. Dans les régions étudiées, le risque de développer la maladie était accru suite aux contacts avec des cochons, des lapins et du bétail. Ces animaux étant rarement vaccinés contre les infections par un paramyxovirus, il a été suggéré qu’ils pouvaient agir comme vecteur d’infections virales. (Gennari et al., 2006)

18

Malgré les différentes observations mentionnées plus haut, le rôle de l’infection virale dans la pathogenèse de la MOP demeure controversé. L’hypothèse selon laquelle la détection de nucléocapsides virales dans les ostéoclastes pagétiques serait attribuable à une contamination des produits de PCR a été soulevée. (Ralston et al., 1997) Une autre hypothèse, selon laquelle la défectuosité des systèmes de l’ubiquitine-protéasome ou de l’autophagie dans la MOP entraînerait une mauvaise dégradation des agrégats de protéines cellulaires qui prennent alors la forme d’inclusions cellulaires, a aussi été soulevée en raison de la non-spécificité des inclusions retrouvées dans la MOP. (Chung et Van Hul, 2012; Helfrich et Hocking, 2008; Ralston, 2008) Des inclusions cellulaires semblables ont été observées dans l’ostéopétrose et dans certaines maladies neurodégénératives, comme la maladie d’Alzheimer, la maladie de Parkinson et la démence à corps de Lewy, ou musculodégénératives, comme la myosite à inclusions. (Chung et Van Hul, 2012; Helfrich et Hocking, 2008) Dans plusieurs de ces maladies impliquant des inclusions cellulaires, des composés impliqués dans la voie de dégradation de l’ubiquitine-protéasome semblent former les inclusions, qui seraient, en fait, des agrégats de protéines destinées à être dégradées. L’agrégation des protéines pourrait survenir en cas de surcharge du système de dégradation dans le but de protéger la cellule des effets néfastes des protéines anormales. Des filaments intermédiaires de confinement près du centrosome de la cellule et une abondance de mitochondries ont été observés autour des inclusions présentes dans la MOP, ce qui est cohérent avec l’idée qu’il s’agisse en fait d’aggrésomes4. (Helfrich et Hocking, 2008) L’implication de virus dans la maladie soulève aussi plusieurs questions. Si ces virus sont en cause, pourquoi la maladie est-elle distribuée de façon aussi restreinte géographiquement alors que ces infections sont communes à travers le monde? Puisque l’infection par ces virus survient habituellement en jeune âge et que la MOP se développe beaucoup plus tardivement, comment expliquer que le virus demeure aussi longtemps dans les ostéoclastes de personnes immunocompétentes? (Cooper et al., 2006) Finalement, de quelle façon l’infection virale peut-elle expliquer l’aspect focal de la maladie? (Roodman, 2010)

Outre l’infection virale, plusieurs facteurs environnementaux pouvant avoir un rôle dans la MOP ont été investigués.

1.2.6.1.2. Alimentation Certains facteurs liés à l’alimentation ont déjà été soupçonnés d’influencer le développement de la MOP. Il a déjà été suggéré qu’une faible consommation de calcium provenant de l’alimentation pendant l’enfance pouvait être associée à un risque accru de développer la MOP. (Siris, 1994) Toutefois, il n’a pas été possible de trouver une association entre une déficience en 1,25-(OH)2D3 et le développement de la maladie. (Chung

4 Aggrésomes : Aggrégats intracellulaires de protéines défectueuses ubiquitinées formés lorsque les mécanismes de dégradation des protéines anormales ou usées (eg : protéasome) sont surchargés. (Johnston et al., 1998; Kopito, 2000)

19 et Van Hul, 2012) En Espagne, une association entre MOP et la consommation fréquente de viande d’agneau ou de chèvre dont la qualité sanitaire n’était pas évaluée préalablement a été observée. Cette observation a entraîné la suggestion selon laquelle un agent infectieux pourrait être transmis via la consommation de viande contaminée. (Piga et al., 1988)

1.2.6.1.3. Substances toxiques Une exposition à des substances toxiques a aussi été suggérée comme facteur de risque de développer la MOP. L’arsenic a été soupçonné de contribuer à la prévalence élevée de la MOP observée dans la région du Lancashire, suite à la détection de concentration élevée d’arsenic dans une source d’eau de cette région. (Bastin et al., 2009; Chung et Van Hul, 2012) Aussi, une association entre la MOP et le tabagisme présent ou antérieur a récemment été observée dans la population française. (Michou et al., 2012) Une surexpression par des cellules épithéliales bronchiques humaines du seul gène dont l’implication dans la MOP est confirmée jusqu’à ce jour, soit le gène SQSTM1, avait déjà été démontrée suite à l’exposition à la fumée de cigarette. (Michou et al., 2012)

1.2.6.2. Composante génétique Les caractéristiques épidémiologiques particulières de la MOP suggèrent que des facteurs génétiques et des facteurs environnementaux influencent le développement de la maladie. (Cooper et al., 1999) Dans environ un tiers des cas, la MOP a un mode de transmission autosomique dominant avec une pénétrance incomplète. (Morales-Piga et al., 1995; Siris et al., 1991) Les personnes ayant un parent du premier degré atteint par la maladie ont sept à dix fois plus de risques de souffrir de MOP. (Siris et al., 1991) Aussi, les individus atteints par une MOP familiale souffrent généralement d’une forme plus précoce et plus sévère de la maladie que les individus atteints « sporadiquement » par la maladie. (Cooper et al., 2006; Gennari et al., 2010)

1.2.6.2.1. Régions chromosomiques liées à la MOP Jusqu’à maintenant, plusieurs régions chromosomiques potentiellement liées à la MOP (PDB1 à PDB7) ont été décrites, ce qui traduit l’hétérogénéité génétique de la maladie. Le locus 5q35-qter (PDB3) est la seule région contenant un gène dont l’implication dans la MOP est confirmée à ce jour, soit le gène SQSTM1 (Laurin et al., 2002, 2001). Les liaisons entre la MOP et les régions 6p21.3 (PDB1) (Tilyard et al., 1982), 18q22.1 (PDB2) (Cody et al., 1997), 5q31 (PDB4) (Laurin et al., 2001), 2q36 (PDB5) (Hocking et al., 2001), 10p13 (PDB6) (Hocking et al., 2001) et 18q23 (PDB7) (Good et al., 2002), n’ont pas été répliquées lors d’études subséquentes ou n’ont pas permis d’identifier d’autres gènes directement impliqués dans la MOP. (Michou et Brown, 2011b) Certaines de ces liaisons découlent probablement de résultats faussement positifs, alors que d’autres peuvent traduire la présence de gènes modificateurs de l’effet de SQSTM1. (Ralston, 2008)

20

1.2.6.2.2. Mutations du gène SQSTM1 La protéine p62, encodée par le gène SQSTM1, est composée de 440 acides aminés et comporte neuf domaines, dont un domaine associé à l’ubiquitine (UBA). (Figure 11) Elle est notamment impliquée dans l’autophagie et l’apoptose. Elle agit aussi en tant que protéine d’échafaudage dans l’activation de la voie de signalisation du NF-κB. (Chung et Van Hul, 2012)

Figure 11. Domaines de la protéine SQSTM1

Figure tirée de Chung (2011)

Le rôle du gène SQSTM1 dans la MOP a été découvert grâce à une étude de liaison génétique pangénomique de trois grandes familles québécoises. Un haplotype commun ségréguant avec la maladie, situé au locus 5q35, a été découvert dans deux de ces trois familles. Le génotypage de marqueurs microsatellites a permis de cibler une région de 300 kb, contenant les gènes SQSTM1 et MAPK9. Le séquençage d’un échantillon de découverte composé de quelques cas et contrôles a permis d’identifier la première mutation du gène SQSTM1, soit la mutation P392L, chez tous les individus atteints possédant l’haplotype initialement lié avec la maladie. (Laurin et al., 2001, 2002) Cette mutation entraîne la substitution d’une proline appartenant au domaine UBA, en leucine en position 392 de la protéine (P392L), dû au changement d’un nucléotide cytosine en thymine en position 1215 du gène au sein du huitième exon. (Laurin et al., 2002) Selon la composition des chaînes d’ubiquitine qu’il lie, le domaine UBA permet l’activation de la voie de signalisation du NF-κB, ou la dégradation programmée des protéines par le protéasome 26S. (Chung et Van Hul, 2012) La mutation P392L a été identifiée dans 46 % des cas familiaux et 16 % des cas atteints de MOP non apparentés dans la population canadienne-française. (Laurin et al., 2002) Dans une étude portant principalement sur des individus d’origine britannique, la majorité des porteurs de la mutation P392L possédait un même haplotype dans la région 5q35-qter, et ce indépendamment de la présence d’une histoire familiale positive. Cette observation suggère que la mutation P392L est une mutation ancestrale dans cette population. (Lucas et al., 2005)

Plusieurs autres mutations du gène SQSTM1 ont été identifiées chez des individus atteints par la MOP. Jusqu’à maintenant, près de 30 mutations du gène SQSTM1 ont été rapportées dans plusieurs populations; la grande majorité de ces mutations sont situées dans le domaine UBA et induisent une augmentation de l’activité de la voie de signalisation du NF-κB. Près du tiers des patients souffrant d’une forme familiale de MOP et environ 10 % des cas sporadiques sont porteurs d’une mutation de SQSTM1. (Chung et Van Hul, 2012) La pénétrance de ces mutations atteindrait jusqu’à 80% chez les personnes de plus de 70 ans.

21 (Morissette et al., 2006) Il a été observé que les individus porteurs d’une mutation du gène SQSTM1 développaient généralement une forme plus sévère de la maladie. La maladie débute à un plus jeune âge et atteint un plus grand nombre d’os chez ces individus. (Gennari et al., 2010; Michou et al., 2012, 2011) La maladie est aussi plus sévère chez les individus possédant une mutation menant à la formation de protéines tronquées (mutation stop) que chez les individus possédant une mutation entraînant la modification d’un acide aminé (mutation faux-sens). (Chung et Van Hul, 2012) Malgré tout, il existe une grande variabilité de la sévérité du phénotype entre les individus d’une même famille possédant la même mutation. Cette variabilité demeure inexpliquée, mais suggère l’implication d’autres facteurs, génétiques ou environnementaux, dans la pathogenèse de la maladie. (Chung et Van Hul, 2012)

Des études in vitro et in vivo ont été effectuées afin d’élucider le rôle de la protéine p62 dans la pathogenèse de la MOP. Duran et coll. (2004) ont observé que l’ostéoclastogenèse, et l’activation de la voie du NF-κB de souris pour lesquelles le gène SQSTM1 a été invalidé (SQSTM1-/-) étaient altérées, ce qui confirme l’importance de cette protéine dans le métabolisme osseux. Par contre, le rôle de la mutation P392L dans la MOP n’a pas encore été clairement établi. Kurihara et coll. (2007, 2011) n’ont observé aucune lésion osseuse semblable aux lésions pagétiques au niveau des vertèbres lombaires de souris exprimant l’équivalent murin de la mutation P392L sous le contrôle du promoteur TRAP. Les cellules précurseurs d’ostéoclastes exprimant cette mutation ne parvenaient pas non plus à former des ostéoclastes aux caractéristiques pagétiques complètes. En effet, les précurseurs étaient hypersensibles à RANKL, mais pas à la 1,25-(OH)2D3 et ils ne sécrétaient pas d’IL-6 ou de TAF12 en grande quantité. Suite à l’obtention de ces résultats, il a été suggéré que cette mutation pouvait prédisposer à développer la maladie en augmentant la sensibilité des précurseurs des ostéoclastes aux cytokines ostéoclastogénique ou au microenvironnement osseux, mais qu’elle n’était pas suffisante pour causer la MOP. Toutefois, Daroszewska et coll. (2011) ont observé des lésions osseuses focales ayant des composantes d’ostéolyse et d’ostéosclérose chez des souris transgéniques possédant la mutation P394L. Les ostéoclastes des souris mutés étaient plus nombreux et possédaient plus de noyaux que ceux des souris sauvages. De plus, certains ostéoclastes présentaient des inclusions semblables à celles retrouvées dans la MOP. Ces résultats contredisent ceux de Kurihara et coll. (2007, 2011) et suggèrent que cette mutation pourrait s’avérer suffisante pour causer le développement de la maladie. Le fait que des os différents aient été étudiés et que des appareils différents aient été utilisés pour déterminer la présence ou l’absence de lésions osseuses pourrait expliquer les conclusions différentes auxquelles sont arrivées les deux études. Des études supplémentaires seront nécessaires pour faire la lumière sur le rôle exact de la mutation P392L dans le développement de la MOP.

22

1.2.6.2.3. Gènes impliqués dans les maladies apparentées à la MOP Les maladies osseuses rares apparentées à la MOP sur certains points sont des modèles intéressants pour tenter d’élucider la pathogenèse de la maladie. Plusieurs de ces maladies osseuses rares sont causées par des mutations des gènes TNFSF11A et TNFSF11B qui encodent respectivement les protéines RANK et OPG. (Chung et Van Hul, 2012) L’ostéolyse expansive familiale, l’hyperphosphatémie squelettique expansive et la maladie de Paget juvénile causent entre autres des lésions ostéolytiques focales, de la surdité et des anomalies dentaires. Des mutations du gène TNFRSF11A, situé au locus 18q22.1 (région PDB2), encodant le récepteur RANK, sont en cause dans ces trois maladies. (Michou et Brown, 2011a; Ralston et Albagha, 2011) Aucune mutation causale de ce gène n’a été rapportée dans la MOP, mais des polymorphismes semblent augmenter la susceptibilité d’individus à développer la maladie. (Albagha et al., 2010; Chung et al., 2010b) La maladie de Paget juvénile, une maladie sévère qui débute pendant l’enfance ou l’adolescence est caractérisée par un remodelage osseux anormal et des déformations osseuses. (Ralston et Albagha, 2011) Des mutations du gène TNFRSF11B qui entraînent une perte de fonction de l’ostéoprotégérine (OPG) sont responsables de cette maladie. (Ralston et Albagha, 2011) Comme pour le gène TNFRSF11A, aucune mutation de ce gène n’a été identifiée dans la MOP classique, mais des polymorphismes spécifiques aux femmes prédisposant à la MOP ont été identifiés. (Beyens et al., 2007; Ralston et Albagha, 2011)

Des mutations qui affectent le domaine liant l’ubiquitine de la protéine VCP, impliquée dans le transport vésiculaire, sont responsables du syndrome Myopathie à Inclusions – Maladie de Paget – Démence Fronto- Temporale (IBMPFD), suggérant que l’altération de la dégradation de protéines peut entraîner la présence d’inclusions cellulaires. (Watts et al., 2004) Des mutations du gène VCP ne sont pas en cause dans la MOP classique, mais des polymorphismes de ce gène pourraient augmenter la susceptibilité d’individus à développer cette maladie. En effet, une association entre la MOP et un variant commun du gène VCP a été observée dans la population belge. (Chung et Van Hul, 2012) Toutefois, aucune association n’a été observée entre ce gène et la MOP dans la population britannique. (Lucas et al., 2006)

Récemment, deux études pangénomiques d’association (GWAS) menées sur des individus pagétiques non porteurs d’une mutation du gène SQSTM1 appartenant principalement aux populations britannique, belge et néerlandaise ont permis d’identifier sept locus de susceptibilité à la MOP. (Tableau ) (Albagha et al., 2011, 2010; Chung et al., 2010a) Selon Albagha et coll. (2011), 86% des cas de MOP seraient expliqués par ces sept loci de susceptibilité à la MOP, ce qui suggère que peu de gènes ayant un effet de taille élevé sont impliqués dans la maladie.

23 Tableau 1. Loci associés à la MOP via deux études pangénomiques d’association

Gène(s) à proximité du Loci Fonction variant associé CSF1 Ostéoclastogénèse 1p13 EPS8L3 Fonction inconnue

7q33* NUP205 Transport de protéines entre le cytoplasme et le noyau

8q22 TM7SF4 (DC-STAMP) Multinucléation des ostéoclastes

10p13ƚ OPTN Régulation négative de la voie du NF-κB

14q32* RIN3 Transport vésiculaire

PML Voie du TGF-β 15q24* GOLGA6A Golgine (Interaction avec l’appareil de Golgi)

18q21 ƚ TNFRSF11A (RANK) Activation des ostéoclastes

* : Loci publiés après le début du projet ƚ : Loci précédemment liés à la MOP via des études de liaison

Une première étude pangénomique d’association, portant principalement sur des individus d’origine britannique, a permis d’identifier des associations génétiques entre la MOP et six variants communs des loci 1p13, 10p13 et 18q21. (Albagha et al., 2010) Trois de ces variants communs sont situés au locus 1p13 (rs484595, rs499345, rs10494112), dans un bloc de déséquilibre de liaison couvrant 14 kb. Le gène EPS8L3, dont la fonction est inconnue jusqu’à maintenant, se trouve à 47 kb en aval du bloc de déséquilibre de liaison et en est séparé par deux points chauds de recombinaison. Le gène CSF1, qui encode le facteur stimulateur de colonies de macrophages (M-CSF) se trouve à 87 kb en amont du bloc de déséquilibre de liaison. Le M- CSF est impliqué dans l’ostéoclastogénèse et dans la survie des ostéoclastes. Le développement d’un phénotype ostéopétrotique a été observé chez des souris possédant une mutation causant une perte de fonction du gène Csf1. (Albagha et al., 2010; Van Wesenbeeck et al., 2002) Un seul variant commun associé à la MOP a été identifié au locus 10p13 (rs1561570). Cette région, qui avait déjà été liée à la MOP familiale par Hocking et coll. (2001), contient un seul gène connu, soit le gène optineurine (OPTN). Jusqu’à ce jour, aucune implication du gène OPTN dans la régulation du métabolisme osseux n’a été rapportée. Toutefois, la protéine encodée régulerait négativement l’activation de la voie de signalisation du NF-κB induite par le TNF- . (Zhu et al., 2007) Les deux derniers variants communs (rs2957128 et rs3018362) associés à la MOP lors

24

de cette étude sont localisés dans deux blocs de déséquilibre de liaison adjacent de la région 18q21, à 5 kb en amont du gène TNFRSF11A qui encode RANK. Tel qu’expliqué précédemment, RANK joue un rôle primordial dans la régulation du remodelage osseux en activant les ostéoclastes. Le rôle important de RANK dans le remodelage osseux est démontré par la présence de mutations du gène RANK dans plusieurs maladies osseuses.

Les variants communs associés à la MOP dans cette première étude pangénomique d’association ont été répliqués dans les populations belge et néerlandaise, en plus de permettre de confirmer une association entre la MOP et le locus 8q22, ce locus ayant été détecté dans la première étude pangénomique d’association mais faiblement associé à la MOP. (Chung et al., 2010a) Le variant commun associé à la MOP (rs2458413) se trouve dans un bloc de déséquilibre de liaison de 18 kb qui couvre entièrement le gène TM7SF4. Le gène TM7SF4 encode la protéine transmembranaire spécifique aux cellules dendritiques (DC-STAMP). (Albagha et al., 2011; Chung et al., 2010a) Yagi et coll. (2005) ont observé que des souris déficientes en DC-STAMP avaient une masse osseuse et une densité minérale osseuse augmentées en raison d’une résorption osseuse inefficace due à l’absence d’ostéoclastes multinucléés. Tel que mentionné précédemment, les ostéoclastes des individus pagétiques sont hypermultinucléés, ce qui suggère qu’un gain de fonction du gène TM7SF4 pourrait être impliqué dans la pathogenèse de la maladie.

Une deuxième étude pangénomique d’association, publiée après le début du présent projet, a mené à l’identification de trois autres loci de susceptibilité, soit les loci 7q33 (rs4294134), 14q32 (rs10498635) et 15q24 (rs5742915), en plus de confirmer l’association entre la MOP et le locus 8q22. (Albagha et al., 2011) Aucun de ces loci ne contient de gènes ayant un rôle connu dans la régulation du métabolisme osseux. La région associée à la MOP au sein du locus 7q33 couvre une distance de 350 kb. Le variant commun pour lequel une association avec la MOP a été identifiée se trouve dans un intron du gène NUP205 qui est impliqué dans la régulation du transport de protéines entre le cytoplasme et le noyau. La région associée à la MOP au sein du locus 14q32 couvre 62 kb et est entourée par deux points chauds de recombinaison. Elle contient le gène RIN3 qui encode une protéine impliquée dans le transport vésiculaire. La région associée à la MOP au sein du locus 15q24 couvre environ 200 kb et est aussi entourée par deux points chauds de recombinaison. Le variant commun de ce locus pour lequel une association a été observée est situé dans le gène PML (promyelocytic leukemia) impliqué dans la voie de signalisation du TGF-β. Le gène GOLGA6A, qui encode une protéine appartenant à la famille des golgines, se situe aussi dans la région associée à la MOP. Des mutations d’autres golgines sont en cause dans deux maladies osseuses rares, soit la dysplasie squelettique létale et la gérodermie ostéodysplasique. (Hennies et al., 2008; Smits et al., 2010)

25 Albagha et coll. (2011) ont observé que le risque de développer la MOP augmentait avec le nombre d’allèles à risque portés par un individu pour chacun des sept loci décrits ci-dessus et associés à la MOP. Les individus appartenant au dernier décile (90e au 100e percentile) en ce qui concerne le nombre d’allèles à risque portés avaient environ dix fois plus de risque de développer la MOP que les individus appartenant au premier décile (1er au 10e percentile) quant au nombre d’allèles à risque présents. Aucune évidence d’interaction n’a été observée entre ces sept loci associés à la MOP. Les effets fonctionnels de ces variants communs dans la MOP sont inconnus à ce jour.

26

2. HYPOTHÈSES ET OBJECTIFS

Puisque des variants génétiques rares peuvent expliquer une association génétique entre une maladie et un variant commun et que de tels variants peuvent avoir des répercussions fonctionnelles sur le gène ou sur la protéine dans lequel ils se trouvent, l’hypothèse de recherche stipule que des variants génétiques rares situés aux loci 1p13 et 8q22 pourraient jouer un rôle dans la susceptibilité génétique à la MOP.

Les deux objectifs préliminaires de cette étude consistaient à 1) répliquer les associations génétiques observées entre la MOP et les loci 1p13 et 8q22 dans la population canadienne-française et à 2) rechercher des corrélations entre le génotype et le phénotype observé.

L’objectif principal du projet était d’identifier des variants génétiques rares au sein des gènes candidats à la MOP situés dans une région de 500 kb de part et d’autre de CSF1 (1p13) et de 1 Mb de part et d’autre de TM7SF4 (DC-STAMP) (8q22).

Les objectifs secondaires du projet étaient :

 d’identifier une association génétique entre la MOP et un ou plusieurs variants rares identifiés dans la population canadienne-française,

 de mettre au point une méthode efficace pour l’exploration du rôle prédit in silico des variants génétiques rares dans la susceptibilité génétique à cette maladie.

27

28

3. INDIVIDUS ET MÉTHODES

3.1. INDIVIDUS Tous les individus ont signé, après information, un formulaire de consentement avant leur participation au projet. Le projet de recherche a été approuvé par le comité d’éthique de la recherche du Centre Hospitalier de l’Université Laval (CHUL). Tous les individus sélectionnés pour ce projet ont été examinés par le Dr Jacques Brown ou la Dre Laëtitia Michou, rhumatologues au CHUQ (Québec). Une évaluation complète de l’état osseux, incluant la mesure du taux sérique des phosphatases alcalines totales sériques, des radiographies standard du bassin et du crâne et une scintigraphie osseuse pancorporelle, a été effectuée pour chaque individu. Les critères qui ont été utilisés pour diagnostiquer la MOP comprenaient 1) un aspect typique de MOP aux radiographies osseuses et/ou 2) une scintigraphie osseuse pancorporelle anormale. L’élévation du taux sérique des phosphatases alcalines totales n’était ni suffisante ni nécessaire pour poser le diagnostic de MOP. Des canadiens-français atteints de formes familiales de la MOP et des individus atteints non apparentés ont été étudiés. Les individus sains étudiés étaient aussi d’origine canadienne-française. L’ADN de chaque individu a été extrait par une procédure standard à partir des leucocytes provenant d’un échantillon de sang périphérique prélevé par ponction veineuse dans des tubes héparinés.

3.2. RÉPLICATION DE L’ASSOCIATION GÉNÉTIQUE DES LOCI 1p13 ET 8q22 AVEC LA MOP DANS LA POPULATION CANADIENNE-FRANÇAISE Afin de s’assurer que les associations génétiques observées par Chung, 2010 et/ou Albagha, 2010 étaient aussi présentes au sein de notre cohorte, le génotypage des variants communs rs484959, rs499345, rs10494112 (locus 1p13) et rs2458413 (locus 8q22) a été effectué. La Plateforme de séquençage et de génotypage des génomes du centre de recherche du CHUL (CHUQ) a utilisé le Sequenom, une technique de génotypage à haut débit en spectrométrie de masse, pour génotyper l’échantillon indépendant composé de 275 individus souffrant de MOP et de 297 individus sains. Deux groupes de personnes atteintes par la MOP ont été formés pour effectuer les analyses; le groupe « Paget Total » comprenait les 275 individus génotypés souffrant de MOP, alors que le sous-groupe « Paget Non-Mutés » comportait les 240 individus pagétiques non porteurs de la mutation SQSTM1/P392L. Les analyses ont été effectuées à partir des données brutes de génotypage. Un contrôle de la qualité de ces données brutes a été effectué en dupliquant certains échantillons sélectionnés au hasard.

3.3. SÉLECTION DES GÈNES CANDIDATS Tous les gènes situés dans un intervalle de 0,5 Mb en aval ou en amont de CSF1 (locus 1p13) et tous les gènes situés dans un intervalle de 1Mb de part et d’autre du gène TM7SF4 (DC-STAMP) (locus 8q22) ont été

29 répertoriés grâce à GeneLoc (http://genecards.weizmann.ac.il/ geneloc/index.shtml). La différence de taille des intervalles génomiques considérés s’explique par la faible densité génique du locus 8q22. Les bases de données EntrezGene (http://www.ncbi.nlm.nih.gov/gene/), GENATLAS (http://www.genatlas.org/), GeneCards (http://www.genecards.org/), Online Mendelian Inheritance in Man (OMIM) (http://www.ncbi.nlm.nih.gov/omim/), UniProtKB (http://www.uniprot.org/help/uniprotkb) et WikiGenes (http://www.wikigenes.org/) ont été consultées afin de connaître les cellules et les tissus dans lesquels ces gènes sont exprimés, les voies de signalisation auxquelles ils participent, ainsi que les conditions pathologiques associées à des anomalies de ces gènes ou des protéines encodées. Certains gènes ont été sélectionnés d’emblée en fonction de leur position. C’est le cas des gènes situés à proximité des variants communs associés à la MOP rs484959 (1p13), rs499345 (1p13), rs10494112 (1p13) et rs2458413 (8q22). Les autres gènes étudiés dans le projet ont été choisis en raison de leur rôle potentiel dans la pathogenèse de la MOP en raison de leurs fonctions connues. Les gènes exprimés par les cellules osseuses ou leurs précurseurs, les gènes impliqués dans une des voies de signalisation parmi celles du NF-κB, de Wnt, ou de l’ubiquitine-protéasome, et les gènes qui participent à l’autophagie ou à l’apoptose ont été sélectionnés. Les gènes impliqués dans la pathogénie d’autres maladies osseuses et les gènes pour lesquels un modèle animal a démontré un effet de la suppression ou de la surexpression du gène sur la régulation du tissu osseux ont aussi été choisis. Les gènes impliqués dans la détoxification des composés contenus dans le tabac ou la fumée de cigarette ont aussi été inclus dans l’étude, puisqu’une association entre la MOP et le tabagisme a récemment été observée dans la population française. (Michou et al., 2012)

3.4. RECHERCHE DE VARIANTS RARES DANS LES GÈNES CANDIDATS SÉLECTIONNÉS Les variants rares ont été recherchés dans un «échantillon de découverte» qui comportait 32 patients souffrant d’une forme familiale de la MOP, chaque individu appartenant à une famille différente afin d’éviter tout biais d’apparentement et 4 individus sains de la population canadienne-française. Tous les exons codants, les jonctions exon-intron, les régions 5’ non traduites et les régions 3’ non traduites contenant les régions régulatrices des gènes sélectionnés ont été séquencés.

30

Les fragments de gènes étudiés ont d’abord été amplifiés par une réaction en chaîne par polymérase (PCR). Les amorces d’oligonucléotides ont été conçues à l’aide du programme Primer3 (http://biotools.umassmed.edu/bioapps/primer3_www.cgi), à partir des séquences de références provenant de RefSeq (http://www.ncbi.nlm.nih.gov/RefSeq) des gènes sélectionnés. Les numéros d’accès RefSeq, les amorces, le mélange réactionnel et les températures d’élongation utilisés sont décrits à l’annexe A. La taille des produits de PCR a été vérifiée par électrophorèse sur gel d’agarose. Les produits d’amplification correspondant à la taille attendue ont été purifiés. Les deux brins ont été séquencés à la Plateforme de séquençage et de génotypage des génomes du centre de recherche du CHUL (CHUQ) avec les terminateurs d’élongation Big Dye Deoxy Terminator v 3.1 cycle (Applied Biosystems) sur un séquenceur ABI 3730xl.

Les séquences d’ADN obtenues ont été analysées avec la version 2.0.0b8 du logiciel STADEN en comparaison avec les séquences de références. (Staden, 1996) Les chromatogrammes de toutes les variations par rapport aux séquences de références ont été vérifiés visuellement.

Tous les variants identifiés chez au moins un individu pour lesquels la fréquence de l’allèle mineur (MAF) était inférieure à 5 % (0,05) selon la base de données EntrezSNP (http://www.ncbi.nlm.nih.gov/gene) ont été considérés comme des variants rares. Cette valeur seuil a été retenue en considérant l’incapacité des études pangénomiques d’association d’identifier des associations entre des maladies et des variants dont les MAF sont inférieures à 5 %. (Bodmer et Bonilla, 2008) Les variants pour lesquels la MAF n’était pas disponible dans EntrezSNP, ainsi que les variants non répertoriés dans EntrezSNP ont aussi été aussi considérés comme des variants rares.

Un code d’identification propre au projet de recherche a été attribué à tous les variants génétiques observés au cours de l’étude. Ce code est composé du nom du gène dans lequel le variant a été découvert et d’un numéro, lorsqu’il s’agit d’un variant rare, ou d’une lettre, lorsqu’il s’agit d’un variant commun.

3.5. CARACTÉRISATION IN SILICO DES VARIANTS GÉNÉTIQUES Les prédictions in silico de PolyPhen (http://genetics.bwh.harvard.edu/pph2), SIFT (http://sift.jcvi.org) et Condel (http://bg.upf.edu/condel/home) ont été obtenues pour tous les variants qui modifiaient un acide aminé, afin de déterminer si la modification de l’acide aminé était susceptible d’influencer la fonction de la protéine encodée. Le type de changement d’acide aminé (radical versus conservateur) a été déterminé en fonction des critères énoncés par Zhang (2000), selon lesquels un changement est considéré comme radical si l’acide aminé de remplacement n’a pas la même charge, la même polarité ou une taille semblable à l’acide aminé original. La conservation des acides aminés à travers l’évolution a été évaluée grâce à HomoloGene (http://www.ncbi.nlm.nih.gov/homologene). Les domaines connus des protéines encodées par les gènes

31 étudiés ont été répertoriés grâce aux bases de données UniProtKB (http://www.uniprot.org/help/uniprotkb) et Pfam (http://pfam.sanger.ac.uk).

L’altération de site d’épissage ou de points de branchement par des variants rares a été évaluée avec l’outil de prédiction Human Splicing Finder (http://www.umd.be/HSF). L’effet de l’ajout ou de la suppression de sites de liaisons à des facteurs de transcription jouant un rôle dans la régulation du tissu osseux (annexe B) a été évalué grâce aux outils de prédiction TFSEARCH (http://www.cbrc.jp/research/db/TFSEARCH.html) et ConSite (http://asp.ii.uib.no:8090/cgi-bin/CONSITE/consite). L’altération de site de fixation de microARN par des variants rares a été évaluée grâce à Ensembl64 (http://useast.ensembl.org/index.html) et à MicroCosm Targets (http://www.ebi.ac.uk/enright-srv/ microcosm/htdocs/targets/v5).

3.6. ÉTUDE DE SÉGRÉGATION INTRA-FAMILIALE Suite au séquençage de l’échantillon de découverte, certains variants identifiés chez des individus pagétiques ont été sélectionnés pour vérifier s’ils ségréguaient ou non avec la maladie dans les familles. Les variants rares qui modifiaient un acide aminé ou ceux qui semblaient plus spécifiques à la MOP, soit les variants rares retrouvés chez plus de cinq individus atteints par la MOP, ont été sélectionnés. Des variants rares qui altéraient un point de branchement, un site de fixation à un facteur de transcription ayant un rôle connu dans la régulation de l’os ou un site de fixation de micro-ARN ont été sélectionnés au hasard afin de tenter d’établir l’impact de ces modifications sur la fonction des gènes étudiés. Les variants rares identifiés uniquement chez des individus sains n’ont pas été investigués davantage.

Pour que l’étude de la ségrégation intra-familiale soit effectuée, les variants sélectionnés devaient avoir été identifiés chez des individus provenant de familles informatives au plan génétique. Les familles dites informatives comportaient au moins un autre individu atteint par la MOP et au moins un individu non atteint pour lequel l’absence de la MOP avait été confirmée après l’âge de 40 ans par une scintigraphie osseuse normale, des radiographies du crâne et du bassin normales, ainsi que des niveaux sériques de phosphatases alcalines totales normaux. Des échantillons de l’ADN de ces individus devaient être disponibles.

Pour chaque variant sélectionné, un maximum de quatre familles a été étudié. Dans chaque famille, le séquençage du fragment d’ADN dans lequel le variant a été identifié initialement a été effectué pour un maximum de trois individus apparentés atteints par la MOP et de trois individus apparentés sains.

3.7. ÉTUDE D’ASSOCIATION GÉNÉTIQUE CAS-TÉMOINS Parmi les variants rares retenus pour l’étude de la ségrégation familiale, cinq ont été sélectionnés pour l’étude d’association génétique de type cas-témoins. Les variants rares sélectionnés étaient présents uniquement chez des individus de l’échantillon de découverte atteints par la MOP, en plus de respecter l’un des trois

32

critères suivants: 1) le variant entraîne la modification d’un acide aminé prédite comme étant dommageable par deux outils d’analyse in silico parmi PolyPhen, SIFT et Condel, 2) le variant a été identifié chez plus de cinq individus atteints par la MOP dans l’échantillon de découverte ou 3) l’absence de ségrégation familiale du variant n’a pu être confirmée. La figure 12 résume les étapes ayant menées à la sélection des variants choisis pour l’étude d’association.

Le génotypage des variants sélectionnés pour l’étude d’association cas-témoins a été effectué à la Plateforme de séquençage et de génotypage des génomes du centre de recherche du CHUL (CHUQ). Le Sequenom, une technique de génotypage à haut débit en spectrométrie de masse, a été utilisé pour génotyper l’échantillon indépendant composé de 275 patients souffrant de MOP appartenant à la population canadienne-française et de 297 individus sains de la même population. Les données brutes de génotypage ont été analysées. Puisque les deux études pangénomiques d’association ayant identifié les locus de susceptibilité à la MOP 1p13 et 8q22 ont été menées sur des individus pagétiques non porteurs d’une mutation du gène SQSTM1, deux groupes de personnes atteintes par la MOP ont été formés pour effectuer les analyses; le groupe « Paget Total » comprenait les 267 individus génotypés souffrant de la MOP, alors que le sous-groupe « Paget Non- Mutés » comportait 231 individus atteints par la MOP, mais non porteurs de la mutation SQSTM1/P392L.

3.8. ANALYSES STATISTIQUES Le respect de l’équilibre de Hardy-Weinberg5 chez les témoins a été vérifié par un test du chi carré de conformité pour tous les variants sélectionnés pour l’étude d’association génétique. Les variants communs ou les variants rares qui ne respectaient pas cet équilibre ont été rejetés de l’étude d’association.

La puissance de notre échantillon cas-témoins pour détecter une association génétique significative avec un risque relatif ≥ 1,5, est de 85% dans un modèle génétique additif avec une fréquence de l’allèle à risque de 0.25, d’après l’exécutable Quanto 1.2.4. (http://hydra.usc.edu/GxE)

5 Équilibre d’Hardy-Weinberg : Dans une grande population, la fréquence des génotypes reste constante d'une génération à l'autre lorsqu’il y a absence de sélection, de mutation et de migration. Lors d’une étude d’association, le non-respect de cet équilibre chez des témoins appartenant à la même population que les cas soulève la possibilité qu’une erreur soit survenue lors du génotypage des échantillons d’ADN. (Andrews, 2010; Saadat, 2011)

33

Figure 12. Étapes décisionnelles pour la sélection des variants génétiques à étudier

34 34

La comparaison des fréquences d’allèles mineurs a comporté un test d’homogénéité du chi carré à un (1) degré de liberté, le calcul du risque relatif selon Haldane et le calcul de l’intervalle de confiance à 95 %. (Haldane, 1956) La comparaison de la distribution globale des génotypes a comporté un test d’homogénéité du chi carré à deux degrés de liberté ou un test exact de Fisher si un des effectifs était inférieur à cinq. Les risques relatifs de chaque génotype selon Lathrop ont été calculés pour les variants communs et les variants rares ayant obtenu une valeur p significative (p < 0,05) aux tests de comparaison des fréquences alléliques ou de la distribution globale des génotypes. (Lathrop, 1983)

La présence d’association génotype – phénotype a été recherchée pour les génotypes dont la valeur p du risque relatif génotypique demeurait sous le seuil de la significativité (p < 0,05). Lorsque deux génotypes obtenaient une valeur p inférieure à 0,05, la présence d’association génotype-phénotype a été étudiée pour le génotype ayant la plus faible valeur p. Selon la taille des effectifs à comparer, des tests d’homogénéité du chi carré ou des tests exacts de Fisher ont été exécutés pour vérifier la présence d’association entre le génotype et le sexe, la présence de la mutation SQSTM1/P392L et le type de MOP (monostotique vs polyostotique). Selon la taille de l’effectif, le risque relatif selon Haldane ou le rapport de cotes a été mesuré, ainsi que l’intervalle de confiance à 95 % correspondant. Des tests t de Student ont été utilisés pour effectuer les comparaisons entre le génotype et les variables continues suivantes: l’âge moyen au diagnostic, le niveau sérique des phosphatases alcalines totales au diagnostic, le nombre d’os atteints et l’indice de Rénier. (Rénier et al., 1995) Une valeur p inférieure à 0,05 a été considérée significative pour tous les tests statistiques effectués. Aucune correction n’a été effectuée pour pallier à la multiplicité des tests effectués. En effet, dans ce genre d’étude exploratoire, l’utilisation de tels ajustements n’est pas nécessaire puisque le choix des variables à comparer dans l’étude d’association génotype-phénotype est basé sur des hypothèses préétablies; les variables examinées ont de fortes chances d’être influencées par des génotypes associés à la maladie. De plus, le risque d’accepter l’hypothèse nulle alors qu’elle est fausse est augmenté par un tel ajustement. Or, à ce stade, une telle erreur est plus nuisible que le rejet de l’hypothèse nulle alors qu’elle est vraie. (Perneger, 1998; Rothman, 1990)

35

36

4. RÉSULTATS

4.1. ÉTUDE DE RÉPLICATION DES ASSOCIATIONS GÉNÉTIQUES ENTRE LA MOP ET LES LOCI 1p13 ET 8q22 DANS LA POPULATION CANADIENNE-FRANÇAISE ET RECHERCHE D‘ASSOCIATION GÉNOTYPE - PHÉNOTYPE Les associations génétiques observées par Chung (2010) et Albagha (2010) de la MOP avec les loci 1p13 et 8q22 ont été répliquées dans la population canadienne-française. (Tableau )

Les quatre variants communs génotypés, soit rs484959, rs499345, rs10494112 (locus 1p13) et rs2458413 (locus 8q22), respectaient tous l’équilibre d’Hardy-Weinberg chez les témoins (résultats non montrés).

Dans le groupe Paget Total et le sous-groupe Paget Non-Mutés, les fréquences alléliques et les distributions génotypiques des trois variants communs du locus 1p13 différaient de façon significative entre les individus atteints par la MOP et les témoins. (Tableau a) Pour le variant commun situé au locus 8q22, seule la distribution génotypique différait entre les individus atteints par la MOP et les témoins. (Tableau b)

37

38

Tableau 2. Réplication de l’association génétique des loci 1p13 et 8q22 avec la MOP dans la population canadienne-française

a) Vérification de l’association allélique Groupe Paget TOTAL Sous-Groupe Paget NON-MUTÉS

Fréquence de l'allèle Fréquence de l'allèle Gènes à p p Chr Variants mineur RR [ IC 95 % ] mineur RR [ IC 95 % ] proximité non corrigée non corrigée Atteints Témoins Atteints Témoins (Na=550) (Na=594) (Na=480) (Na=594) 1 CSF1, EPS8L3 rs484959 G>A 0,31 0,42 0,00012 0,62 [0,49 - 0,79] 0,31 0,42 6,93x10-5 0,60 [0,47 - 0,77]

1 CSF1, EPS8L3 rs499345 C>A 0,41 0,33 0,0048 1,41 [1,11 - 1,80] 0,42 0,33 0,0019 1,48 [1,15 - 1,90]

1 CSF1, EPS8L3 rs10494112 A>G 0,29 0,22 0,0033 1,49 [1,14 - 1,95] 0,31 0,22 0,00069 1,61 [1,22 - 2,11]

8 TM7SF4 rs2458413 G>A 0,60 0,57 0,46 1,09 [0,86 - 1,39] 0,60 0,57 0,47 1,09 [0,86 - 1,40]

Na : Nombre total d’allèles disponibles dans la cohorte. Le nombre réel d’allèles génotypés avec succès peut être inférieur.

b) Vérification de l’association génotypique (interclasse)

p non corrigée p non corrigée Sous-groupe Groupe Paget Paget Paget Témoins Gènes à Paget TOTAL TOTAL NON MUTÉS Chr Variants NON MUTÉS proximité versus témoins versus témoins 1/1 1/2 2/2 1/1 1/2 2/2 1/1 1/2 2/2

1 CSF1, EPS8L3 rs484959 G>A 21 131 123 16 115 109 48 156 93 0,00032 0,00015

1 CSF1, EPS8L3 rs499345 C>A 37 149 88 33 134 72 29 136 132 0,0089 0,0028

1 CSF1, EPS8L3 rs10494112 A>G 23 115 137 21 106 113 18 93 186 0,0085 0,0015

8 TM7SF4 rs2458413 G>A 78 161 27 69 141 24 101 138 57 0,00097 0,0020 1/1 : Homozygote allèle mineur; 1/2 : Hétérozygote; 2/2 : Homozygote allèle majeur

38

c) Vérification de l’association génotypique (comparaisons multiples)

Groupe Paget TOTAL Sous-groupe Paget NON-MUTÉS

Génotypes p Génotype p Gènes à Chr Variants Génotype (%) non RR [ IC 95 % ] (%) non RR [ IC 95 % ] proximité Atteints Témoins corrigée Atteints Témoins corrigée (Ni=275) (Ni=297) (Ni=240) (Ni=297) 1 CSF1, rs484959 AA vs GG+AG 21 (7,6) 48 (16) 1,4-4 0,49 [0,29 - 0,85] 16 (6,7) 48 (16) 7,9-5 0,33 [0,18 - 0,60]

EPS8L3 G>A GG vs AA+AG 123 (45) 93 (31) 0 0,0022 1,77 [1,26 - 2,49] 109 (45) 93 (31) 0,0019 1,82 [1,28 - 2,59]

AG vs AA+GG 131 (48) 156 (53) 0,69 0,82 [0,59 - 1,14] 115 (48) 156 (53) 0,78 0,83 [0,59 - 1,17]

1 CSF1, rs499345 AA vs CC+AC 37 (14) 29 (9,8) 0,20 1,44 [0,86 - 2,41] 33 (14) 29 (9,8) 0,18 1,48 [0,87 - 2,51]

EPS8L3 C >A CC vs AA+AC 88 (32) 132 (44) 7,6-4 0,59 [0,42 - 0,83] 72 (30) 132 (44) 2,0-4 0,54 [0,38 - 0,77]

AC vs AA+CC 149 (54) 136 (46) 0,0017 1,41 [1,01 - 1,96] 134 (56) 136 (46) 5,7-4 1,51 [1,07 - 2,12]

1 CSF1, rs10494112 GG vs AA+AG 23 (8,4) 18 (6,1) 0,019 1,41 [0,74 - 2,67] 21 (8,8) 18 (6,1) 0,014 1,48 [0,77 - 2,85]

EPS8L3 A>G AA vs GG+AG 137 (50) 186 (63) 0,0045 0,59 [0,43 - 0,83] 113 (47) 186 (63) 7,3-4 0,53 [0,38 - 0,75]

AG vs AA+GG 115 (42) 93 (31) 0,025 1,57 [1,12 - 2,22] 106 (44) 93 (31) 0,0056 1,73 [1,22 - 2,47]

8 TM7SF4 rs2458413 AA vs GG+AG 78 (29) 101 (34) 0,33 0,80 [0,56 - 1,15] 69 (30) 101 (34) 0,37 0,81 [0,56 - 1,17]

G>A GG vs AA+AG 27 (10) 57 (19) 0,0046 0,48 [0,29 - 0,78] 24 (10) 57 (19) 0,0078 0,48 [0,29 - 0,81]

AG vs AA+GG 161 (61) 138 (47) 2,2-4 2,65 [1,92 - 3,66] 141 (60) 138 (47) 6,9-4 1,73 [1,22 - 2,45]

Ni : Nombre total d’individus dans la cohorte. Le nombre réel d’individus génotypés avec succès peut être inférieur.

39 39 La fréquence de l’allèle mineur A du rs484959 était significativement diminuée chez les individus atteints par la MOP des deux groupes investigués, par rapport aux témoins. Le risque relatif et l’intervalle de confiance à 95 % dénotent que les individus porteurs d’au moins un allèle A avaient un risque plus faible de développer la MOP comparativement à ceux qui n’en possédaient pas. Le génotype AA aurait un effet protecteur contre la MOP par rapport aux deux autres génotypes. Le génotype GG, quant à lui, était associé à un risque significativement plus élevé de développer la maladie. L’étude de l’association génotype – phénotype a démontré une association entre le sexe et le génotype AA pour le polymorphisme rs484959. Toutes proportions gardées, dans le groupe « Paget Total », les hommes atteints par la MOP étaient moins souvent porteurs du génotype AA pour ce polymorphisme que les femmes atteintes. En effet, seulement 7 hommes sur un total de 147 hommes atteints étaient porteurs du génotype AA, alors que 14 femmes sur un total de 106 femmes atteintes étaient porteuses de ce génotype. L’effet protecteur contre la MOP observé pour le génotype AA du polymorphisme rs484959 serait donc plus important chez les hommes que chez les femmes, puisque la proportion d’hommes atteints par la maladie qui portent le génotype AA est plus faible que la proportion de femmes porteuses de ce génotype. (AA (♂): 7 (33 %) versus AG+GG (♂): 140 (60 %); p = 0,016; RR : 0,34 [0,13 – 0,88]) Étonnamment, les individus du groupe « Paget total » ayant un génotype AA avaient, en moyenne, plus d’os atteints par la MOP que les individus porteurs d’au moins un allèle G (4,33 ± 4,05 versus 2,72 ± 2,69; p = 0,013). Considérant la taille importante des écarts-types correspondant aux moyennes du nombre d’os atteints, la prudence est de mise dans l’interprétation de ce résultat. Aucune association génotype-phénotype significative n’a été observée au sein du sous-groupe Paget Non-Mutés. Les résultats complets de toutes les analyses des associations génotype-phénotype qui ont été effectuées sont détaillés à l’annexe C.

Les fréquences des allèles mineurs A (rs499345) et G (rs10494112) étaient toutes deux significativement augmentées chez les individus atteints par la MOP des deux groupes étudiés par rapport aux témoins. La susceptibilité génétique à la MOP était augmentée chez les porteurs d’un de ces deux allèles mineurs par rapport à ceux qui n’en possédaient pas. Les individus homozygotes pour l’allèle majeur de ces deux polymorphismes (CC ou AA) avaient un plus faible risque de développer la maladie lorsqu’ils étaient comparés aux individus possédant un génotype contenant au moins un allèle mineur (AC / AA ou AG / GG). Le statut d’hétérozygote, quant à lui, conférait un risque significativement plus élevé de développer la maladie. La proportion d’hommes atteints par la MOP qui possédaient soit les génotypes AC ou AA pour le rs499345 ou les génotypes AG ou GG pour le rs10494112 était significativement plus élevée que la proportion des femmes possédant ces génotypes (rs499345; CC (♂): 34 (40 %) versus AC+AA (♂): 113 (67 %); p = 3,3 X 10-5; RR : 3,05 [1,78 – 5,24]; rs10494112; AA (♂): 61 (48 %) versus AG+GG (♂): 86 (67 %); p = 0,0019; RR : 2,22 [1,33– 3,70]) . Pour ces deux polymorphismes, les génotypes comportant au moins un allèle mineur seraient donc associés à une augmentation plus importante du risque de développer la MOP chez les hommes que

40

chez les femmes. La présence d’au moins un allèle mineur au sein de chacun des deux génotypes était aussi plus fréquente chez les individus qui ne possédaient pas la mutation SQSTM1/P392L que chez les individus mutés. (rs499345; CC (mutés):18 % versus AC+AA (mutés): 8 %; p = 0,018; RR : 0,39 [0,18 – 0,87]; rs10494112; AA (mutés):16 % versus AG+GG (mutés): 6 %; p = 0,015; RR : 0,37 [0,16 – 0,87]). Les génotypes des variants communs rs499345 et rs10494112 comprenant au moins un allèle mineur seraient donc associés à une augmentation plus importante du risque de développer la MOP chez les individus non mutés.

Seule la distribution des génotypes du variant commun rs2458413 variait entre les individus atteints par la MOP et les témoins. Les hétérozygotes pour ce variant avaient un risque significativement plus élevé de développer la maladie par rapport aux individus homozygotes pour l’allèle majeur et homozygotes pour l’allèle mineur. Les homozygotes pour l’allèle majeur avaient un risque significativement plus faible de développer la MOP. L’étude de la corrélation génotype-phénotype suggère un âge moyen au diagnostic plus élevé chez les individus hétérozygotes par rapport à ceux possédant un des deux autres génotypes (AG : 61,63 ± 11,07 versus AA+GG: 64,76 ± 9,46; p = 0,025). Les fréquences de l’allèle mineur A étaient supérieures à 0,50 (50 %) chez les cas et chez les témoins de notre échantillon parce que l’allèle mineur de ce polymorphisme a été déterminé selon la MAF moyenne indiquée dans EntrezSNP qui considère toutes les MAFs rapportées pour ce polymorphisme et non pas seulement les MAFs observées dans des populations d’origine européenne. Lorsque toutes les populations investiguées dans EntrezSNP ou 1000 génomes étaient considérées, la fréquence de l’allèle A de ce variant commun était inférieure à 0,5, mais dans les populations d’origine européenne, cet allèle était plus fréquent que l’allèle G.

4.2. IDENTIFICATION DE VARIANTS GÉNÉTIQUES AU SEIN DES MEILLEURS GÈNES CANDIDATS À LA MOP

4.2.1. Sélection de 10 gènes candidats La région de 0,5 Mb entourant le gène CSF1, situé au locus 1p13, comprenait 27 gènes et la région de 1 Mb entourant le gène TM7SF4, situé au locus 8q22, comprenait 11 gènes. Tous ces gènes sont répertoriés à l’annexe D. Sept gènes du locus 1p13, soit ALX3, AMPD2, CSF1, EPS8L3, GSTM3, GSTM4 et PSMA5 et 3 gènes du locus 8q22, soit CTHRC1, LRP12 et TM7SF4 (DC-STAMP), répondaient aux critères de sélection établis. Ils ont été sélectionnés pour la suite du projet. Les caractéristiques pertinentes des gènes qui ont été sélectionnés ou des produits qu’ils encodent sont indiquées au Tableau 3.

41 Tableau 3. Sélection des gènes candidats potentiels à la MOP

Symbole du gène (Nom complet du gène) Raisons de la sélection Références [Locus] ALX3  Implication dans la régulation de l'apoptose. (Homeobox protein  Mirasierra, 2011  Malformations cranio-faciales et anomalies de l'apoptose pour des aristaless-like 3)  Beverdam, 2001 embryons de souris Alx3-/-Alx4-/-. [1p13] AMPD2  Interactions avec des protéines impliquées dans la voie de (Adenosine monophosphate signalisation ubiquitine-protéasome, dans la voie de signalisation  GeneCards deaminase 2) Wnt et dans la régulation de l'apoptose. [1p13]  Albagha, 2010 CSF1  Localisation à proximité de rs484959 associé à la MOP.  Caetano-Lopes, 2009 (Colony stimulating factor 1)  Implication dans l'ossification, dans la différentiation des  Wise, 2005 [1p13] ostéoclastes, dans l'ostéolyse et dans l'odontogenèse.  Gallet, 2006 EPS8L3 (Epidermal growth factor receptor  Albagha, 2010  Localisation à proximité de rs484959 associé à la MOP. kinase substrate 8-like protein 3)  Pathway Central [1p13]  Association entre un génotype et une diminution de la survie des GSTM3 individus ayant développé des métastases d’ostéosarcome.  Salinas-Souza, 2010 (Glutathione S-transferase  Interactions avec des protéines impliquées dans la voie de  GeneCards mu 3 (brain) signalisation du NF-ƘB, dans l'apoptose, dans l'autophagie et  EntrezGene [1p13] dans l'ubiquitination.  Participation à la détoxification de produits du stress oxydatif. GSTM4 (Glutathione  Implication dans la pathogénie du sarcome d'Ewing.  Luo, 2009 S-transferase mu 4)  Participation à la détoxification de produits du stress oxydatif.  EntrezGene [1p13] PSMA5 (Proteasome subunit,  Implication dans l'assemblage du protéasome, dans la régulation  McNaught, 2001 alpha type, 5) de l'ubiquitination et dans l'apoptose. [1p13] CTHRC1  Implication dans la voie de signalisation Wnt.  Kimura, 2008 (Collagen triple helix  Diminution de la formation osseuse et de la masse osseuse de  GeneCards repeat containing 1) -/- [8q22] souris CTHRC1 . LRP12 (Low density lipoprotein receptor-  Gènes de la famille LRP impliqués dans la voie de signalisation  Kubota, 2009 related protein 12) Wnt. [8q22]  Présence d'un variant commun (rs2458413) associé à la MOP au sein du gène.  Implication dans l'ostéoclastogénèse médiée par TNFSF11A TM7SF4 (DC-STAMP)  Chung, 2010 (RANKL) et dans la multinucléation des ostéoclastes. Aussi appelé (Transmembrane 7 superfamily  Yagi, 2005 DC-STAMP. member 4)  GeneCards  Diminution de la résorption osseuse et augmentation de la densité [8q22] minérale osseuse de souris TM7SF4 -/-.  Interactions avec NFATc1, un facteur de transcription impliqué dans la régulation de l'ostéoclastogénèse.

42

4.2.2. Répartition des variants génétiques identifiés selon la fréquence de l’allèle mineur Au total, 156 variants génétiques, soit 74 variants rares et 82 variants communs, ont été identifiés dans notre échantillon de découverte. (Annexe E) Parmi les variants rares identifiés, 29 étaient de nouveaux variants non répertoriés dans la base de données EntrezSNP. (Tableau) Les valeurs de référence des MAFs de quatorze autres variants rares répertoriés dans EntrezSNP n’étaient pas disponibles.

43 44

Tableau 4. Nouveaux variants rares identifiés

ID Localisation / Description du variant Effets fonctionnels prédits in silico Allèles (%) Nom attribué Chr : Position Nucléotide Acide aminé Type de ACIDES AMINÉS FACTEURS DE SITES D'ÉPISSAGE CAS TÉMOINS Position génique changement PolyPhen (P) TRANSCRIPTION Donneur (D) génomique (1000 G) SIFT (S) Gain (G) Accepteur (A) (1000 G) Condel (C ) Perte (P) Branchement (B) ALX3_3,2 1:110603311110 60 3' UTR c.*43_*44del 1 (2,2) 0 3 312 CCinsTT ALX3_5 1:110603128 3' UTR c.*227T>C P: AP-1 1 (2,2) 0 ALX3_7 1:110603037 3' UTR c.*318C>G B: Site altéré 1 (2,2) 0 AMPD2_4 1:110168623 Intron c.273-159C>G B: Site altéré 0 1 (13) AMPD2_6 1:110169624 Intron c.637+90C>T G: c-REL B: Site altéré 1 (1,7) 0 CSF1_2 1:110453594 5' UTR c.-52G>C A: Nouveau site 1(1,7) 0 CTHRC1_3 8:104390332 Exon c.450A>T p.Arg150Ser Radical P: Bénin G: C/EBPβ 0 1 (13) S: Toléré C: Neutre CTHRC1_4 8:104390430 Exon c.548C>T p.Pro183Leu Radical P:Probablement 0 1 (13) dommageable S: Toléré C: Délétère EPS8L3_1 1:110306878 Amont c.-230-229C>T G: PPARgamma 2 (3,2) 0 EPS8L3_5 1:110304733 Intron c.-24-338C>T B: Site altéré 2 (3,1) 0 EPS8L3_9 1:110300940 Exon c.718G>A p.Glu240Lys Radical P: Bénin 1 (1,6) 0 S: Toléré C: Délétère GSTM3_1 1:110283009- 5' UTR c.-107_100 1 (1,7) 0 110 283 016 insGGGGCGG GSTM3_2 1:110282465 Exon c.114G>A T38T Synonyme 1 (1,5) 0 GSTM3_5 1:110279822 Intron c.580-31C>T 1 (1,6) 0 GSTM4_2 1:110195930 Amont c.-309-2773C>A 1 (1,7) 0 GSTM4_4 1:110198678 Amont c.-309-25G>A D: Nouveau site 1 (2,0) 0 GSTM4_5 1:110198709 5' UTR c.-303G>C 2 (3,8) 0 GSTM4_7 1:110199940 Intron c.177+39G>C G: NF-kappaB D: Site altéré 1 (1,8) 0 GSTM4_8 1:110199971 Intron c.177+70G>C D: Site altéré 1 (1,8) 0 A: Site altéré GSTM4_9 1:110199972 Intron c.177+71A>C D: Site altéré 1 (1,8) 0 GSTM4_11 1:110200155 Intron c.178-57G>A A: Site altéré 1 (1,6) 0 GSTM4_14 1:110204153 3' UTR c.*277C>T P: NRF-2 1 (1,6) 0 LRP12_4 8:105503533 Exon c.1948G>A p.Val650Met Conservateur P: Bénin 1 0 S: Toléré C: Délétère PSMA5_1 1:109969041 Amont c.-21-68G>T 1 (1,7) 0 PSMA5_2 1:109968806 Intron c.29+118C>G A: Nouveau site 1 (1,6) 0 PSMA5_4 1:109968504 Intron c.29+420A>G 0 1 (13) TM7SF4_2 8:105351353 Amont c.-50-701G>A A: Site altéré 1 (2,6) 0 TM7SF4_6 8:105361584 Exon c.804G>A P268P Synonyme 1 (1,6) 0 TM7SF4_11 8:105367308 Exon c.1233C>T S411S Synonyme 0 1 (13)

44

Les MAFs de 31 variants parmi les 113 variants possédant une valeur de référence dans EntrezSNP étaient inférieures à 5 %. Cette proportion représentait plus du quart des variants identifiés.( Figure 13) La véritable proportion de variants identifiés ayant une MAF inférieure à 5 % est assurément supérieure à 27 % puisqu’il est très probable que les 43 variants identifiés pour lesquels aucune MAF de référence n’était disponible dans EntrezSNP soient en fait des variants rares. Si tous ces 43 variants possédaient une MAF inférieure à 5 %, la proportion de variants identifiés ayant une MAF inférieure à 5 % grimperait à près de 50 %. En regardant de plus près, il apparaît que le groupe de variants ayant une MAF inférieure à 5 % était formé en majorité de variants encore plus rares, soit des variants ayant une MAF de référence inférieure à 2 %. (Figure 13)

Figure 13. Nombre de variants génétiques identifiés en fonction de la fréquence de l'allèle mineur du variant génétique selon EntrezSNP

a) Tous les variants génétiques

Nombre de variants 35 génétiques 31 30

25

20 16 15 13 13 9 10 10 8 5 5 5 3

0 ]0-5] ]5-10] ]10-15] ]15-20] ]20-25] ]25-30] ]30-35] ]35-40] ]40-45] ]45-50] Fréquence de l'allèle mineur (%)

45 b) Nombre de variants génétiques dont la fréquence de l’allèle mineur est inférieure à 10 % selon EntrezSNP

Nombre de 14 variants 13 génétiques 12

10 9 8

6 5 4 3 3 3 2 1 1 1 0 0 ]0-1] ]1-2] ]2-3] ]3-4] ]4-5] ]5-6] ]6-7] ]7-8] ]8-9] ]9-10] Fréquence de l'allèle mineur (%)

46

4.2.3. Répartition des variants rares identifiés chez des individus atteints par la MOP selon leurs localisations chromosomique et génique Cinquante-sept des 74 variants rares identifiés étaient situés au locus 1p13; les 17 autres étaient situés au locus 8q22. Quinze des 74 variants rares identifiés étaient situés dans un exon. (Figure 14) Neuf autres variants ont été identifiés chez au moins un individu atteint par la MOP dans les régions géniques non traduites (3’ UTR et 5’ UTR). Les variants rares restants ont été identifiés dans un intron ou à proximité des gènes étudiés.

Figure 14. Répartition des variants génétiques rares identifiés selon leur localisation génique

a) Tous les variants rares identifiés b) Variants rares identifiés chez au moins un individu atteint par la MOP

Soixante-cinq des 74 variants rares identifiés étaient présents chez au moins un individu atteint par la MOP. Cinquante-cinq des 65 variants rares qui ont été observés chez au moins un individu atteint par la MOP ont été identifiés au locus 1p13. Les dix autres ont été identifiés au locus 8q22.

Quatre variants rares exoniques ont été identifiés dans les gènes du locus 1p13. Deux de ces variants (EPS8L3_7, EPS8L3_9) modifiaient un acide aminé. Le variant EPS8L3 serait toléré selon PolyPhen, SIFT et Condel, alors que le variant EPS8L3_9 était prédit dommageable pour la fonction de la protéine selon Condel.

Cinq variants rares exoniques ont été identifiés chez au moins un individu atteint par la MOP dans les gènes du locus 8q22. Deux de ces variants (LRP12_4 et TM7SF4_9) modifiaient un acide aminé. Le variant TM7SF4_9 était prédit dommageable pour la fonction de la protéine d’après PolyPhen et Condel.

47 4.2.4. Description détaillée des 74 variants rares identifiés La section suivante décrit chacun des variants rares qui ont été identifiés au cours du projet. Le lecteur peut s’y référer au besoin pour connaître la localisation de chacun de ces variants rares, le nombre d’individus porteurs, ainsi que les conséquences prévues par des outils de prédictions in silico. Cette section reprend entre autres les informations contenues dans le tableau 4, dans lequel sont décrits les 29 nouveaux variants rares et le tableau E-2 (Annexe E) dans lequel sont décrits les variants rares répertoriés dans la base de données EntrezSNP.

4.2.4.1. Gène ALX3 (Homeobox protein aristaless-like 3) Six variants rares ont été identifiés dans le gène ALX3 (Homeobox protein aristaless-like 3). Environ un tiers (20/57, 35 %) des individus de notre échantillon de découverte atteints par la MOP était porteur d’au moins un de ces variants. Un quart (2/8, 25 %) des individus sains inclus dans notre échantillon possédaient un de ces variants. Deux des variants rares du gène, soit ALX3_2 (c. 277+1568G>C) et ALX3_3,1 (c.277+1695G>A) étaient situés dans une région intronique. Ces deux variants entraîneraient la création de nouveaux sites d’épissage. Les quatre autres variants rares identifiés dans ce gène, soit ALX3_3,2 (c.*43_*44delCCinsTT), ALX3_4 (c.*69_*96ins CCTGCCTGGACACCACGGAGGA AGCACC), ALX3_5 (c.*227T>C) et ALX3_7 (c.*318C>G) étaient tous situés dans la région 3’non traduite du gène. Le variant ALX3_4 s’insèrerait dans un microARN et le variant ALX3_5 entraînerait la perte d’un site de liaison au facteur de transcription AP-1, impliqué dans la régulation des cellules osseuses. Les variants ALX3_4 et ALX3_7 altèreraient respectivement un site d’épissage et un point de branchement. Seize individus atteints par la MOP étaient porteurs du variant ALX3_4, la moitié d’entre eux étant homozygote pour cette insertion. Deux individus appartenant au groupe contrôle étaient aussi porteurs de ce même variant. Les cinq autres variants rares du gène ALX3 étaient présents chez un individu atteint par la MOP, mais absents chez les individus sains. Les variants ALX3_5 et ALX3_7 ont été observés chez le même individu, ce qui suggère qu’ils seraient en déséquilibre de liaison. Aucun variant commun de ce gène n’a été observé dans notre échantillon.

4.2.4.2. Gène AMPD2 (Adenosine monophosphate deaminase 2) Quatorze variants génétiques rares du gène AMPD2 (Adenosine monophosphate deaminase 2) ont été identifiés. Dans notre échantillon de découverte, environ la moitié (27/57, 47 %) des individus atteints par la MOP possédaient au moins un variant rare dans ce gène. Parmi les huit individus sains séquencés, deux (2/8, 25 %) étaient porteurs d’un de ces variants. Le variant AMPD2_9 (c.1023G>A, p. S341S) était situé dans une région codante, mais il préservait l’acide aminé sérine. Il causerait l’ajout d’un site de liaison au facteur de transcription CREB, impliqué dans la régulation des ostéoclastes. Il a été vu chez deux individus atteints par la MOP. Le variant intronique AMPD2_13 (c.1782-68delG), qui a été observé chez 16 individus pagétiques et un seul contrôle, pourrait être associé avec la MOP. Les variants AMPD2_1 (c.-432-386G>A) et AMPD2_2 (c.-

48

432-269C>T) sont situés en amont du gène. Ils modifieraient des sites d’épissage. Ils ont été identifiés respectivement chez deux et trois individus malades. Les autres variants rares du gène AMPD2 étaient situés dans un intron. Les variants AMPD2_3 (c.10+95A>G) et AMPD2_5 (c.450+149C>T) et les variants AMPD2_7 et AMPD2_8 semblaient en déséquilibre de liaison deux par deux. Ces deux couples de variants ont chacun été observés chez deux individus atteints par la MOP et aucun individu sain. Les variants AMPD2_6 (c.637+90C>T) et AMPD2_11 (c.1490+124A>G) entraîneraient l’ajout d’un site de liaison au facteur de transcription c-REL, membre de la famille des facteurs de transcription du NF-κB. Le variant AMPD2_6 altèrerait aussi un point de branchement. Les variants adjacents AMPD2_7 (c.1000-65G>T) et AMPD2_8 (c.1000-64C>T) causaient la perte d’un site de fixation du facteur de transcription C/EBP impliqué dans la régulation des ostéoclastes. Le variant AMPD2_7 entraînerait aussi le gain d’un point de branchement. Le variant AMPD2_12 (c.1781+64C>T) causerait l’ajout d’un nouveau site d’épissage. Les variants AMPD2_6, AMPD2_10 (c.1326+3A>G), AMPD2_11, AMPD2_12 et AMPD2_14 (c.1902+54C>A), ont chacun été vus une seule fois chez un individu malade. Le variant AMPD2_4 (c.273-159C>G) a été observé chez un seul individu sain. Douze variants communs du gène AMPD2 répertoriés dans la base de données EntrezSNP ont été observés dans notre échantillon de découverte.

4.2.4.3. Gène CSF1 (Colony stimulating factor 1) L’étude du gène CSF1 (Colony stimulating factor 1) a mené à l’identification de deux variants rares. Le premier, CSF1_1 (c.-391-335G>A), était situé en amont du gène. Il a été vu chez deux individus atteints par la MOP. Ce variant entraînerait l’ajout d’un site de liaison au facteur de transcription c-REL, membre de la famille du NF-κB. Le second variant, CSF1_2 (c.-52G>C), situé dans la région 5’ non traduite, a été identifié chez un individu atteint. Ce variant créerait un nouveau site d’épissage. Six variants génétiques communs du gène CSF1 répertoriés dans la base de données EntrezSNP ont été observés dans notre échantillon.

4.2.4.4. Gène CTHRC1 (Collagen triple helix repeat containing 1) Quatre variants génétiques rares ont été identifiés dans le gène CTHRC1 (Collagen triple helix repeat containing 1). Plus du quart (9/33, 27 %) des individus de notre échantillon atteints par la MOP étaient porteurs d’un de ces variants rares. Un individu sain de notre échantillon (1/4, 25 %) était porteur de deux variants rares du gène CTHRC1. Les variants CTHRC1_1 (c.372+103 _372 +107delAAAAA) et CTHRC1_2 (c.372+259A>G) étaient situés dans un intron. Le variant CTHRC1_1 a été identifié chez deux individus atteints par la MOP et aucun contrôle. Le variant CTHRC1_2 créerait un nouveau site d’épissage. Il a été identifié chez sept individus atteints par la MOP. Parmi les 13 individus pagétiques porteurs de la mutation P392L du gène SQSTM1 qui ont été séquencés, six possédaient le variant CTHRC1_2. Un seul individu parmi les 10 individus malades non porteurs de la mutation du gène SQSTM1 séquencés possédait ce variant. Le variant CTHRC1_2 était absent chez les témoins. Les deux autres variants rares identifiés, CTHRC1_3

49 (c.450A>T, p.Arg150Ser) et CTHRC1_4 (c.548C>T, p.Pro183Leu), étaient situés dans une région codante de CTHRC1. Ces deux variants ont été observés chez un seul et même individu sain de l’échantillon de découverte. Sept variants génétiques communs du gène CTHRC1 répertoriés dans la base de données EntrezSNP ont été détectés dans notre échantillon de découverte.

4.2.4.5. Gène EPS8L3 (Epidermal growth factor receptor kinase substrate 8-like protein 3) Dix variants génétiques rares ont été identifiés dans le gène EPS8L3 (Epidermal growth factor receptor kinase substrate 8-like protein 3). Environ trois quarts (27/37, 73 %) des individus atteints par la MOP étaient porteurs d’au moins un variant génétique rare du gène EPS8L3, tandis que la moitié (2/4, 50 %) des individus sains séquencés étaient porteurs d’un de ces variants. Deux variants rares se situaient dans un exon. Le variant EPS8L3_7 (c.105G>A, p.Met35Ile), situé dans le domaine PTB de la protéine, causait le remplacement d’une méthionine conservée chez le chimpanzé, la vache, le loup, la souris et le rat par une isoleucine. (Figure 15) Il s’agit d’un changement d’acide aminé conservateur puisque l’acide aminé d’origine et l’acide aminé de remplacement sont deux petites molécules non polaires. De plus, les algorithmes PolyPhen, SIFT et Condel prédisaient que cette modification d’un acide aminé était tolérée et n’affectait pas gravement la fonction du gène. Le variant EPS8L3_ 7 causerait aussi la perte d’un site de fixation du facteur de transcription CREB, impliqué dans la régulation du tissu osseux. Ce variant a été observé chez trois pagétiques et un individu non malade. Le variant EPS8L3_9 (c.718G>A, p.Glu240Lys) modifiait un acide glutamique par une lysine chez un individu atteint par la MOP. Puisque l’acide glutamique est une petite molécule chargée négativement, et que la lysine est une grosse molécule chargée positivement, cette variation d’acide aminé est considérée comme radicale. De plus, l’acide glutamique situé à cette position est conservé chez le chimpanzé, le loup, la souris et le rat. (Figure 16) Condel prédisait que ce variant avait des effets délétères, mais PolyPhen et SIFT ne prédisaient pas d’effets majeurs de ce variant sur la fonction du gène. Le variant EPS8L3_9 a été identifié chez un seul individu atteint par la MOP.

Figure 15. Conservation de la méthionine (M) en position 35 de la protéine EPS8L3

50

Figure 16. Conservation de l’acide glutamique (E) en position 240 de la protéine EPS8L3

Les variants rares introniques EPS8L3_3 (c.-24-855_-24-852delAGTA) et EPS8L3_8 (c.462-142delG) semblaient spécifiques à la MOP. Dix individus pagétiques étaient hétérozygotes pour le variant EPS8L3_3 et cinq autres individus malades étaient homozygotes pour ce même variant, alors que le variant EPS8L3_8 a été identifié chez 13 individus atteints par la MOP et un individu sain. Le variant EPS8L3_3 créerait un nouveau site d’épissage. Le variant EPS8L3_1 (c.-230-229C>T) a été identifié en amont du gène. Ce variant entraînerait l’ajout d’un site de liaison au facteur de transcription PPARγ, impliqué dans la régulation de l’os. Il a été observé chez deux individus atteints par la MOP et aucun contrôle. Les variants rares EPS8L3_4 (c.-24- 543C>T) et EPS8L3_5 (c.-24-338C>T), EPS8L3_6 (c.97-47C>T) et EPS8L3_10 (c.1203+186G>A) étaient situés dans un intron. Le variant EPS8L3_5 altèrerait un site de branchement alors que le variant EPS8L3_10 entraînerait la création d’un nouveau site d’épissage. Le variant EPS8L3_4 a été observé chez trois pagétiques et un contrôle. Les variants EPS8L3_5 et EPS8L3_6 ont été identifiés chez deux individus malades et aucun contrôle. Le variant EPS8L3_10 a été identifié chez trois individus atteints par la MOP et aucun contrôle. Vingt-quatre variants génétiques communs du gène EPS8L3 répertoriés dans la base de données EntrezSNP ont été décelés dans notre échantillon de découverte.

4.2.4.6. Gène GSTM3 (Glutathione s-transferase mu 3 (brain))

Cinq variants génétiques rares ont été identifiés dans le gène GSTM3 (Glutathione s-transferase mu 3 (brain)). Environ un tiers (13/37, 35 %) des individus atteints par la MOP composant notre échantillon étaient porteurs d’au moins un de ces variants. La moitié (2/4; 50 %) des individus de notre échantillon non atteints par la MOP possédaient un de ces variants. Le variant GSTM3_1 (c.-107_-100insGGGGCGG) était localisé dans la région 5’ non traduite. Il entraînerait la création d’un nouveau site d’épissage. Le variant GSTM3_2 (c.114G>A, p.Thr38Thr) était situé dans un exon, mais il n’altérait pas d’acide aminé. Les variants GSTM3_3 (c.124+7C>T), GSTM3_4 (c.372+33A>C), GSTM3_5 (c.580-31C>T) et GSTM3_6 (c.465+21_465+23delGAG) étaient situés dans un intron. Le variant GSTM3_4 altèrerait un site d’épissage et entraînerait le gain d’un site de fixation au facteur de transcription CREB. Le variant GSTM4_3 était présent chez 2 individus atteints par la MOP. Le variant GSTM3_6 a été observé chez neuf individus atteints par la MOP et 2 individus sains. Les

51 autres variants rares du gène GSTM4 ont été observés une seule fois dans notre échantillon. Cinq variants génétiques communs du gène GSTM3 répertoriés dans la base de données EntrezSNP ont été identifiés dans notre échantillon de découverte.

4.2.4.7. Gène GSTM4 (Glutathione s-transferase mu 4) Le séquençage du gène GSTM4 (Glutathione s-transferase mu 4) a mené à la découverte de 15 variants génétiques rares. Plus du quart (15/57, 26 %) des individus de notre échantillon atteints par la MOP étaient porteurs d’au moins un variant rare du gène GSTM4. Quatre variants rares, soit GSTM4_1 (c:-314-2798T>C), GSTM4_2 (c.-314-2769C>A), GSTM4_3 (c.-314-2595A>G) et GSTM4_4 (c.-314-20G>A), étaient situés en amont du gène. Les variants GSTM4_3 et GSTM4_4 créeraient deux nouveaux sites donneurs d’épissage. Le variant GSTM4_5 (c.¬303G>C) était situé dans la région 5’ non traduite. Les variants GSTM4_6 (c.112+208T>A), GSTM4_7 (c.177+39G>C), GSTM4_8 (c.177+70G>C), GSTM4_9 (c.177+71A>C), GSTM4_10 (c.178-81C>T), GSTM4_11 (c.178-57G>A) et GSTM4_12 (c.457-42C>T) étaient situés dans un intron. Le variant GSTM4_7 entraînerait la création d’un nouveau site de fixation du facteur de transcription NF-κB. Les variants GSTM4_6, GSTM4_7, GSTM4_8, GSTM4_9, GSTM4_10 et GSTM4_11 modifieraient un site d’épissage ou un point de branchement. Le variant GSTM4_13 (c.567+128C>A; c.572C>A, p.Thr191Asn) était situé dans un intron ou dans un exon selon le transcrit étudié. Selon PolyPhen, la modification d’un acide aminé par ce variant serait possiblement dommageable pour la fonction de la protéine, alors que selon SIFT et Condel ce variant n’aurait pas d’effets fonctionnels importants. Les variants GSTM4_14 (c.*277C>T) et GSTM4_15 (c.*351C>T), étaient situés dans la région 3’ non traduite. Le variant GSTM4_14 causerait la perte d’un site de liaison au facteur de transcription NRF-2, impliqué dans la différenciation des cellules mésenchymateuses en cellules ostéoprogénitrices, alors que le variant GSTM4_15 éliminerait un site de liaison au facteur de transcription C/EBP, qui régule la formation d’ostéoclastes. Les variants GSTM4_1 et GSTM4_10 ont chacun été identifiés chez quatre individus dont trois atteints par la MOP, le variant GSTM4_5 a été identifié chez deux individus malades, le variant GSTM4_12 a été identifié chez cinq individus atteints par la MOP et le variant GSTM4_13 a été détecté chez quatre individus malades et un individu sain. Les autres variants rares ont été observés chez un seul individu malade. Treize variants communs du gène GSTM4 répertoriés dans la base de données EntrezSNP ont aussi été identifiés dans l’échantillon de découverte.

4.2.4.8. Gène LRP12 (Low density lipoprotein receptor-related protein 12) Trois variants rares ont été observés au sein du gène LRP12 (Low density lipoprotein receptor-related protein 12). Les variants LRP12_3 (c.1080T>C; Asn360Asn) et LRP12_4 (c.1948G>A; Val650Met) se situaient dans un exon. Le variant LRP12_4 modifiait un acide aminé valine, conservé chez le chimpanzé, la

52

vache, le loup, et la souris par un acide aminé méthionine. (Figure 17) Ce changement d’acide aminé est conservateur puisque la valine et la méthionine sont deux petites molécules non polaires. L’outil de prédiction in silico Condel prédit toutefois que ce variant serait délétère pour la fonction de la protéine. Par ailleurs, ce variant serait toléré selon PolyPhen et SIFT. Le variant LRP12_3 a été vu chez deux individus pagétiques alors que le variant LRP12_4 a été observé chez un seul individu malade. Le variant LRP12_2 (c.136+193G>A) a été observé chez un seul individu sain. Un seul variant commun du gène LRP12 répertorié dans la base de données EntrezSNP a été identifié dans notre échantillon.

Figure 17. Conservation de la valine (V) en position 650 de la protéine LRP12

4.2.4.9. Gène PSMA5 (Proteasome subunit, alpha type 5) Cinq variants rares du gène PSMA5 (Proteasome subunit, alpha type 5) ont été détectés dans le gène PSMA5. Le variant PSMA5_1 (c.-21-68G>T) était localisé en amont du gène. Les autres variants étaient situés dans un intron. Il semblait exister un déséquilibre de liaison entre les variants PSMA5_2 et PSMA5_3 puisque le même individu était porteur de ces deux variants situés à proximité l’un de l’autre. Le variant PSMA5_2 (c.29+118C>G) entraînerait la création d’un nouveau site d’épissage. Le variant PSMA5_3 (c.29+308G>A) serait responsable de la perte d’un site de liaison au facteur de transcription PPAR-γ, impliqué dans la régulation des ostéoclastes, et de l’altération d’un site d’épissage et d’un point de branchement. Les variants PSMA5_1, PSMA5_2, PSMA5_3 et PSMA5_5 (c.561+123C>T) ont chacun été observés chez un seul individu pagétique. Le variant PSMA5_4 (c.29+420A>G) a été vu chez un seul individu appartenant au groupe contrôle. Trois variants communs répertoriés dans la base de données EntrezSNP ont aussi été aperçus dans le gène PSMA5.

4.2.4.10. Gène TM7SF4 (DC-STAMP) (Transmembrane 7 superfamily member 4, (Dendritic cell specific transmembrane protein)) Dix variants rares ont été identifiés dans le gène TM7SF4 (DC-STAMP) (Transmembrane 7 superfamily member 4, (Dendritic cell specific transmembrane protein)). Environ 20 % (6/33, 18 %) des individus de notre échantillon atteints par la MOP étaient porteurs d’un de ces variants. Le variant TM7SF4_9 (2:c.1189C>T, p.Leu397Phe) causait le remplacement d’un acide aminé de type leucine, conservé dans l’évolution, par un

53 acide aminé de type phénylalanine. (Figure 18) Il s’agit d’un changement d’acide aminé radical puisque la leucine est une petite molécule non polaire alors que la phénylalanine est une grosse molécule non polaire. Selon PolyPhen et Condel, ce variant serait délétère pour la fonction du gène. Toutefois, SIFT prédit que ce variant serait toléré. Les variants TM7SF4_6 (c.804G>A, p.Pro268Pro) et TM7SF4_7 (c.960C>T, Leu320Leu) étaient situés dans un exon, mais ils n’altéraient pas d’acides aminés. Les variants TM7SF4_1 (c.-50- 863G>A), TM7SF4_2 (c.-50-701G>A) et TM7SF4_3 (c.-50-564G>T) étaient situés en amont du gène. Le variant TM7SF1_1 entraînerait la création d’un site de fixation au facteur de transcription c-REL, membre de la famille du NF-κB. Les variants TM7SF4_5 (c.214C>A, p.Leu72Met), TM7SF4_8 (c.1023C>T, p.His341His), TM7SF4_11 (c.1233C>T, p.Ser411Ser) et TM7SF4_12 (c.1295C>T, p.Pro432Leu) ont été identifiés chez un seul et même individu sain. Quatorze variants communs du gène TM7SF4 répertoriés dans la base de données EntrezSNP ont été observés dans notre échantillon.

Figure 18. Conservation de l’acide aminé leucine (L) en position 397 de la protéine TM7SF4

4.3. ÉTUDE DE LA SÉGRÉGATION INTRA-FAMILIALE Quinze variants rares ont été sélectionnés pour l’étude de la ségrégation intra-familiale. Sept variants rares ont été sélectionnés parce qu’ils étaient présents chez au moins cinq individus souffrant de la MOP parmi notre échantillon de découverte. Quatre autres variants rares ont été sélectionnés parce qu’ils altéraient un acide aminé. Les autres variants rares sélectionnés étaient situés dans un exon, modifiaient un site de liaison à un facteur de transcription ou encore modifiaient un point de branchement. (Tableau)

54

Tableau 5. Variants rares sélectionnés pour l’étude de la ségrégation intra- familiale

Nombre de Variants Raison de la sélection familles sélectionnés investiguées ALX3_4 Présence chez plusieurs individus atteints 4 Création d'un site de fixation à un facteur de AMPD2_6 1 transcription de la famille du NF-KB Création d’un site de fixation au facteur de AMPD2_9 2 transcription CREB AMPD2_13 Présence chez plusieurs individus atteints 4 Création d'un site de fixation à un facteur de CSF1_1 1 transcription de la famille du NF-KB CTHRC1_2 Présence chez plusieurs individus atteints 4 EPS8L3_3 Présence chez plusieurs individus atteints 4 EPS8L3_5 Altération d'un site de branchement 2 EPS8L3_7 Altération d'un acide aminé 1 EPS8L3_8 Présence chez plusieurs individus atteints 3 EPS8L3_9 Altération d'un acide aminé 1 GSTM4_6 Présence chez plusieurs individus atteints 1 GSTM4_12 Présence chez plusieurs individus atteints 2 Altération d'un acide aminé GSTM4_13 3 (selon le transcrit étudié) TM7SF4_9 Altération d'un acide aminé 1

L’étude de la ségrégation intra-familiale des variants a permis d’identifier un second porteur du variant AMPD2_6 atteint par la MOP. Figure 19) Par ailleurs, ce variant était absent chez l’individu sain provenant de la même famille. Compte tenu du faible nombre d’individus étudiés, il a été impossible de confirmer si ce variant ségréguait ou non avec la MOP à cette étape.

La ségrégation familiale des variants GSTM4_12 et GSTM4_13 n’a finalement pas été étudiée dû à l’incapacité de séquencer les fragments de gènes dans lesquels ils se trouvaient. La présence de plusieurs polymorphismes du nombre de copie dans cette région (copy number variation), tel que décrit dans Database of genomic variants (http://projects.tcag.ca/variation), pourrait expliquer l’impossibilité de séquencer ces variants. Aucune évidence de ségrégation familiale n’a été trouvée pour les 12 autres variants étudiés.

55 Figure 19. Ségrégation intrafamiliale du variant AMPD 2_6

4.4. ÉTUDE D’ASSOCIATION GÉNÉTIQUE Cinq variants rares ont été sélectionnés pour l’étude d’association génétique. TM7SF4_9, le seul variant rare prédit comme ayant un effet dommageable pour la fonction de la protéine par deux outils de prédiction in silico, a été inclus dans l’étude d’association. AMPD2_6 a été sélectionné puisqu’il était impossible d’affirmer qu’il ne ségréguait pas avec la MOP. Les trois autres variants, soit CTHRC1_2, EPS8L3_3 et GSTM4_12, ont été sélectionnés parce qu’ils semblaient spécifiques à la MOP dans notre échantillon de découverte; ils étaient présents chez plusieurs individus atteints par la MOP et absents chez tous les témoins.

L’équilibre d’Hardy-Weinberg était respecté chez les témoins pour tous les variants rares sélectionnés pour l’étude d’association.

Une association génétique a été observée entre le variant CTHRC1_2 et la MOP dans le sous-groupe Paget Non-Mutés. Une tendance d’association a été observée entre le variant TM7SF4_9 et la MOP dans le même sous-groupe. (Tableau)

56

Tableau 6. Résultats de l’étude d’association génétique par variant rare

a) Association allélique

Groupe Paget TOTAL Sous-groupe Paget NON-MUTÉS

Fréquence de l'allèle Fréquence de l'allèle p p Chr Gènes_# Variants mineur RR [ IC 95 % ] mineur RR [ IC 95 % ] non corrigée non corrigée Atteints Témoins Atteints Témoins (Na=534) (Na=590) (Na=462) (Na=590) 0,000 0,000 1,10 0,000 0,000 1,28 1 AMPD2_6 c. 637 + 90 C>T     0,049 0,054 0,67 0,90 [0,53 - 1,52] 0,048 0,054 0,63 0,88 [0,50 - 1,53] 1 GSTM4_12 c.457-42 C>T (rs650985) 0,080 0,109 0,10 0,72 [0,48 - 1,08] 0,073 0,109 0,046 0,65 [0,42 - 1,00] 8 CTHRC1_2 c.372+259 A>G (rs35500845) 0,026 0,014 0,13 1,91 [0,79 - 4,59] 0,028 0,014 0,09 2,06 [0,85 - 5,01] 8 TM7SF4_9 c.1189 C>T (rs62620995) Na : Nombre total d’allèles disponibles dans la cohorte. Le nombre réel d’allèles génotypés avec succès peut être inférieur.

b) Association génotypique (interclasse)

p non corrigée p non corrigée Groupe Paget Sous-groupe Paget Témoins Paget TOTAL TOTAL Paget NON-MUTÉS NON-MUTÉS Chr Gènes_# Variants versus témoins versus témoins 1/1 1/2 2/2 1/1 1/2 2/2 1/1 1/2 2/2

1 AMPD2_6 c. 637 + 90 C>T 0 0 267 0 0 231 0 0 295   1 GSTM4_12 c.457-42 C>T 0 26 241 0 22 209 0 32 263   (rs650985) 8 CTHRC1_2 c.372+259 A>G 1 40 221 0 33 194 3 58 233 0,26 0,087 (rs35500845) 8 TM7SF4_9 c.1189 C>T 0 14 253 0 13 218 0 8 287   (rs62620995) 1/1 : Homozygote allèle mineur; 1/2 : Hétérozygote; 2/2 : Homozygote allèle majeur

57 57 58

c) Association génotypique (comparaisons multiples)

Groupe PAGET TOTAL Sous-groupe PAGET NON-MUTÉS

Génotypes (%) P Génotypes (%) P Chr Gènes_# Variants Génotype non RR [ IC 95 % ] non RR [ IC 95 % ] Atteints Témoins corrigée Atteints Témoins corrigée (Ni=267) (Ni=295) (Ni=231) (Ni=295) 1 AMPD2_6 c. 637 + 90 TT vs CC+CT 0 (0) 0 (0)  1,10  0 (0) 0 (0)  1,10  C>T CC vs TT+CT 267 (100) 295 (100) 0,91 231 (100) 295 (100) 0,78     CT vs CC+TT 0 (0) 0 (0) 1,10 0 (0) 0 (0) 1,10     1 GSTM4_12 c.457-42 TT vs CC+CT 0 (0) 0 (0) 0,67 1,10  0 (0) 0 0,77 1,28 

CC vs TT+CT 241 (90) 263 (89) 0,79 1,12 [0,65 - 1,94] 209 (90) 263 (89) 0,74 1,15 [0,65 - 2,04] C>T

(rs650985) CT vs CC+TT 26 (9,7) 32 (11) 0,88 0,89 [0,52 - 1,54] 22 (9,5) 32 (11) 0,83 0,87 [0,49 - 1,54]

8 CTHRC1_2 c.372+259 GG vs AA+AG 1 (0,38) 3 (1,0) 0,32 0,48 [0,049 - 4,62] 0 (0) 3 (1,0) 0,10 0,16  A>G AA vs GG+AG 221 (84) 233 (79) 0,14 1,41 [0,91 - 2,18] 194 (85) 233 (79) 0,079 1,53 [0,96 - 2,43]

(rs35500845) AG vs AA+GG 40 (15) 58 (20) 0,19 0,74 [0,47 - 1,15] 33 (15) 58 (20) 0,14 0,70 [0,44 - 1,11]

8 TM7SF4_9 c.1189 TT vs CC+CT 0 (0) 0 (0) 0,058 1,10  0 (0) 0 (0) 0,044 1,28  C>T CC vs TT+CT 253 (95) 287 (97) 0,10 0,52 [0,21 - 1,25] 218 (94) 287 (97) 0,076 0,48 [0,19 - 1,17]

(rs62620995) CT vs CC+TT 14 (5,2) 8 (2,7) 0,10 1,93 [0,80 - 4,69] 13 (5,6) 8 (2,7) 0,072 2,09 [0,85 - 5,13]

Ni : Nombre total d’individus dans la cohorte. Le nombre réel d’individus génotypés avec succès peut être inférieur.

58

La MAF du variant CTHRC1_2 des individus atteints par la MOP non porteurs de la mutation SQSTM1/P392L était significativement inférieure à celle des témoins. Les porteurs de ce variant auraient moins de risque de développer la MOP. Par contre, l’allèle mineur était plus fréquent dans le groupe Paget Total que dans le sous-groupe Paget Non-Mutés (8,0 % versus 7,3 %), ce qui suggère que ce variant pourrait influencer le développement de la MOP chez les individus porteurs de la mutation SQSTM1/P392L. La différence entre les MAFs de ce variant dans les groupes Paget Total et Paget Non-Mutés était plus élevée que la différence observée pour les autres variants. Il est à noter que ce variant était plus fréquent dans notre échantillon contrôle composé d’individus appartenant à la population canadienne-française que dans l’échantillon de référence représenté dans la base de données EntrezSNP. Bien que ce variant soit défini comme un variant rare en vertu des critères énoncés précédemment, il était présent chez plus de 5 % des individus sains de notre échantillon.

La valeur p significative obtenue lors de la comparaison entre le nombre d’individus porteurs du génotype homozygote pour l’allèle mineur (TT) du variant TM7SF4_9 par rapport aux deux autres génotypes (CC + CT) indique que la distribution des génotypes pour ce variant rare différait entre les individus atteints par la maladie et les individus sains. La présence d’au moins un allèle majeur (C) dans le génotype aurait un effet protecteur face à la MOP. Ce résultat doit être interprété avec prudence étant donné que le génotype TT était totalement absent de l’échantillon testé et que la probabilité statistique a été obtenue en considérant une distribution génotypique théorique qui respecterait parfaitement l’équilibre d’Hardy-Weinberg. Toutefois, le fait que le génotype hétérozygote était deux fois plus fréquent chez les individus atteints par la maladie que chez les individus sains est en faveur d’une distribution génotypique différente entre les cas et les témoins. Notons aussi que la fréquence de l’allèle mineur T était deux fois plus élevée chez les individus atteints par rapport aux individus sains. La faible fréquence de cet allèle dans notre échantillon explique probablement que cette différence ne respecte pas le seuil de la significativité statistique.

Ni l’analyse individuelle du variant GSTM4_12, ni l’analyse groupée des deux variants du locus 8q22 n’ont permis de mettre en évidence une association génétique avec la MOP. Puisque le variant AMPD 2_6 est complètement absent de l’échantillon qui a été génotypé, il n’a pas été possible d’effectuer l’étude d’association. En raison de sa rareté et de l’impossibilité de confirmer l’absence de ségrégation familiale, ce variant a été séquencé dans un autre échantillon composé de 169 individus (28 individus provenant de la population canadienne-française souffrant d’une forme familiale de la maladie non liée à la mutation SQSTM1/P392L, 74 individus de la population française et 67 individus américains de la région de New York) afin de vérifier s’il s’agissait d’une mutation. Cette hypothèse n’a pu être confirmée puisqu’aucun autre porteur de ce variant n’a été identifié dans l’échantillon supplémentaire. Le variant EPS8L3_3 n’a pas été génotypé par Sequenom dû à la présence d’un autre polymorphisme à proximité empêchant la production des données. Les données manquantes n’ont pas pu être obtenues par séquençage en raison de difficultés techniques.

59

60

5. DISCUSSION

La MOP se transmet sur un mode autosomique dominant avec une pénétrance incomplète. Entre 15 et 40 % des individus souffrant de MOP ont une histoire familiale positive. (Michou, 2011) Actuellement, plusieurs mutations du gène SQSTM1 codant pour la protéine p62 ont été répertoriées. (Chung, 2011) Dans la population canadienne-française, la mutation P392L, a été identifiée chez 46 % des individus souffrant d’une forme familiale et 16 % des individus souffrant d’une forme sporadique de MOP, ce qui suggère l’implication d’autres gènes (Laurin, 2002). Selon Albagha et coll. (2011), 86 % des cas de MOP chez les individus non porteurs d’une mutation de SQSTM1 seraient expliqués par sept loci de susceptibilité à la MOP identifiés au moyen de deux études pangénomiques d’association.

Les objectifs de cette étude consistaient à répliquer et à caractériser les associations génétiques observées entre la MOP et les loci 1p13 et 8q22 dans la population canadienne-française, à identifier des variants génétiques rares au sein des meilleurs gènes candidats à la MOP situés dans une région de 500 kb de part et d’autre de CSF1 (1p13) et de 1 Mb de part et d’autre de TM7SF4 (8q22). Les objectifs secondaires de cette étude étaient de rechercher une association génétique entre certains variants rares de ces loci et la MOP grâce à une cohorte de 267 individus atteints par la MOP et de 295 individus sains appartenant à la population canadienne-française et de mettre au point une méthode efficace permettant d’optimiser l’utilisation des ressources nécessaires à l’exploration du rôle de variants génétiques rares dans la susceptibilité génétique à une maladie.

5.1. ASSOCIATION GÉNÉTIQUE ENTRE LA MOP ET LES LOCI 1P13 ET 8Q22 DANS LA POPULATION CANADIENNE- FRANÇAISE Les associations décrites par Albagha (2010) et Chung (2010) entre la MOP et les loci 1p13 et 8q22 ont été répliquées dans la population canadienne-française. En ce qui concerne le locus 1p13, l’association a été confirmée à la fois pour les fréquences alléliques et pour les distributions génotypiques. L’association entre la MOP et le locus 8q22 a seulement été confirmée en considérant les distributions génotypiques. Notons qu’aucune association allélique n’avait été découverte pour ce locus dans l’échantillon d’individus d’origine néerlandaise étudiée par Chung (2010). Globalement, les fréquences alléliques des quatre variants communs étudiés dans la population canadienne-française sont comparables à celles décrites dans les deux articles précédemment nommés pour les individus atteints et les individus témoins (Tableau).

61 Tableau 7. Comparaison des fréquences de l’allèle mineur des quatre variants communs associés avec la MOP chez des individus non mutés appartenant à différentes populations

Beauregard 2012 Albagha 2010 Chung 2010 Locus Variants Canadiens français Européens a Belges Néerlandais Non-Mutés Atteints Témoins Atteints Témoins Atteints Témoins Atteints Témoins

(N=480) (N=594) (N=2500) (N=3074) (N=494) (N=510) (N=158) (N=190)

1p13 rs484959 G>A 0,31 0,42 0,35 0,49 0,29 0,45 0,38 0,47

1p13 rs499345 C>A 0,42 0,33 0,40 0,29 0,45 0,31 0,42 0,29

1p13 rs10494112 A>G 0,31 0,22 0,30 0,20 0,33 0,22 0,33 0,24

8q22 rs2458413 G>A 0,60 0,57   0,69 0,58 0,61 0,64 a : Moyenne pondérée des MAF de l’échantillon de découverte et de l’échantillon de réplication N : Nombre total d’allèles disponibles dans la cohorte. Le nombre réel d’allèles génotypés avec succès peut être inférieur.

L’étude des génotypes a démontré que les distributions des génotypes entre les cas et les témoins est différentes pour les quatre variants communs investigués, et ce, tant pour le groupe Paget Total que pour le sous-groupe Paget Non-Mutés. Les porteurs de deux allèles mineurs du variant commun rs484959 sont moins à risque de développer la MOP, alors que les porteurs de deux allèles majeurs de ce polymorphisme ont un risque plus élevé de développer la maladie. Pour les trois autres variants communs étudiés, soit rs499345, rs1049345 et rs2458413, le statut d’homozygote pour l’allèle majeur est associé à une diminution du risque de souffrir de la MOP, tandis que le statut d’hétérozygote augmente la susceptibilité à la maladie. Il convient de rappeler que, malgré qu’ils soient associés à la MOP, les polymorphismes investigués n’ont probablement pas d’effets fonctionnels dans la pathogenèse de la maladie. L’existence de ces associations génotypiques entre la MOP et ces polymorphismes n’avait pas été rapportée dans la littérature jusqu’à maintenant.

Des corrélations entre un génotype et le sexe des individus atteints ont été observées pour les trois variants communs investigués au locus 1p13. Les femmes qui possèdent deux copies de l’allèle mineur A du variant commun rs484959 ne semblent pas bénéficier d’un effet protecteur aussi important que les hommes porteurs du même génotype. Par ailleurs, les hommes porteurs d’un génotype qui comprend au moins un allèle mineur des variants communs rs499345 ou rs10494112 ont un risque plus élevé de développer la MOP comparativement aux femmes qui possèdent ces mêmes génotypes. Des corrélations entre des génotypes et la présence de la mutation SQSTM1/P392L ont aussi été observées. Les individus non porteurs de la mutation SQSTM1/P392L qui possèdent au moins un allèle mineur des variants communs rs499345 ou rs10494112 sont plus à risque de développer la MOP que les individus mutés qui possèdent ces mêmes génotypes. L’existence de corrélation entre le génotype pour ces polymorphismes et le phénotype de la MOP n’avait pas été rapportée dans la littérature jusqu'à présent.

62

5.2. IDENTIFICATION DE VARIANTS GÉNÉTIQUES RARES AU SEIN DES GÈNES CANDIDATS À LA MOP SITUÉS AUX LOCI 1p13 ET 8q22. Au total, 156 variants génétiques ont été identifiés. De ce nombre, près de la moitié, soit 74 variants, ont une MAF estimée inférieure à 5 %. L’identification d’autant de variants peu fréquents était prévisible si l’on se fie aux données du projet ENCODE, lors duquel le génome entier de 45 individus a été séquencé. Selon Gorlov et coll. (2008), la moitié des variants identifiés lors du projet ENCODE a une MAF inférieure à 5 %.

Au total, 74 variants rares potentiels ont été identifiés dans l’échantillon de découverte, soit 57 au locus 1p13 et 17 au locus 8q22. Parmi ces variants rares, 15 sont situés dans un exon. Six des 15 variants rares (40 %) situés dans un exon ont été observés uniquement chez un individu sain. Il n’a pas été possible de déterminer si ces variants conféraient un effet protecteur aux individus qui les possédaient, puisque les variants identifiés uniquement chez un individu sain de l’échantillon de découverte n’ont pas été étudiés davantage dans le cadre de ce projet. Notons toutefois que tous les variants rares exoniques identifiés uniquement chez des individus sains de l’échantillon de découverte sont situés dans les gènes pour lesquels une association avec la MOP a été observée au cours du projet, soit les gènes CTHRC1 et TM7SF4. Il pourrait s’agir de variants spécifiques à la population canadienne française n’ayant aucun lien avec la MOP. Il pourrait aussi s’agir d’allèles protecteurs absents des individus pagétiques. La présence d’allèles protecteurs et d’allèles de susceptibilité influençant inversement le niveau d’expression d’un même gène viendrait compliquer la recherche d’association entre un groupe de variants et la MOP puisque les effets des variants pourraient s’annuler entre eux.

5.3. ASSOCIATION GÉNÉTIQUE ENTRE LA MOP ET DEUX VARIANTS GÉNÉTIQUES DU LOCUS 8q22 Des associations génétiques ont été observées entre la MOP et deux variants rares du locus 8q22.

5.3.1. Association allélique entre la MOP et le gène CTHRC1, gène codant pour une protéine impliquée dans la prolifération et la différenciation de cellules précurseurs d’ostéoblastes Une association allélique a été observée entre la MOP et le variant intronique CTHRC1_2 (rs35500845, c.372+259A>G) qui entraîne la création d’un nouveau site accepteur d’épissage selon Human Splicing Finder. L’allèle mineur G du variant CTHRC1_2 est plus fréquent chez les individus sains (10,9 %) que chez les individus atteints par la MOP (7,3 %). Les individus porteurs de ce variant bénéficieraient donc d’un effet protecteur et risqueraient moins de développer la MOP que les individus ne possédant pas ce variant. Toutefois, une étonnante différence entre les MAFs du variant CTHRC1_2 dans le groupe Paget Total et le

63 sous-groupe Paget Non-Mutés (8,0 % versus 7,3 %) indique que le variant est plus fréquent chez les individus pagétiques porteurs de la mutation SQSTM1/P392L. En fait, la MAF de ce variant chez les individus mutés atteints par la MOP est de 15%. Il pourrait donc agir comme un modificateur du gène SQSTM1 puisque les individus mutés qui possèdent un allèle mineur G du variant CTHRC1_2 semblent plus à risque de développer la MOP que les individus non mutés qui sont porteurs du même allèle. Cette hypothèse n’a pu être confirmée dans cette étude en raison d’un manque de puissance associé au faible nombre d’individus mutés disponibles dans l’échantillon. Même si elle était confirmée, cette association ne pourrait pas expliquer l’association observée par Chung (2010) et Albagha (2011) entre la MOP et le locus 8q22, puisque les individus porteurs d’une mutation de SQSTM1/P392L ont été exclus des études pangénomiques d’association qu’ils ont réalisées.

Le gène CTHRC1 est exprimé dans le tissu osseux, mais il est absent de plusieurs autres tissus, dont le cerveau, le cœur, les poumons, le foie, la rate, les reins, les muscles squelettiques et les testicules. (Kimura et al., 2008) Des études in vitro, ont permis de constater qu’il stimule la prolifération et la différentiation des progéniteurs d’ostéoblastes, probablement via la stimulation de l’expression de gènes spécifiques aux ostéoblastes comme le gène codant pour la phosphatase alcaline, le gène Col1A1 et l’ostéocalcine. (Kimura et al., 2008; LeClair et al., 2007) In vivo, les souris dont le gène CTHRC1 a été inactivé possèdent moins d’ostéoblastes et ont un taux de formation osseuse et un volume osseux diminués par rapport à des souris sauvages (Wild-Type). Inversement, les souris dont le gène CTHRC1 est surexprimé dans les ostéoblastes possèdent plus d’ostéoblastes et ont un taux de formation et un volume osseux augmentés. (Kimura et al., 2008) Par ailleurs, les souris surexprimant CTHRC1 dans toutes leurs cellules ont une masse osseuse diminuée. (LeClair et al., 2007) De plus, il a été suggéré que CTHRC1 pouvait être impliqué dans la voie de signalisation BMP-SMAD, jouant un rôle dans la régulation du remodelage osseux et la voie Wnt de polarité planaire cellulaire, impliquée dans l’embryogenèse des membres. (Kimura et al., 2008; Wang et al., 2011; Yamamoto et al., 2008) L’activation de la voie Wnt de polarité planaire cellulaire par CTHRC1 entraîne la suppression de la voie canonique Wnt, impliquée dans la prolifération et la différenciation des cellules mésenchymateuse en ostéoblastes. (Monroe et al., 2011; Yamamoto et al., 2008) Toutes ces observations suggèrent que le gène CTHRC1 est impliqué dans la régulation du remodelage osseux, mais que sa fonction diffère selon le type de cellules dans lesquelles il est exprimé. (Kimura et al., 2008) Le variant CTHRC1_2 pourrait donc avoir un impact dans le développement de la MOP, en influençant l’expression du gène dans certaines cellules spécifiques. D’ailleurs, une augmentation de l’expression du gène CTHRC1 chez certains individus pagétiques pourrait aussi expliquer que les individus atteints par la MOP démontrent plus fréquemment des signes d’artériosclérose et des calcifications des vaisseaux sanguins que des individus sains. (Laroche et Delmotte, 2005; Strickberger et al., 1987) En effet, Pyagay et coll. (2005) ont observé que le gène CTHRC1 est exprimé dans la paroi externe des vaisseaux sanguins ayant subi une lésion tissulaire et

64

dans les plaques athéromateuses calcifiées, alors qu’il ne l’est pas dans les artères saines. Aucune hypothèse soulevée pour expliquer l’association de la MOP avec la présence de calcifications vasculaires en plus grand nombre n’avait été confirmée jusqu’à maintenant.

5.3.2. Association génotypique entre la MOP et le gène TM7SF4, codant pour une protéine impliquée dans la multinucléation des ostéoclastes Une association génotypique a aussi été observée entre la MOP et le variant exonique TM7SF4_9 (rs62620995, c.1189C>T, p.Leu397Phe) qui altère une leucine faisant partie du septième domaine transmembranaire présumé de la protéine. (Hartgers et al., 2000) Selon Zhang (2000), ce changement d’acide aminé constitue un changement radical puisque la leucine, une petite molécule non polaire, est remplacée par une grosse molécule non polaire, la phénylalanine. De plus, cette altération est prédite comme étant probablement dommageable pour la fonction du gène par PolyPhen et Condel. Compte tenu de ces caractéristiques, la probabilité que ce variant du gène TM7SF4 ait des répercussions sur la fonction de la protéine encodée DC-STAMP est élevée.

La distribution des génotypes de ce variant diffère entre les individus atteints par la MOP et les individus sains. Le fait de posséder au moins une copie de l’allèle mineur T semble favoriser le développement de la maladie puisqu’environ deux fois plus d’individus atteints que d’individus sains sont hétérozygotes pour ce variant (13/251: 5,6 % versus 8/287: 2,7 %). Il faut tout de même demeurer prudent en interprétant ces résultats puisqu’aucun individu de l’échantillon testé n’est homozygote pour l’allèle mineur et que le test statistique utilisé, soit le risque relatif génotypique selon Lathrop, considère une distribution théorique des génotypes des témoins.

Selon Hartgers et coll. (2000) la protéine DC-STAMP, encodée par le gène TM7SF4, interagit avec des protéines de la famille ERM impliquées dans la liaison du cytosquelette et de la membrane plasmatique. De ce fait, elle pourrait affecter l’adhésion ou la mobilité des cellules qui l’expriment, comme les ostéoclastes. Yagi et coll. (2005) ont d’ailleurs observé qu’aucun ostéoclaste multinucléé n’est formé par des souris pour lesquelles le gène TM7SF4 est invalidé. Le remodelage osseux de ces souris est découplé, ce qui signifie que la formation osseuse est augmentée, alors que la résorption osseuse est diminuée en raison de l’absence d’ostéoclastes multinucléés. (Miyamoto, 2011) La dérégulation de remodelage osseux de ces souris est démontrée par une masse osseuse plus élevée et des trabécules osseuses plus nombreuses que pour les souris sauvages. Le phénotype des souris TM7SF4-/- observé par Yagi et coll. (2005) serait même compatible avec une forme légère d’ostéopétrose. Puisque l’hypermultinucléation est l’une des caractéristiques distinctives des ostéoclastes pagétiques, il faudrait que le variant TM7SF4_9 accroisse l’activité de la protéine

65 encodée DC-STAMP, via une modification de l’expression du gène ou une altération du mécanisme d’internalisation de la protéine, pour avoir un effet potentiel sur le développement de la maladie. (Singer et al., 2006) Mensah et coll. (2010) ont constaté que des macrophages stimulés avec du RANKL qui internalisent les protéines DC-STAMP peuvent se fusionner pour créer des cellules multinucléées, alors que les cellules qui possèdent un niveau élevé de protéines DC-STAMP localisées dans la membrane plasmatique ne parviennent pas à se fusionner. Ces observations suggèrent que le récepteur DC-STAMP doit être internalisé à la suite de sa liaison avec son ligand pour permettre la formation d’ostéoclastes multinucléés. Le variant TM7SF4_9 pourrait entraîner une dysfonction de l’internalisation du récepteur DC-STAMP puisqu’il modifie un acide aminé d’un des domaines transmembranaires de la protéine. Ces suggestions demeurent hypothétiques puisque même s’il est confirmé que la protéine DC-STAMP est essentielle à la multinucléation des ostéoclastes, aucune étude n’a démontré qu’une augmentation de la fonction de la protéine DC-STAMP pouvait causer l’hypermultinucléation de cellules. Bien entendu, des études fonctionnelles seront nécessaires pour déterminer si le variant TM7SF4_9 joue un rôle dans le développement de la MOP. Advenant le cas où ce variant entraînerait une diminution de l’activité du gène TM7SF4 ou de la protéine DC-STAMP, il serait intéressant de vérifier s’il est associé à l’ostéopétrose puisque cette maladie peut coexister avec la MOP chez certains individus. (Laurin et al., 2001)

5.4. RETOUR SUR LA MÉTHODE UTILISÉE POUR EXPLORER LE RÔLE DE VARIANTS GÉNÉTIQUES RARES DANS LA SUSCEPTIBILITÉ GÉNÉTIQUE À UNE MALADIE Le fait de séquencer un petit échantillon d’individus pour détecter la présence de variants rares semble être une approche efficace, puisque 74 variants génétiques répondant à la définition préétablie d’un variant rare ont été identifiés. La très grande majorité de ces variants n’auraient pu être identifiés via une étude pangénomique d’association.

5.4.1. Limites de l’étude et améliorations potentielles Des décisions méthodologiques et les caractéristiques de la cohorte étudiée ont pu limiter l’étude.

L’ADN séquencé et génotypé pendant le projet a été extrait à partir des cellules sanguines des participants à l’étude. Compte tenu de la provenance de l’ADN qui a été utilisé, il est impossible de confirmer que des variants rares somatiques des gènes étudiés ne se retrouvent pas dans le tissu osseux des individus étudiés. D’ailleurs, des mutations présentes uniquement dans l’ADN provenant du tissu osseux de deux patients pagétiques, ont déjà été observées au sein du gène SQSTM1. (Merchant et al., 2009) Des mutations ou des variants rares somatiques pourraient notamment expliquer le caractère focal de la MOP.

66

Une approche gène candidat a été utilisée pour ce projet. Des gènes dont les fonctions sont peu connues jusqu’à ce jour et des gènes impliqués dans des mécanismes physiopathologiques de la MOP non élucidés jusqu’à maintenant ont donc pu être rejetés de l’étude au stade de la sélection des meilleurs gènes candidats à la MOP.

Les variants rares ont été recherchés uniquement dans les exons, les jonctions intron-exon et les promoteurs des gènes sélectionnés. Cette stratégie est communément utilisée pour la recherche de variants rares et a permis d’identifier de nombreux variants ayant des répercussions fonctionnelles importantes sur certains gènes ou certaines protéines qui sont impliqués dans le développement d’autres maladies (Cohen et al., 2004; Fearnhead et al., 2004; Hershberger et al., 2010; Iascone et al., 2011; Nejentsev et al., 2009) Toutefois, des variants associés à la MOP pourraient aussi se situer au sein de régions non codantes qui n’ont pas été séquencées au cours du projet. En fait, plus de 80 % des variants pour lesquels des associations avec une maladie ont été identifiées jusqu’à maintenant sont non codants. Aussi, plusieurs différences phénotypiques sont attribuables à des variations au sein de régions régulatrices ou à la modification du niveau d’expression de certains gènes. (Cooper et Shendure, 2011) Ces observations appuient l’hypothèse selon laquelle des variants fonctionnels pourraient être situés dans des régions non codantes. (Manolio et al., 2009) D’ailleurs, une mutation causale d’une forme sévère de rétinite pigmentaire liée à l’X a récemment été identifiée dans une région intronique à plus de 700 pb d’un exon du gène OFD1. L’approche de séquençage de gènes candidats avait préalablement échoué à déceler une mutation causale à l’intérieur d’un locus de susceptibilité. (Webb et al., 2012)

La technologie de séquençage de nouvelle génération, pourrait être utilisée pour contourner les deux limites énoncées précédemment. Grâce à cette technologie, il serait possible de séquencer en entier les deux régions chromosomiques étudiées dans le projet. Cette méthode permettrait de détecter tous les variants rares des régions introniques et intragéniques dont les individus de l’échantillon de découverte sont porteurs, en plus d’éviter les biais causés par la sélection a priori des gènes candidats à séquencer. De nouveaux mécanismes physiopathologiques pourraient ainsi être mis en évidence.

Les variants génétiques identifiés ont été définis comme des variants rares si la MAF répertoriée dans la base de données EntrezSNP était inférieure à 5 % (0,05) ou encore si aucune valeur de MAF de référence n’était disponible dans cette même base de données. Bien qu’il soit probable que la majorité des variants non répertoriés dans cette base de données soient effectivement peu fréquents, il est impossible de le garantir. De plus, certaines estimations des MAFs de variants génétiques sont basées sur les données obtenues pour quelques individus; les valeurs de référence indiquées ne sont donc pas toujours représentatives des MAFs observées dans la population. Aussi, comme les variants rares sont théoriquement spécifiques à certaines

67 populations, la MAF moyenne d’un variant au sein de plusieurs populations ne représente pas nécessairement la MAF de ce variant dans la population canadienne-française. Inversement, les résultats obtenus dans cette étude d’association ne sont pas généralisables à d’autres populations. (Marian, 2012) De plus, le fait d’étudier une population à effet fondateur peut avoir mené à la détection de variants population-spécifiques qui ne sont pas spécifiques à la maladie étudiée. L’utilisation des MAFs répertoriées dans la population européenne selon le Projet 1000 génomes aurait permis une meilleure estimation des MAFs dans la population canadienne- française. Malheureusement, il n’était pas possible d’utiliser ces données au début de l’étude. Compte tenu qu’un très grand nombre de variants génétiques répondaient à la définition préétablie d’un variant rare, il serait envisageable de réduire le seuil de MAF de référence d’un variant rare à 3 % lors d’un projet futur visant à identifier des variants rares.

La sélection des variants rares pour l’étude d’association a été effectuée en se fiant à des prédictions in silico à propos des effets fonctionnels des variants identifiés. Les outils de prédictions in silico sont d’une grande aide pour prioriser les variants à étudier. Toutefois, il existe un risque d’erreur relié à leur utilisation. Ainsi, des variants réellement fonctionnels peuvent être prédits bénins, alors que des variants bénins peuvent être prédits dommageables pour la fonction d’un gène. Généralement, plusieurs outils d’analyse in silico ont été utilisés pour étudier une même caractéristique, ce qui augmente à la fois la probabilité que les prédictions d’effets fonctionnels soient exactes et la probabilité d’avoir rejeté un variant réellement fonctionnel. Par exemple, le chevauchement entre les prédictions de SIFT et de PolyPhen varie entre 5% et 70% selon les paramètres programmés dans chacun de ces deux outils basés sur l’analyse de la conservation des acides aminés. (Hicks et al., 2011) Les différences parfois observées entre les prédictions émises s’expliquent notamment par l’utilisation d’algorithmes distincts qui utilisent des espèces et des seuils de conservation différents et qui incluent ou non des données structurales ou fonctionnelles. (Chun et Fay, 2009; Di et al., 2009; Naken et al., 2007) La sensibilité individuelle de ces deux outils est d’environ 70%. (Flanagan et al., 2010) Somme toute, le fait de considérer les résultats de plusieurs outils de prédiction des effets d’une modification d’un acide aminé au sein d’une protéine a semblé une bonne façon d’identifier des variants associés à la MOP. En effet, cette stratégie a mené à l’identification d’une association entre un variant rare du gène TM7SF4 et la MOP. Par ailleurs, l’apparence de spécificité d’un variant rare à la MOP dans un échantillon de découverte comportant un nombre disproportionné de cas et de témoins ne s’est pas avérée être un bon critère de priorisation des variants rares. Aussi, l’étude de la ségrégation familiale ne s’est pas avérée essentielle pour sélectionner les variants rares à étudier davantage; aucune ségrégation familiale entre la maladie et un variant rare n’a été observée. Cette observation n’est guère surprenante puisque la pénétrance de la plupart des variants rares serait inférieure au seuil nécessaire pour causer une ségrégation familiale perceptible qui est d’environ 50 %. (Bodmer et Bonilla, 2008) Dans un projet futur, il serait préférable d’utiliser au moins un autre outil pour effectuer les prédictions in silico concernant la création ou l’altération de

68

sites d’épissages par les variants identifiés, afin de confronter les résultats prédits par les différents outils. Les programmes NNSPLICE et SplicePredictor seraient de bons choix. Ils sont faciles à utiliser et ils ont permis d’identifier l’ajout d’un site d’épissage causant la création d’un nouvel exon du gène OFD1 impliqué dans la rétinite pigmentaire liée à l’X. (Webb et al., 2012) Il serait aussi important que des variants rares qui altèrent ou qui créent un site d’épissage ou un site de liaison à un facteur de transcription soient sélectionnés pour une étude d’association afin de déterminer si ce type de prédictions doit être utilisé pour prioriser les variants à étudier. De plus, si l’apparence de spécificité à la MOP demeurait un critère de sélection des variants à étudier, l’échantillon de découverte devrait contenir un plus grand nombre d’individus témoins. Aussi, l’étude de la ségrégation familiale ne devrait être réalisée qu’après avoir effectué l’étude d’association, dans le but de vérifier si un variant génétique absent chez tous les individus sains est une mutation.

L’étude d’association entre la MOP et les variants rares sélectionnés parmi ceux identifiés dans l’échantillon de découverte a comporté certaines difficultés. Les faibles MAF de ces variants ont contribué à ce qu’aucun individu homozygote ne soit présent dans l’échantillon génotypé pour trois des quatre variants rares sélectionnés. Aussi, peu de variants ont été génotypés, ce qui a empêché le regroupement pertinent de plusieurs variants dans une même analyse génétique. Il a donc été impossible de vérifier si les individus atteints par la MOP possédaient globalement plus de variants rares que les individus sains. Un plus grand nombre de variants pourraient être sélectionnés pour effectuer l’étude d’association, afin d’être en mesure d’effectuer le regroupement, dans une seule analyse statistique, de plusieurs variants appartenant au même locus, au même gène ou encore faisant partie de la même voie de signalisation. Il faudrait notamment s’assurer de sélectionner plusieurs variants appartenant aux mêmes gènes pour l’étude d’association. Le regroupement de variants permettrait entre autres de réduire l’influence des faibles valeurs des MAF sur la puissance de notre cohorte. Il va sans dire qu’une plus grosse cohorte pourrait aussi permettre d’obtenir des associations significatives en dépit des faibles MAF des variants étudiés. Plus la taille de la cohorte est restreinte, plus l’observation d’association significative est difficile malgré une différence importante des MAF entre les cas et les témoins. (Li et al., 2010) Toutefois, en pratique, il est difficile d’augmenter considérablement la taille de la cohorte.

L’échantillon utilisé pour l’étude d’association était composé d’individus atteints de MOP et non apparentés, alors que l’échantillon de découverte était composé d’individus souffrant d’une forme familiale de MOP. Or, il est impossible de confirmer que les mêmes variants sont impliqués dans les deux formes de la maladie. D’ailleurs, le variant CTHRC1_2, pour lequel un effet protecteur a été identifié dans le sous-groupe « Paget Non-Mutés », semble être un facteur de risque pour les individus porteurs de la mutation SQSTM1/P392L. Par contre, puisque l’échantillon utilisé pour effectuer l’étude d’association comportait peu d’individus possédant la

69 mutation SQSTM1/P392L, il est difficile de confirmer si ce variant a un effet modificateur lorsqu’il se retrouve chez un individu muté.

5.4.2. Forces de l’étude L’approche gène candidat employée pour réaliser cette étude peut être associée aux limites qui ont été énumérées plus haut. Cependant, puisque les gènes sont sélectionnés sur la base de leur implication dans la régulation du tissu osseux, tous les variants identifiés qui altèrent la fonction de ces gènes ont un rôle potentiel dans la pathogenèse de la MOP. L’identification de variants génétiques ayant des effets fonctionnels qui peuvent influencer le développement de la maladie est donc facilitée.

L’étude d’une population à effet fondateur peut aussi être associée aux limites qui ont été mentionnées dans la section précédente. Toutefois, puisque les différents effets fondateurs ont joué un rôle dans la sélection des variants rares et que la dérive génétique a entraîné la modification aléatoire de la fréquence de certains allèles, la détection de variants rares est facilitée dans ce type de population. (Bodmer et Bonilla, 2008) En effet, il est plus probable que des individus provenant d’une même population à effet fondateur partagent des variants à risque et que ces variants nécessitent des facteurs extérieurs communs. (Marian, 2012) De plus, puisque les individus atteints et les individus témoins proviennent de la même population à effet fondateur, la puissance des analyses est améliorée, car la probabilité que des différences de structures de population existent entre les deux groupes est diminuée. (Bodmer et Tomlinson, 2010; Marian, 2012) Notons que l’utilisation de deux échantillons indépendants, soit un échantillon de découverte et un échantillon indépendant pour l’étude d’association, permet de corriger l’augmentation de l’erreur  qui survient lorsque différentes proportions d’individus atteints et de témoins sont séquencées dans le but d’identifier des variants. (Ku et al., 2010; Li et al., 2010)

La méthode de référence pour la détection de variants non communs par séquençage a été utilisée dans cette étude. En effet, dans le but d’identifier les facteurs génétiques responsables l’association observée par Albagha (2010) et Chung (2010), les deux régions ciblées des loci 1p13 et 8q22 ont été séquencées par la méthode de Sanger. (Ku et al., 2010; Manolio et al., 2009)

5.5. DÉMARCHES COMPLÉMENTAIRES Des études de réplications indépendantes effectuées dans d’autres populations pourraient permettre de confirmer les associations observées entre la MOP et les variants TM7SF4_9 et CTHRC1_2. Toutefois, étant donné que les variants rares peuvent être spécifiques à une population, l’absence de réplication dans une autre population ne signifierait pas l’absence d’association dans la population canadienne-française. Idéalement, les régions entourant les variants associés devraient aussi être étudiées afin de vérifier si les

70

individus atteints par la MOP possèdent plus de variants dans ces deux gènes que les individus sains. Une telle observation suggèrerait un rôle du gène en question dans la physiopathologie de la maladie. Il serait intéressant de vérifier l’existence d’associations génotypes-phénotypes entre les variants identifiés et la MOP. Il serait aussi intéressant de vérifier l’existence d’une association entre la MOP et un haplotype.

Des études fonctionnelles seraient nécessaires pour déterminer si les deux variants associés à la MOP dans la population canadienne-française jouent un rôle dans le développement de la maladie. Les niveaux d’expression des ARN messagers pourraient être étudiés par RT-PCR. Les effets fonctionnels des variants sur le phénotype des cellules osseuses et sur le remodelage osseux pourraient être évalués au moyen de cultures d’ostéoblastes ou de co-cultures d’ostéoclastes avec une lignée de cellules stromales.

5.6. INTÉRÊTS ET APPORTS DE L’ÉTUDE Cette étude a mené à l’identification de plusieurs variants rares chez des individus de la population canadienne-française souffrant de MOP. Jusqu’à maintenant, aucune autre étude portant sur les variants rares dans la MOP n’a été rapportée dans la littérature. Par ailleurs, la contribution des variants rares dans l’ostéoporose a été investiguée. (Mendes et al., 2011) Li et coll. (2011) ont observés que quatre variants rares du gène LRP5, délétères selon SIFT, sont plus fréquents dans un groupe d’enfants enclins aux fractures, alors que deux variants rares bénins du même gène sont aussi fréquents chez les cas et chez les témoins. De plus, un variant rare du gène WNK4 est potentiellement associé à une faible densité minérale osseuse dans la population portugaise. La MAF de ce variant est deux fois plus élevée chez les individus ayant une faible densité minérale osseuse (2,2 %) que chez les témoins (0,9 %). (Mendes et al., 2011) Dans la population canadienne-française, des variants rares potentiellement impliqués dans d’autres maladies que la MOP ont aussi déjà été identifiés. Plusieurs de ces variants rares ont été identifiés dans des gènes investigués en raison de leur rôle potentiel dans la physiopathologie du cancer de sein ou du cancer de l’ovaire. (Desjardins et al., 2009, 2008; Durocher et al., 2006, 1996; Guénard et al., 2009; Plourde et al., 2009) Peu de ces variants rares étaient effectivement associés au cancer du sein ou de l’ovaire. D’autres variants rares ont été identifiés chez des individus souffrant de la maladie affective bipolaire originaires de la région du Saguenay-Lac-Saint- Jean. Deux associations génotypiques ont d’ailleurs été observées entre cette maladie et des variants rares des gènes KIAA1595 et CCDC92 (FLJ22471). (Shink et al., 2005)

Jusqu’à maintenant, peu d’études ont tenté d’établir une méthode visant à étudier de façon optimale l’effet des variants rares. Contrairement à la présente étude, où les gènes candidats ont été sélectionnés en fonction de leur position au sein d’un locus associé à la MOP et de leur rôle potentiel dans la physiopathologie de la maladie, la plupart des études réalisées jusqu’à maintenant ont recherché des variants rares ou des mutations situés dans des gènes candidats uniquement par la fonction. C’est le cas d’études portant sur la dyslipidémie

71 ou sur certaines malformations cardiaques. (Cohen et al., 2004; Hershberger et al., 2010, 2008; Iascone et al., 2011) Dans une étude sur le diabète de type 1, le rôle de certains gènes renfermant un variant commun associé à cette maladie a été investigué, mais les autres gènes à proximité ont été laissés de côté. (Nejentsev et al., 2009) Une autre étude portant sur la dyslipidémie a aussi permis d’identifier des variants rares ayant de grandes effets de taille dans 11 gènes pour lesquels des variants communs responsables d’une faible augmentation du risque de développer cette maladie avaient été identifiés. (Lusis et Pajukanta, 2008) Puisque les variants génétiques causaux responsables de l’observation d’une association génétique via une étude pangénomique d’association peuvent être situés à des millions de paires de bases du variant commun associé, il est probable qu’une telle approche échoue à identifier les variants causaux responsables, en partie, du développement d’une maladie. Des façons de prioriser les variants génétiques identifiés au sein d’un gène selon la fréquence du variant et les prédictions d’outils in silico ont déjà été suggérées. Toutefois, la plupart du temps les critères incluent l’absence de la variation identifiée chez tous les individus sains. (Hershberger et al., 2010, 2008; Iascone et al., 2011) Ce critère est approprié pour identifier des mutations, mais il ne l’est pas pour identifier des variants rares. Des stratégies visant à prioriser les variants génétiques identifiés dans le but de découvrir les variants génétiques rares causaux doivent donc être mises au point.

72

6. CONCLUSION

Ce projet a mené à l’identification de 74 variants génétiques rares, soit 57 situés au locus 1p13 et 17 situés au locus 8q22. Des associations génétiques ont été identifiées entre la MOP et deux variants génétiques rares du locus 8q22 dans la population canadienne-française. Une association allélique a été identifiée entre la MOP et un variant (c.1189C>T, p.Leu397Phe) du gène TM7SF4 qui encode la protéine DC-STAMP impliquée dans la multinucléation des ostéoclastes et une association génotypique a été identifiée entre la MOP et un variant intronique (c.372+259A>G) du gène CTHRC1 impliqué dans la régulation du remodelage osseux via son action sur l’ostéoblastogénèse. Le rôle des gènes TM7SF4 et CTHRC1 dans la physiopathologie de la MOP mérite d’être investigué davantage.

Ces découvertes pourraient améliorer les connaissances actuelles sur le remodelage osseux, ainsi que sur la pathogenèse de la MOP ou d’autres maladies osseuses métaboliques telles que l’ostéoporose. Ces connaissances pourraient permettre de développer de nouvelles stratégies de prévention ou d’élaborer de nouveaux tests diagnostiques. Elles pourraient aussi permettre d’identifier de nouvelles cibles thérapeutiques afin de contrôler le remodelage osseux. Aussi, les stratégies utilisées pour prioriser les variants rares à investiguer afin d’optimiser l’utilisation des ressources disponibles pourraient être employées dans d’autres études de reséquençage portant sur des maladies génétiques complexes basée sur une approche gènes candidats dans une population à effet fondateur. Évidemment, les améliorations suggérées plus haut devraient être considérées lors de la planification d’un tel projet.

73

74

Bibliographie

Albagha, O.M.E., Visconti, M.R., Alonso, N., Langston, A.L., Cundy, T., Dargie, R., Dunlop, M.G., Fraser, W.D., Hooper, M.J., Isaia, G., Nicholson, G.C., Del Pino Montes, J., Gonzalez-Sarmiento, R., Di Stefano, M., Tenesa, A., Walsh, J.P., Ralston, S.H., 2010. Genome-wide association study identifies variants at CSF1, OPTN and TNFRSF11A as genetic risk factors for Paget’s disease of bone. Nat. Genet. 42, 520–524.

Albagha, O.M.E., Wani, S.E., Visconti, M.R., Alonso, N., Goodman, K., Brandi, M.L., Cundy, T., Chung, P.Y.J., Dargie, R., Devogelaer, J.-P., Falchetti, A., Fraser, W.D., Gennari, L., Gianfrancesco, F., Hooper, M.J., Van Hul, W., Isaia, G., Nicholson, G.C., Nuti, R., Papapoulos, S., Montes, J. del P., Ratajczak, T., Rea, S.L., Rendina, D., Gonzalez-Sarmiento, R., Di Stefano, M., Ward, L.C., Walsh, J.P., Ralston, S.H., 2011. Genome-wide association identifies three new susceptibility loci for Paget’s disease of bone. Nat. Genet. 43, 685–689.

Altman, R.D., Bloch, D.A., Hochberg, M.C., Murphy, W.A., 2000. Prevalence of pelvic Paget’s disease of bone in the United States. J. Bone Miner. Res. 15, 461–465.

Andrews, C., 2010. The Hardy-Weinberg Principle. Nature Education Knowledge 3, 65.

Bansal, V., Libiger, O., Torkamani, A., Schork, N.J., 2010. Statistical analysis strategies for association studies involving rare variants. Nat. Rev. Genet. 11, 773–785.

Barker, D.J., 1984. The epidemiology of Paget’s disease of bone. Br. Med. Bull. 40, 396–400.

Bastin, S., Bird, H., Gamble, G., Cundy, T., 2009. Paget’s disease of bone—becoming a rarity? Rheumatology 48, 1232–1235.

Beverdam, A., Brouwer, A., Reijnen, M., Korving, J., Meijlink, F., 2001. Severe nasal clefting and abnormal embryonic apoptosis in Alx3/Alx4 double mutant mice. Development 128, 3975–3986.

Beyens, G., Daroszewska, A., De Freitas, F., Fransen, E., Vanhoenacker, F., Verbruggen, L., Zmierczak, H.- G., Westhovens, R., Van Offel, J., Ralston, S.H., Devogelaer, J.-P., Van Hul, W., 2007. Identification of sex-specific associations between polymorphisms of the osteoprotegerin gene, TNFRSF11B, and Paget’s disease of bone. J. Bone Miner. Res. 22, 1062–1071.

Bodmer, W., Bonilla, C., 2008. Common and rare variants in multifactorial susceptibility to common diseases. Nature genetics 40, 695–701.

75 Bodmer, W., Tomlinson, I., 2010. Rare genetic variants and the risk of cancer. Curr. Opin. Genet. Dev. 20, 262–267.

Bolland, M.J., Tong, P.C., Naot, D., Callon, K.E., Wattie, D.J., Gamble, G.D., Cundy, T., 2006. Delayed development of Paget’s disease in offspring inheriting SQSTM1 mutations. Journal of Bone and Mineral Research 22, 411–415.

Bonewald, L.F., 2011. The amazing osteocyte. J. Bone Miner. Res. 26, 229–238.

Caetano-Lopes, J., Canhão, H., Fonseca, J.E., 2009. Osteoimmunology--the hidden immune regulation of bone. Autoimmun Rev 8, 250–255.

Chun, S., and Fay, J.C., 2009. Identification of deleterious mutations within three human genomes. Genome Research 19, 1553–1561.

Chung, P.Y.J., Beyens, G., Boonen, S., Papapoulos, S., Geusens, P., Karperien, M., Vanhoenacker, F., Verbruggen, L., Fransen, E., Van Offel, J., Goemaere, S., Zmierczak, H.-G., Westhovens, R., Devogelaer, J.-P., Van Hul, W., 2010a. The majority of the genetic risk for Paget’s disease of bone is explained by genetic variants close to the CSF1, OPTN, TM7SF4, and TNFRSF11A genes. Hum. Genet. 128, 615–626.

Chung, P.Y.J., Beyens, G., Riches, P.L., Van Wesenbeeck, L., De Freitas, F., Jennes, K., Daroszewska, A., Fransen, E., Boonen, S., Geusens, P., 2010b. Genetic variation in the TNFRSF11A gene encoding RANK is associated with susceptibility to Paget’s disease of bone. Journal of Bone and Mineral Research 25, 2592–2605.

Chung, P.Y.J., Van Hul, W., 2012. Paget’s Disease of Bone: Evidence for Complex Pathogenetic Interactions. Seminars in Arthritis and Rheumatism 41, 619–641.

Cirulli, E.T., Goldstein, D.B., 2010. Uncovering the roles of rare variants in common disease through whole- genome sequencing. Nat. Rev. Genet. 11, 415–425.

Clarke, B., 2008. Normal bone anatomy and physiology. Clinical journal of the American Society of Nephrology 3, S131–S139.

Cody, J.D., Singer, F.R., Roodman, G.D., Otterund, B., Lewis, T.B., Leppert, M., Leach, R.J., 1997. Genetic linkage of Paget disease of the bone to 18q. The American Journal of Human Genetics 61, 1117–1122.

76

Cohen, J.C., Kiss, R.S., Pertsemlidis, A., Marcel, Y.L., McPherson, R., Hobbs, H.H., 2004. Multiple rare alleles contribute to low plasma levels of HDL cholesterol. Science 305, 869–872.

Cooper, C., Harvey, N.C., Dennison, E.M., Van Staa, T.P., 2006. Update on the epidemiology of Paget’s disease of bone. J. Bone Miner. Res. 21 Suppl 2, P3–8.

Cooper, C., Schafheutle, K., Dennison, E., Kellingray, S., Guyer, P., Barker, D., 1999. The epidemiology of Paget’s disease in Britain: is the prevalence decreasing? J. Bone Miner. Res. 14, 192–197.

Cooper, G.M., Shendure, J., 2011. Needles in stacks of needles: finding disease-causal variants in a wealth of genomic data. Nat. Rev. Genet. 12, 628–640.

Cundy, T., 2006. Is the prevalence of Paget’s disease of bone decreasing? J. Bone Miner. Res. 21 Suppl 2, P9–13.

Daroszewska, A., Van’t Hof, R.J., Rojas, J.A., Layfield, R., Landao-Basonga, E., Rose, L., Rose, K., Ralston, S.H., 2011. A point mutation in the ubiquitin-associated domain of SQSMT1 is sufficient to cause a Paget’s disease-like disorder in mice. Human molecular genetics 20, 2734–2744.

Desjardins, S., Beauparlant, J.C., Labrie, Y., Ouellette, G., BRCA, I., Durocher, F., 2009. Variations in the NBN/NBS1 gene and the risk of breast cancer in non-BRCA1/2 French Canadian families with high risk of breast cancer. BMC cancer 9, 181.

Desjardins, S., Belleau, P., Labrie, Y., Ouellette, G., Bessette, P., Chiquette, J., Laframboise, R., Lépine, J., Lespérance, B., Pichette, R., 2008. Genetic variants and haplotype analyses of the ZBRK1/ZNF350 gene in high-risk non BRCA1/2 French Canadian breast and ovarian cancer families. International Journal of Cancer 122, 108–116.

Di, Y.M., Chan, E., Wei, M.Q., Liu, J.-P., and Zhou, S.-F., 2009. Prediction of Deleterious Non-synonymous Single-Nucleotide Polymorphisms of Human Uridine Diphosphate Glucuronosyltransferase Genes. The AAPS Journal 11, 469–480.

Dickson, S.P., Wang, K., Krantz, I., Hakonarson, H., Goldstein, D.B., 2010. Rare variants create synthetic genome-wide associations. PLoS biology 8, e1000294.

Durocher, F., Labrie, Y., Soucy, P., Sinilnikova, O., Labuda, D., Bessette, P., Chiquette, J., Laframboise, R., Lépine, J., Lespérance, B., 2006. Mutation analysis and characterization of ATR sequence variants in breast cancer cases from high-risk French Canadian breast/ovarian cancer families. BMC cancer 6, 230.

77 Durocher, F., Shattuck-Eidens, D., McClure, M., Labrie, F., Skolnick, M.H., Goldgar, D.E., Simard, J., 1996. Comparison of BRCA1 polymorphisms, rare sequence variants and/or missense mutations in unaffected and breast/ovarian cancer populations. Human molecular genetics 5, 835–842.

Falchetti, A., Masi, L., Brandi, M.L., 2010. Paget’s disease of bone: there’s more than the affected skeletal--a clinical review and suggestions for the clinical practice. Curr Opin Rheumatol 22, 410–423.

Fearnhead, N.S., Wilding, J.L., Winney, B., Tonks, S., Bartlett, S., Bicknell, D.C., Tomlinson, I.P.M., Mortensen, N.J.M.C., Bodmer, W.F., 2004. Multiple rare variants in different genes account for multifactorial inherited susceptibility to colorectal adenomas. Proceedings of the National Academy of Sciences of the United States of America 101, 15992–15997.

Flanagan, S.E., Patch, A.-M., and Ellard, S., 2010. Using SIFT and PolyPhen to Predict Loss-of-Function and Gain-of-Function Mutations. Genetic Testing and Molecular Biomarkers 14, 533–537.

Frazer, K.A., Murray, S.S., Schork, N.J., Topol, E.J., 2009. Human genetic variation and its contribution to complex traits. Nature Reviews Genetics 10, 241–251.

Gagnon, A., 2011. Aux origines du génome québécois. Dire 9, p. 42–43.

Gallet, M., Mentaverri, R., Sévenet, N., Brazier, M., Kamel, S., 2006. Ability of breast cancer cell lines to stimulate bone resorbing activity of mature osteoclasts correlates with an anti-apoptotic effect mediated by macrophage colony stimulating factor. Apoptosis 11, 1909–1921.

Gennari, L., Gianfrancesco, F., Di Stefano, M., Rendina, D., Merlotti, D., Esposito, T., Gallone, S., Fusco, P., Rainero, I., Fenoglio, P., 2010. SQSTM1 gene analysis and gene-environment interaction in Paget’s disease of bone. Journal of Bone and Mineral Research 25, 1375–1384.

Gennari, L., Merlotti, D., Martini, G., Nuti, R., 2006. Paget’s disease of bone in Italy. J. Bone Miner. Res. 21 Suppl 2, P14–21.

Gibson, G., 2012. Rare and common variants: twenty arguments. Nature Reviews Genetics 13, 135–145.

Good, D.A., Busfield, F., Fletcher, B.H., Duffy, D.L., Kesting, J.B., Andersen, J., Shaw, J.T.E., 2002. Linkage of Paget disease of bone to a novel region on human chromosome 18q23. The American Journal of Human Genetics 70, 517–525.

Gorlov, I.P., Gorlova, O.Y., Frazier, M.L., Spitz, M.R., Amos, C.I., 2011. Evolutionary evidence of the effect of rare variants on disease etiology. Clinical genetics 79, 199–206.

78

Gorlov, I.P., Gorlova, O.Y., Sunyaev, S.R., Spitz, M.R., Amos, C.I., 2008. Shifting paradigm of association studies: value of rare single-nucleotide polymorphisms. The American Journal of Human Genetics 82, 100–112.

Guénard, F., Labrie, Y., Ouellette, G., Beauparlant, C.J., Durocher, F., 2009. Genetic sequence variations of BRCA1-interacting genes AURKA, BAP1, BARD1 and DHX9 in French Canadian families with high risk of breast cancer. Journal of human genetics 54, 152–161.

Haldane, J.B., 1956. The estimation and significance of the logarithm of a ratio of frequencies. Ann. Hum. Genet. 20, 309–311.

Hartgers, F.C., Vissers, J.L., Looman, M.W., Van Zoelen, C., Huffine, C., Figdor, C.G., Adema, G.J., 2000. DC-STAMP, a novel multimembrane-spanning molecule preferentially expressed by dendritic cells. Eur. J. Immunol. 30, 3585–3590.

Helfrich, M.H., Hocking, L.J., 2008. Genetics and aetiology of Pagetic disorders of bone. Archives of biochemistry and biophysics 473, 172–182.

Hennies, H.C., Kornak, U., Zhang, H., Egerer, J., Zhang, X., Seifert, W., Kühnisch, J., Budde, B., Nätebus, M., Brancati, F., Wilcox, W.R., Müller, D., Kaplan, P.B., Rajab, A., Zampino, G., Fodale, V., Dallapiccola, B., Newman, W., Metcalfe, K., Clayton-Smith, J., Tassabehji, M., Steinmann, B., Barr, F.A., Nürnberg, P., Wieacker, P., Mundlos, S., 2008. Gerodermia osteodysplastica is caused by mutations in SCYL1BP1, a Rab-6 interacting golgin. Nat. Genet. 40, 1410–1412.

Hershberger, R.E., Norton, N., Morales, A., Li, D., Siegfried, J.D., Gonzalez-Quintana, J., 2010. Coding sequence rare variants identified in MYBPC3, MYH6, TPM1, TNNC1, and TNNI3 from 312 patients with familial or idiopathic dilated cardiomyopathy. Circ Cardiovasc Genet 3, 155–161.

Hershberger, R.E., Parks, S.B., Kushner, J.D., Li, D., Ludwigsen, S., Jakobs, P., Nauman, D., Burgess, D., Partain, J., Litt, M., 2008. Coding sequence mutations identified in MYH7, TNNT2, SCN5A, CSRP3, LBD3, and TCAP from 313 patients with familial or idiopathic dilated cardiomyopathy. Clinical and translational science 1, 21–26.

Hicks, S., Wheeler, D.A., Plon, S.E., and Kimmel, M., 2011. Prediction of missense mutation functionality depends on both the algorithm and sequence alignment employed. Human Mutation 32, 661–668.

Hocking, L.J., Herbert, C.A., Nicholls, R.K., Williams, F., Bennett, S.T., Cundy, T., Nicholson, G.C., Wuyts, W., Van Hul, W., Ralston, S.H., 2001. Genomewide search in familial Paget disease of bone shows

79 evidence of genetic heterogeneity with candidate loci on 2q36, 10p13, and 5q35. The American Journal of Human Genetics 69, 1055–1061.

Iascone, M., Ciccone, R., Galletti, L., Marchetti, D., Seddio, F., Lincesso, A.R., Pezzoli, L., Vetro, A., Barachetti, D., Boni, L., 2011. Identification of de novo mutations and rare variants in hypoplastic left heart syndrome. Clinical genetics, 81, 542-54.

Introduction, n.d. Alexa Platform.

Iyengar, S.K., Elston, R.C., 2007. The Genetic Basis of Complex Traits. Linkage Disequilibrium and Association Mapping: Analysis and Applications 376, 71.

Javed, A., Guo, B., Hiebert, S., Choi, J.Y., Green, J., Zhao, S.C., Osborne, M.A., Stifani, S., Stein, J.L., Lian, J.B., et al., 2000. Groucho/TLE/R-esp associate with the nuclear matrix and repress RUNX (CBF(alpha)/AML/PEBP2(alpha)) dependent activation of tissue-specific gene transcription. J Cell Sci 113, 2221–2231.

Jensen, E.D., Gopalakrishnan, R., and Westendorf, J.J., 2010. Regulation of in osteoblasts. Biofactors 36, 25–32.

Johnston, J.A., Ward, C.L., and Kopito, R.R.,1998. Aggresomes: a cellular response to misfolded proteins. J. Cell Biol. 143, 1883–1898.

Karsenty, G., 2008. Transcriptional Control of Skeletogenesis. Annual Review of Genomics and Human Genetics 9, 183–196.

Kimura, H., Kwan, K.M., Zhang, Z., Deng, J.M., Darnay, B.G., Behringer, R.R., Nakamura, T., De Crombrugghe, B., Akiyama, H., 2008a. Cthrc1 Is a Positive Regulator of Osteoblastic Bone Formation. PLoS ONE 3, e3174.

Kimura, H., Kwan, K.M., Zhang, Z., Deng, J.M., Darnay, B.G., Behringer, R.R., Nakamura, T., De Crombrugghe, B., Akiyama, H., 2008b. Cthrc1 is a positive regulator of osteoblastic bone formation. PLoS One 3, e3174.

Kopito, R.R. 2000. Aggresomes, inclusion bodies and protein aggregation. Trends in Cell Biology 10, 524–530.

Ku, C.S., Magnusson, P.K., Chia, K.S., Pawitan, Y., 2010. Research on Rare Variants for Complex Diseases, in: eLS. John Wiley & Sons, Ltd.

80

Kubota, T., Michigami, T., Ozono, K., 2009. Wnt signaling in bone metabolism. J. Bone Miner. Metab. 27, 265– 271.

Kumar, V., Abbas, A.K., Fausto, N., Aster, J., 2009. Robbins and Cotran Pathologic Basis of Disease, Professional Edition: Expert Consult - Online and Print, 8e, 8th ed. Saunders.

Kurihara, N., Hiruma, Y., Yamana, K., Michou, L., Rousseau, C., Morissette, J., Galson, D.L., Teramachi, J., Zhou, H., Dempster, D.W., Windle, J.J., Brown, J.P., Roodman, G.D., 2011. Contributions of the measles virus nucleocapsid gene and the SQSTM1/p62(P392L) mutation to Paget’s disease. Cell Metab. 13, 23–34.

Kurihara, N., Hiruma, Y., Zhou, H., Subler, M.A., Dempster, D.W., Singer, F.R., Reddy, S.V., Gruber, H.E., Windle, J.J., Roodman, G.D., 2007. Mutation of the sequestosome 1 (p62) gene increases osteoclastogenesis but does not induce Paget disease. J. Clin. Invest. 117, 133–142.

Kurihara, N., Reddy, S.V., Araki, N., Ishizuka, S., Ozono, K., Cornish, J., Cundy, T., Singer, F.R., Roodman, G.D., 2004. Role of TAFII-17, a VDR binding protein, in the increased osteoclast formation in Paget’s Disease. J. Bone Miner. Res. 19, 1154–1164.

Laberge, A.-M., 2007. La prévalence et la distribution des maladies génétiques au québec : L’impact du passé sur le présent. MS. Médecine sciences 23, 997–1001.

Laroche, M., Delmotte, A., 2005. Increased arterial calcification in Paget’s disease of bone. Calcified tissue international 77, 129–133.

Lathrop, G., 1983. Estimating genotype relative risks. Tissue Antigens 22, 160–166.

Laurin, N., Brown, J.P., Lemainque, A., Duchesne, A., Huot, D., Lacourcière, Y., Drapeau, G., Verreault, J., Raymond, V., Morissette, J., 2001. Paget disease of bone: mapping of two loci at 5q35-qter and 5q31. Am. J. Hum. Genet. 69, 528–543.

Laurin, N., Brown, J.P., Morissette, J., Raymond, V., 2002. Recurrent mutation of the gene encoding sequestosome 1 (SQSTM1/p62) in Paget disease of bone. Am. J. Hum. Genet. 70, 1582–1588.

LeClair, R.J., Durmus, T., Wang, Q., Pyagay, P., Terzic, A., Lindner, V., 2007. Cthrc1 is a novel inhibitor of transforming growth factor-ß signaling and neointimal lesion formation. Circulation research 100, 826– 833.

Li, W.F., Hou, S.X., Férec, C., Chen, J.M., 2011. Osteoporosis: Genetics. eLS.

81 Li, Y., Byrnes, A.E., Li, M., 2010. To identify associations with rare variants, just WHaIT: Weighted haplotype and imputation-based tests. Am. J. Hum. Genet. 87, 728–735.

Longo, D., Fauci, A., Kasper, D., Hauser, S., Jameson, J., Loscalzo, J., 2011. Harrison’s Principles of Internal Medicine: Volumes 1 and 2, 18th Edition, 18th ed. McGraw-Hill Professional.

López-Abente, G., Morales-Piga, A., Elena-Ibáñez, A., Rey-Rey, J.S., Corres-González, J., 1997. Cattle, pets, and Paget’s disease of bone. Epidemiology 8, 247–251.

Lorenzo, J., Choi, Y., Horowitz, M., Takayanagi, H., 2010. Osteoimmunology: Interactions of the Immune and Skeletal Systems, Academic Press, 470p.

Lucas, G.J.A., Hocking, L.J., Daroszewska, A., Cundy, T., Nicholson, G.C., Walsh, J.P., Fraser, W.D., Meier, C., Hooper, M.J., Ralston, S.H., 2005. Ubiquitin-associated domain mutations of SQSTM1 in Paget’s disease of bone: evidence for a founder effect in patients of British descent. J. Bone Miner. Res. 20, 227–231.

Lucas, G.J.A., Mehta, S.G., Hocking, L.J., Stewart, T.L., Cundy, T., Nicholson, G.C., Walsh, J.P., Fraser, W.D., Watts, G.D.J., Ralston, S.H., Kimonis, V.E., 2006. Evaluation of the role of Valosin-containing protein in the pathogenesis of familial and sporadic Paget’s disease of bone. Bone 38, 280–285.

Luo, W., Gangwal, K., Sankar, S., Boucher, K.M., Thomas, D., Lessnick, S.L., 2009. GSTM4 is a microsatellite-containing EWS/FLI target involved in Ewing’s sarcoma oncogenesis and therapeutic resistance. Oncogene 28, 4126–4132.

Lusis, A.J., Pajukanta, P., 2008. A treasure trove for lipoprotein biology. Nature Genetics 40, 129–130.

Lyles, K.W., Siris, E.S., Singer, F.R., Meunier, P.J., 2001. A clinical approach to diagnosis and management of Paget’s disease of bone. J. Bone Miner. Res. 16, 1379–1387.

Manolio, T.A., Collins, F.S., Cox, N.J., Goldstein, D.B., Hindorff, L.A., Hunter, D.J., McCarthy, M.I., Ramos, E.M., Cardon, L.R., Chakravarti, A., Cho, J.H., Guttmacher, A.E., Kong, A., Kruglyak, L., Mardis, E., Rotimi, C.N., Slatkin, M., Valle, D., Whittemore, A.S., Boehnke, M., Clark, A.G., Eichler, E.E., Gibson, G., Haines, J.L., Mackay, T.F.C., McCarroll, S.A., Visscher, P.M., 2009. Finding the missing heritability of complex diseases. Nature 461, 747–753.

Marian, A.J., 2012. Molecular genetic studies of complex phenotypes. Translational Research 159, 64–79.

82

Marks, S.C., Jr, Popoff, S.N., 1988. Bone cell biology: the regulation of development, structure, and function in the skeleton. Am. J. Anat. 183, 1–44.

Marie, P.J., 2008. Transcription factors controlling osteoblastogenesis. Archives of Biochemistry and Biophysics 473, 98–105.

McNaught, K.S., Olanow, C.W., Halliwell, B., Isacson, O., Jenner, P., 2001. Failure of the ubiquitin-proteasome system in Parkinson’s disease. Nat. Rev. Neurosci. 2, 589–594.

Mellis, D.J., Itzstein, C., Helfrich, M.H., and Crockett, J.C., 2011. The skeleton: a multi-functional complex organ. The role of key signalling pathways in osteoclast differentiation and in bone resorption. Journal of Endocrinology 211, 131–143.

Mendes, A.I., Mascarenhas, M.R., Matos, S., Sousa, I., Ferreira, J., Barbosa, A.P., Bicho, M., Jordan, P., 2011. A WNK4 gene variant relates to osteoporosis and not to hypertension in the Portuguese population. Molecular Genetics and Metabolism 102, 465–469.

Mensah, K.A., Ritchlin, C.T., Schwarz, E.M., 2010. RANKL induces heterogeneous DC-STAMPlo and DC-

STAMPhi osteoclast precursors of which the DC-STAMPlo precursors are the master fusogens. Journal of cellular physiology 223, 76–83.

Merchant, A., Smielewska, M., Patel, N., Akunowicz, J.D., Saria, E.A., Delaney, J.D., Leach, R.J., Seton, M., Hansen, M.F., 2009. Somatic mutations in SQSTM1 detected in affected tissues from patients with sporadic Paget’s disease of bone. J. Bone Miner. Res. 24, 484–494.

Michou, L., Brown, J.P., 2011a. Emerging strategies and therapies for treatment of Paget’s disease of bone. Drug Des Devel Ther 5, 225–239.

Michou, L., Brown, J.P., 2011b. Genetics of bone diseases: Paget’s disease, fibrous dysplasia, osteopetrosis, and osteogenesis imperfecta. Joint Bone Spine 78, 252–258.

Michou, L., Collet, C., Laplanche, J.-L., Orcel, P., Cornélis, F., 2006. Genetics of Paget’s disease of bone. Joint Bone Spine 73, 243–248.

Michou, L., Collet, C., Morissette, J., Audran, M., Thomas, T., Gagnon, E., Launay, J.-M., Laplanche, J.-L., Brown, J.P., Orcel, P., 2012. Epidemiogenetic study of French families with Paget’s disease of bone. Joint Bone Spine 79, 393–398.

83 Michou, L., Morissette, J., Gagnon, E.R., Marquis, A., Dellabadia, M., Brown, J.P., Siris, E.S., 2011. Novel SQSTM1 mutations in patients with Paget’s disease of bone in an unrelated multiethnic American population. Bone 48, 456–460.

Mills, B.G., Singer, F.R., 1976. Nuclear inclusions in Paget’s disease of bone. Science 194, 201–202.

Mirasierra, M., Fernández-Pérez, A., Díaz-Prieto, N., Vallejo, M., 2011. Alx3-deficient mice exhibit decreased insulin in beta cells, altered glucose homeostasis and increased apoptosis in pancreatic islets. Diabetologia 54, 403–414.

Miyamoto, T., 2011. Regulators of Osteoclast Differentiation and Cell-Cell Fusion. The Keio Journal of Medicine 60, 101–105.

Monroe, D.G., McGee-Lawrence, M.E., Oursler, M.J., Westendorf, J.J., 2011. Update on Wnt signaling in bone cell biology and bone disease. Gene.

Morales-Piga, A.A., Rey-Rey, J.S., Corres-González, J., García-Sagredo, J.M., López-Abente, G., 1995. Frequency and characteristics of familial aggregation of Paget’s disease of bone. J. Bone Miner. Res. 10, 663–670.

Morissette, J., Laurin, N., and Brown, J.P., 2006. Sequestosome 1: mutation frequencies, haplotypes, and phenotypes in familial Paget’s disease of bone. J. Bone Miner. Res. 21 Suppl 2, P38–44.

Nakken, S., Alseth, I., and Rognes, T., 2007. Computational prediction of the effects of non-synonymous single nucleotide polymorphisms in human DNA repair genes. Neuroscience 145, 1273–1279.

Neale, S.D., Smith, R., Wass, J.A., Athanasou, N.A., 2000. Osteoclast differentiation from circulating mononuclear precursors in Paget’s disease is hypersensitive to 1,25-dihydroxyvitamin D(3) and RANKL. Bone 27, 409–416.

Nejentsev, S., Walker, N., Riches, D., Egholm, M., Todd, J.A., 2009. Rare variants of IFIH1, a gene implicated in antiviral responses, protect against type 1 diabetes. Science 324, 387–389.

Perneger, T.V., 1998. What’s wrong with Bonferroni adjustments. BMJ 316, 1236–1238.

Piga, A.M., López-Abente, G., Ibáñez, A.E., Vadillo, A.G., Lanza, M.G., Jodra, V.M., 1988. Risk factors for Paget’s disease: a new hypothesis. Int J Epidemiol 17, 198–201.

Plourde, M., Ferland, A., Soucy, P., Hamdi, Y., Tranchant, M., Durocher, F., Sinilnikova, O., Luu The, V., Simard, J., 2009. Analysis of 17beta-hydroxysteroid dehydrogenase types 5, 7, and 12 genetic

84

sequence variants in breast cancer cases from French Canadian Families with high risk of breast and ovarian cancer. J. Steroid Biochem. Mol. Biol. 116, 134–153.

Pyagay, P., Heroult, M., Wang, Q., Lehnert, W., Belden, J., Liaw, L., Friesel, R.E., Lindner, V., 2005. Collagen triple helix repeat containing 1, a novel secreted protein in injured and diseased arteries, inhibits collagen expression and promotes cell migration. Circulation research 96, 261–268.

Raisz, L.G., 1999. Physiology and pathophysiology of bone remodeling. Clin. Chem. 45, 1353–1358.

Ralston, S.H., 2008. Pathogenesis of Paget’s disease of bone. Bone 43, 819–825.

Ralston, S.H., Albagha, O.M.E., 2011. Genetic determinants of Paget’s disease of bone. Annals of the New York Academy of Sciences 1240, 53–60.

Ralston, S.H., Hobson, R.P., Pennington, T.H., Helfrich, M.H., 1997. Does Paget’s disease really have a viral aetiology? J. Bone Miner. Res. 12, 863–865.

Rebel, A., Malkani, K., Baslé, M., Bregeon, C., 1976. Osteoclast ultrastructure in Paget’s disease. Calcif Tissue Res 187–199.

Rendina, D., Gennari, L., De Filippo, G., Merlotti, D., De Campora, E., Fazioli, F., Scarano, G., Nuti, R., Strazzullo, P., Mossetti, G., 2006. Evidence for increased clinical severity of familial and sporadic Paget’s disease of bone in Campania, southern Italy. J. Bone Miner. Res. 21, 1828–1835.

Rénier, J.C., Cronier, P., Audran, M., 1995. A new anatomic index based on current knowledge for calculating the cumulative percentage of pagetic bone per subject and other parameters. Rev Rhum Engl Ed 62, 355–358.

Roodman, G.D., 2010. Insights into the pathogenesis of Paget’s disease. Annals of the New York Academy of Sciences 1192, 176–180.

Roodman, G.D., Windle, J.J., 2005. Paget disease of bone. J Clin Invest 115, 200–8.

Rosen, C.J., Compston, J.E., Lian, J.B., 2008. Primer on the Metabolic Bone Diseases and Disorders of Mineral Metabolism, 7th edition, Wiley, 537 p.

Rothman, K.J., 1990. No adjustments are needed for multiple comparisons. Epidemiology 1, 43–46.

Saadat, M., 2011. Significance of the Hardy–Weinberg equilibrium in genetic association studies. Psychiatry Research 190, 165.

85 Salinas-Souza, C., Petrilli, A.S., De Toledo, S.R.C., 2010. Glutathione S-transferase polymorphisms in osteosarcoma patients. Pharmacogenet. Genomics 20, 507–515.

Shink, E., Harvey, M., Tremblay, M., Gagné, B., Belleau, P., Raymond, C., Labbé, M., Dubé, M.P., Lafrenière, R.G., Barden, N., 2005. Analysis of microsatellite markers and single nucleotide polymorphisms in candidate genes for susceptibility to bipolar affective disorder in the chromosome 12Q24. 31 region. American Journal of Medical Genetics Part B: Neuropsychiatric Genetics 135, 50–58.

Singer, F.R., 2009. Paget disease: when to treat and when not to treat. Nat Rev Rheumatol 5, 483–489.

Singer, F.R., Mills, B.G., Gruber, H.E., Windle, J.J., Roodman, G.D., 2006. Ultrastructure of bone cells in Paget’s disease of bone. J. Bone Miner. Res. 21 Suppl 2, P51–54.

Siris, E.S., 1994. Epidemiological aspects of Paget’s disease: family history and relationship to other medical conditions. Semin. Arthritis Rheum. 23, 222–225.

Siris, E.S., Ottman, R., Flaster, E., Kelsey, J.L., 1991. Familial aggregation of Paget’s disease of bone. J. Bone Miner. Res. 6, 495–500.

Smits, P., Bolton, A.D., Funari, V., Hong, M., Boyden, E.D., Lu, L., Manning, D.K., Dwyer, N.D., Moran, J.L., Prysak, M., Merriman, B., Nelson, S.F., Bonafé, L., Superti-Furga, A., Ikegawa, S., Krakow, D., Cohn, D.H., Kirchhausen, T., Warman, M.L., Beier, D.R., 2010. Lethal skeletal dysplasia in mice and humans lacking the golgin GMAP-210. N. Engl. J. Med. 362, 206–216.

Staden, R., 1996. The Staden sequence analysis package. Mol. Biotechnol. 5, 233–241.

Strickberger, S.A., Schulman, S.P., Hutchins, G.M., 1987. Association of Paget’s disease of bone with calcific aortic valve disease. The American journal of medicine 82, 953–956.

The Paget Foundation. Diagnosis and Management of Paget’s Disease of Bone [En ligne] www.paget.org (page consultée le 12 juillet 2012)

Theodorou, D.J., Theodorou, S.J., Kakitsubata, Y., 2011. Imaging of Paget disease of bone and its musculoskeletal complications: self-assessment module. AJR Am J Roentgenol 196, WS53–56.

Tilyard, M.W., Gardner, R.J.M., Milligan, L., Cleary, T.A., Stewart, R.D.H., 1982. A Probable Linkage Between Familial Paget’s Disease and the HLA Loci*. Australian and New Zealand journal of medicine 12, 498– 500.

86

Udagawa, N., Takahashi, N., Yasuda, H., Mizuno, A., Itoh, K., Ueno, Y., Shinki, T., Gillespie, M.T., Martin, T.J., Higashio, K., Suda, T., 2000. Osteoprotegerin produced by osteoblasts is an important regulator in osteoclast development and function. Endocrinology 141, 3478–3484.

Van Staa, T.P., Selby, P., Leufkens, H.G.M., Lyles, K., Sprafka, J.M., Cooper, C., 2002. Incidence and natural history of Paget’s disease of bone in England and Wales. J. Bone Miner. Res. 17, 465–471.

Van Wesenbeeck, L., Odgren, P.R., MacKay, C.A., D’Angelo, M., Safadi, F.F., Popoff, S.N., Van Hul, W., Marks, S.C., Jr, 2002. The osteopetrotic mutation toothless (tl) is a loss-of-function frameshift mutation in the rat Csf1 gene: Evidence of a crucial role for CSF-1 in osteoclastogenesis and endochondral ossification. Proc. Natl. Acad. Sci. U.S.A. 99, 14303–14308.

Wang, B., Sinha, T., Jiao, K., Serra, R., Wang, J., 2011. Disruption of PCP signaling causes limb morphogenesis and skeletal defects and may underlie Robinow syndrome and brachydactyly type B. Human molecular genetics 20, 271–285.

Watts, G.D.J., Wymer, J., Kovach, M.J., Mehta, S.G., Mumm, S., Darvish, D., Pestronk, A., Whyte, M.P., Kimonis, V.E., 2004. Inclusion body myopathy associated with Paget disease of bone and frontotemporal dementia is caused by mutant valosin-containing protein. Nature genetics 36, 377–381.

Webb, T.R., Parfitt, D.A., Gardner, J.C., Martinez, A., Bevilacqua, D., Davidson, A.E., Zito, I., Thiselton, D.L., Ressa, J.H.C., Apergi, M., Schwarz, N., Kanuga, N., Michaelides, M., Cheetham, M.E., Gorin, M.B., Hardcastle, A.J., 2012. Deep intronic mutation in OFD1, identified by targeted genomic next-generation sequencing, causes a severe form of X-linked retinitis pigmentosa (RP23). Hum. Mol. Genet. 21, 3647– 3654.

Wise, G.E., Yao, S., Odgren, P.R., Pan, F., 2005. CSF-1 Regulation of Osteoclastogenesis for Tooth Eruption. J Dent Res 84, 837–841.

Wright, A.F., 2005. Genetic Variation: Polymorphisms and Mutations, in: John Wiley & Sons, Ltd (Ed.), Encyclopedia of Life Sciences. John Wiley & Sons, Ltd, Chichester.

Yagi, M., Miyamoto, T., Sawatani, Y., Iwamoto, K., Hosogane, N., Fujita, N., Morita, K., Ninomiya, K., Suzuki, T., Miyamoto, K., 2005. DC-STAMP is essential for cell–cell fusion in osteoclasts and foreign body giant cells. The Journal of experimental medicine 202, 345–351.

Yang, X., and Karsenty, G., 2002. Transcription factors in bone: developmental and pathological aspects. Trends in Molecular Medicine 8, 340–345.

87 Yamamoto, S., Nishimura, O., Misaki, K., Nishita, M., Minami, Y., Yonemura, S., Tarui, H., Sasaki, H., 2008. Cthrc1 selectively activates the planar cell polarity pathway of Wnt signaling by stabilizing the Wnt- receptor complex. Developmental cell 15, 23–36.

Zhang, J., 2000. Rates of conservative and radical nonsynonymous nucleotide substitutions in mammalian nuclear genes. Journal of molecular evolution 50, 56–68.

Zhu, G., Wu, C.-J., Zhao, Y., Ashwell, J.D., 2007. Optineurin negatively regulates TNFalpha- induced NF- kappaB activation by competing with NEMO for ubiquitinated RIP. Curr. Biol. 17, 1438–1443.

88

Bases de données

Cobalt : http://www.ncbi.nlm.nih.gov/tools/cobalt Database of genomic variants: http://projects.tcag.ca/variation EntrezGene: http://www.ncbi.nlm.nih.gov/gene EntrezSNP: http://www.ncbi.nlm.nih.gov/snp GENATLAS: http://www.genatlas.org GeneCards: http://www.genecards.org GeneLoc: http://genecards.weizmann.ac.il/geneloc/index.shtml HomoloGene: http://www.ncbi.nlm.nih.gov/homologene OMIM: http://www.ncbi.nlm.nih.gov/omim Pfam: http://pfam.sanger.ac.uk RefSeq: http://www.ncbi.nlm.nih.gov/RefSeq UniProtKB: http://www.uniprot.org/help/uniprotkb WikiGenes: http://www.wikigenes.org

Outils de prédiction in silico

Condel: http://bg.upf.edu/condel/home ConSite: http://asp.ii.uib.no:8090/cgi-bin/CONSITE/consite Ensembl64: http://useast.ensembl.org/index.html Human Splicing Finder: http://www.umd.be/HSF MicroCosm Targets: http://www.ebi.ac.uk/enright-srv/microcosm/htdocs/targets/v5 PolyPhen: http://genetics.bwh.harvard.edu/pph2 SIFT: http://sift.jcvi.org TFSearch: http://www.cbrc.jp/research/db/TFSEARCH.htm

Autres outils de prédiction

Primer3: http://biotools.umassmed.edu/bioapps/primer3_www.cgi Quanto 1.2.4 : http://hydra.usc.edu/GxE

89

90

Annexe A : Amplification et séquençage

Tableau A-1. Séquences de référence utilisées pour le séquençage des gènes candidats

Gène Identifiants Ref Seq

ALX3 NM_006492

AMPD2 NM_139156,NM_203404

CSF1 NM_172210, NM_000757

CTHRC1 NM_138455

EPS8L3 NM_024526, NM_139053, NM_133181

GSTM3 NM_000849

GSTM4 NM_000850, NM_147148

LRP12 NM_001135703, NM_013437

PSMA5 NM_002790

TM7SF4 NM_030788

91 Tableau A-2. Oligonucléotides et conditions pour l’amplification par PCR et le séquençage des gènes sélectionnés

Taille du Température Gène Section du gène F/R Séquence de l'amorce (5'→3') fragment d'élongation (pb) (°C) ALX3 Exon 1 F ANNULÉ R ANNULÉ ALX3 Promoteur F GGC TTT CCT GAT AAA AAC CAC A 935 55 R CTC ACT CGT GTG GAC TGG AA ALX3 Exon 2 F AGT CCT CTC ACG TCC CTG TG 858 55 R AGA GGC CAT CGC CCT TAT AC ALX3 Exon 3 F ATG GGG CCA ATT ACC CAC T 695 55 R AGG AGC TGA CTT CCC TAC CC ALX3 Exon 4 F GAG CCA AGT GGA GGT TTC CT 983 55 R CTG GAG CTG AGG AGC CAG T AMPD2 Promoteur F GGG GAT GCT TGT TGG ATA GA 777 57 R TGA GAC CCC ACC AAA ATC TC AMPD2 Promoteur F GCC AGG CAC TGT GTA AAG G 882 55 Exon 1 R TCT GGG ACA GAG ACC CTA GC AMPD2 Exon 2 F GCT GGG TTT TCA CGG AGT AT 841 54 R CCT TGT GAC AGA GGA CAG CA AMPD2 Exons 3, 4 F GTC CCT GCG TTA GAG GTG AG 974 59 R AGG TGC TGT GCA CAT GTT GT AMPD2 Exons 5, 6 F CCT TTC AGA GCC CCT TTT CT 870 55 R TGC GAT CAC TCT CCT CAG TC AMPD2 Exons 7, 8 F GAA AGG GCG TTT CTC TTT CC 957 55 R AAT TCC TGC AGG TCA GGG TA AMPD2 Exons 9, 10 F AGC ACC CGT ATG AGC ACT GT 886 55 R GTG TCC ACC TGG AAT GGA AC AMPD2 Exons 11, 12 F GAA AGT GCC ACA CCG AGA TT 822 55 R GCT CTG CAT TCT GGT ATT TGC AMPD2 Exons 13, 14 F GAG TCC GTC CTC CGA GAG AT 955 57 R CAT GGT TTT CAG GCT TGG AC AMPD2 Exons 15, 16 F CCG GAA CTG CAT CTC TTC TT 906 55 R TGA TGT GCA AAG GGT GAA TTA AMPD2 Exon 17 F ANNULÉ R ANNULÉ AMPD2 Exon 18 F ANNULÉ R ANNULÉ AMPD2 Exon 19 F CTC CTG CGA TAT GTG TGA GC 900 57 R GAG TTC CAC AGA CCC TCA GC CSF1 Promoteur F TCA TTC TCA TGTAGA AAC AAA ACG TG 951 53,5 R GTC CTG GGA TGC GGA GAG CSF1 Promoteur F GCC TCT GGA GTG TGT GTG TC 633 58 Exon 1 R CTG CAG GTG GCT CAG TGT T CSF1 Exon 2 F GCA AGT CCT GCT CTC GAG TT 786 56 R AGG GAC AGC AGA CCT CAG AA CSF1 Exon 3 F GAT TTC GTG GGG TGG TAG AA 603 55 R CTC CTT TCA CCT CTC TGT GGA CSF1 Exon 4 F TGA AGG GGC CAT ATG GTA AA 874 55

92

Taille du Température Gène Section du gène F/R Séquence de l'amorce (5'→3') fragment d'élongation (pb) (°C) R CTG CTT GCT GTT GGA ATG AA CSF1 Exon 5 F TTA GTC CCT GCT GGA TTG CT 706 55 R CTT CTT GAC GCT GCC ACA T CSF1 Exon 6 F CCC AGT GTG TGC ATC TCA AC 990 55 R GAG TGG CTT CTG GAA AGC TG CSF1 Exon 7 F AGG CTC TCC CAG GAT CTC AT 674 55 R CAC AGC ATT GCT CTC CTC CT CSF1 Exons 8, 9 F GGA GGA GAG CAA TGC TGT GT 995 55 R CAG GTG GCA GCA ACA CTA GA CTHRC1 Promoteur F GCT GTG TTA CCT GCG GGA AT 786 55 Exon 1 R ATA TCG CAT GTC CGC TCC A CTHRC1 Exon 2, partie 1 sur 2 F CAG AAG GGA GCA GGC AAA TA 751 55 R TGC TCT CTT TTG TTT GCA TTT TT CTHRC1 Exon 2, partie 2 sur 2 F TCT TGG GAA AAT TGC GGT AA 715 55 R TCA TCA ACA GAG AAA AGA GGC TTA

CTHRC1 Exon 3 F AAC CCC TGG CCT CAA GTA AT 691 57 R TGA ATC ACC AGG GGA TCT TT CTHRC1 Exon 4 F TTG AAA CCT GTA AGA ACA CTG CTT 985 55 R TCC TAA AGT GCT GAT ATA TTT CCT GA EPS8L3 Promoteur F CAA GAT CCA TGT CCT GCT CA 988 55 Exon 1 R AAA CAG CTG CAG CCA AAG AT EPS8L3 Promoteur F TTG CCC CAG GGT CTA TGA 997 57 R CTC ACT GCC GTC CAC TTG T EPS8L3 Promoteur F AAT CGG ACA GAT CTG GGT TG 986 55 R CAG GGC AGG ACA GTT GCT A EPS8L3 Exons 2, 3 F GCT CCT TGG CAT GAG CTT TA 847 55 R CTG TCT GGG GAC AGG ACA CT EPS8L3 Exon 4 F TCC TTC CTC CAG AGT CCT CA 697 55 R AGG TGG AGA GGT CAA CTG TGA EPS8L3 Exons 5, 6 F CTC TTG AAC TCC ACC CTC CA 935 55 iR GGG TGA TGG TCG ATG AAC C iF CAC ACT TAG CCT GCC TGA CT R GGC CAC ATC TTT GAC AAG GT EPS8L3 Exons 7, 8 F CAG GAC AGA GGT GGG CAT AG 862 55 R ACA ACC CAT GGC CTTGAA C EPS8L3 Exons 9, 10 F GAC ACC AAC CCT CCC TCT TT 705 55 R CTG GGG ACA CAG AGC AAT G EPS8L3 Exons 11, 12 F TCC TCT GCT GTC TGG ACT CA 996 55 R TTG CCA TCT CCC TTT TCT TG EPS8L3 Exons 13, 14 F GGG ATG TGT CCA GGC TTA AC 999 55 R ATT TCC GGG AGT GGA ATT TT EPS8L3 Exons 15, 16 F AAA GCC CCA CCT AAC ACT GA 951 55 R ACC ACA GCC CCT AAC ATC TG EPS8L3 Exon 17 F TCA GTG GCA AGC AGA GGA G 538 55 R AGT CCA CTC CCC TGA TCC TT

EPS8L3 Exon 18 F TAA GTG GGG AGC TCT GCT GT 671 55

93 Taille du Température Gène Section du gène F/R Séquence de l'amorce (5'→3') fragment d'élongation (pb) (°C) R GAT GGC AGG TGA GGG ATC T EPS8L3 Exon 19 F GAG AGG GCC AGT TGG AAA A 808 53 R GGG TGC CTT GGA ATG TAC TG GSTM3 Promoteur F CAC CCT GAG ACC CCC TAT CT 847 53 Exon 1 R GGC AGT GGG GAC CCT AGT TA GSTM3 Promoteur F TTG GGC TGG CTT ATG AAG TT 960 55 Exon 2 R GAC AGC GGT TCA GCG ACT GSTM3 Exon 3, 4 F AAA GAG ACT GAC GCG GAG AG 960 55 R TGC TAG TGG TTA ATG GGA ATG A GSTM3 Exon 5, 6 F CCA TGG CAT GCA CAT ACA CT 781 55 R CAG GCC AGT GAT GGA CAC TT GSTM3 Exon 7, 8 F TCT GTT CCA TTC TGC TGC TG 791 55 R CCA GAA CAG CAA CAT TCA CG GSTM3 Exon 9 F TGC CTA ATG GGA TCA ATG GT 949 55 R GCA GAG CAG CCT ATG GTT TT GSTM4 Promoteur F TGG CCC TCA TCC TGT TAC TT 835 55 R CCT GGT TCA AGC AAT TCT CC GSTM4 Promoteur F ACT TGT GTG TGC ATG GTG CT 930 57 Exon 1 R GAT AGC CCT AAG GAG GGA ACC GSTM4 Exon 2, 3 F TGC AGT GCA GTG TAG ACT AGG G 896 56 R GGA GAC CAG GCA CTC ACT GT GSTM4 Exons 4, 5 F CGA CGT GTC TCT GAC TGC AT 852 55 R GAA CCA GCT GGG TTA GAT GG GSTM4 Exons 6, 7 F TTG CAT TCC TCT CTG CCT TC 770 55 R GGG ACC CAG AAC AAA GGA CT GSTM4 Exon 8 (isoforme 1) F AGC ACC GGG TAG AAT CTT CA 910 55 R GGA AAC ACC TTA CTA AGC CCA TC GSTM4 Exon 8 (isoforme 2) F TTG AGG GAT TGC AGT TTC ATC 914 56 R TTC CCT CAA AAT CTC CTT GG

LRP12 Promoteur F ANNULÉ R ANNULÉ LRP12 Exon 1 F GCT CAG TCT GGC GAG TGG 625 55 R AGA AAA GCA TCT CCG TGT GG LRP12 Exon 2 (isoforme 1) F ACA TAT GTG GCC CTG ACA GA 806 55 R AGG GAT AGC ATT CAA AAT CAC A LRP12 Exon 2 (isoforme 2) F TCC GAT AAG TGG GGC TAC TG 681 55 R TTG TTT GTT CCA CTG CCA AA LRP12 Exon 3 F GTG CCA ACT GTC ACC TGT TTT 645 55 R ACC TTT TGG AGA CCC AGC TT LRP12 Exon 4, partie 1 sur 2 F CAC ATC CTG CAC ATG TAC CC 905 55 bF GCA CTT GGG CTT TAT GAA CA R ATA CCC ATC ACA ACG CTG CT LRP12 Exon 4, partie 2 sur 2 F GCA ATT GCA CCT GGT TAA TAG A 906 55 R GTC TGG CCT TCT GAG TCT CG LRP12 Exon 5 F GCC TGC GTC AGC TTT GTA TT 748 53 R CCA GCT TGA AGA TGT TTT TCC LRP12 Exon 6, partie 1 sur 2 F AGG ATG AAC CCA CAT AGG TAA GAG 977 55

94

Taille du Température Gène Section du gène F/R Séquence de l'amorce (5'→3') fragment d'élongation (pb) (°C) R TGT CTG GTA TCT GGG CAG TG LRP12 Exon 6, partie 2 sur 2 F TGG GGT AAG TGG AAG AGA AGA 987 55 R TTG GGA TTT TAC CAT TTG GTT T PSMA5 Promoteur F GCA AGA AGC GTC GAA AAA GA 901 55 iF ACG ATC TGG GCT CAA AGA AA R GGA TTC TGA GGA CCA ACA CG PSMA5 Exon 1 F CGA ACT CAC TAC ACG CCT TG 625 55 R CCT CAC GCC TTC TTT ACC AA PSMA5 Promoteur F CCA GGA ACC CGA GAC TGG 1005 56 R TTT TAG GCC GTC TTG GGA AG PSMA5 Exon 2 F TCT GGG AGT GAG GCA GAA GT 542 51 R AAG CAC AAA TAT GTC CCT CCA

PSMA5 Exon 3 F TCT TTT GGG GTT CTG GGA AT 795 55 R GGC AGA GGC AAC AAG GAAT

PSMA5 Exon 4 F GCT GCT TTT CTC TGG GCT TA 613 55 iR TTG GAC AGC TAA ACT CCA AGC R CAT GAT GCT CCC ACA CAA AG PSMA5 Exons 5, 6 F TGG TGC TTT GAG GCA TAA CC 802 55 R GGG TCT GGC TCT GTT ATC CA PSMA5 Exon 7 F TGCTCTGGAATGTTGATCTGA 740 55 R CCATCAAACGGAAATACTGGA PSMA5 Exon 8 F ATC CCT TTC CCC TTC TTC AA 694 55 R CTT CAG CAA TGC CAG CTA TG PSMA5 Exon 9 F TGC CAG GCA TTT GGT TAA GT 814 55 R TCA ACA CCA TGG GAT TAA TGG TM7SF4 Promoteur F TTC CCA ATT GAT AGA CAT GTG G 972 55 R GCA TGT CCC TCA TGA GTC CT TM7SF4 Promoteur F CCT CAA GAT CCT GCC CAC T 1020 55 Exon 1 R ATA GGG AGA CTG TCG GGG TA TM7SF4 Exon 2, partie 1 sur 2 F CCA GGT CAG ATG CAA AGG AT 850 57 R GGA GGA CAA CAC CTC TGT GG TM7SF4 Exon 2, partie 2 sur 2 F TCG TCA TCT TGG GAC ACG TA 890 55 R CGA TTC AAT TTG ACC TGC AA TM7SF4 Exon 3 F AAT GGG CAT TGT GAT TTT CA 890 55 R CCT CTC CAG TCG CCT CTC TA TM7SF4 Exon 4 F GAT GGG AGG GGT CAG TTG TA 981 55 R TAA TGC ACA TGG TCC GTA GG F/R; brin sens/brin antisens * Composition du mélange réactionnel (20 µL) : 40 ng d’ADN, PCR 1X, MgCl2 (1,5 µM), désoxyribonucléotides A, C, G, T (0,05mM chacun), amorces d’oligonucléotides (0,4 µL/amorce ), Taq JumpStart (0,6 U) (Sigma-Aldrich).

95

96

Annexe B : Tissu osseux

Tableau B-1. Facteurs de transcription impliqués dans la régulation du tissu osseux

Synonyme / Sous-unité / NOM OB OC Références Membre de la famille/ Aj18 X Marie, 2008

AKT X Rosen, 2008

AP-1 ∆FosB, cFOS, Fra-1, Jun X X Rosen, 2008; Mellis, 2011 ATF4 X Rosen, 2008

BAP-x X Marie, 2008

BMP2,7 X Rosen, 2008

C/EBPβ X Mellis, 2011

CBF X Javed, 2000

CLOCK X Karsenty, 2009

CREB X Lorenzo, 2010

Dlx3,5,6 X Rosen, 2008; Yang, 2002

E2F X Rosen, 2008

EOS X Mellis, 2011

Hoxa2 X Marie, 2008

Hoxa10 X Marie, 2008

LEF-1 X Marie, 2008, Jensen, 2010

MAFB X Mellis, 2011

MEF1 X Marie, 2008

MITF TFE3, TFEB, TFEc X X Rosen, 2008; Yang, 2002; Mellis, 2011 Msx 1 X Rosen, 2008

Msx 2 X Rosen, 2008

NF1 Karsenty, 2008

NFATc1 X X Rosen, 2008

NFKB RelA, RelB, cRel X Rosen, 2008

Nrf2 X Marie, 2008

Osterix Osx X Rosen, 2008

P53 X Marie, 2008

PPARγ X Kegg, 2011

PU-1 X Mellis, 2011

Rb X Marie, 2008

Rsk2 X Karsenty 2008

Runx2 X Rosen, 2008

Satb2 X Karsenty 2008

Shn3 X Karsenty 2009

SMAD 1 X Rosen, 2008

SMAD4 X Rosen, 2008

SMAD5 X Rosen, 2008

SMAD8 X Rosen, 2008

Sox8 X Marie, 2008

Sox9 X Marie, 2008

Sp1 X Jensen, 2010

Sp3 X Jensen, 2010

Stat 1 X Marie, 2008

TAZ X Marie, 2008

TCF7 X Jensen, 2010

Twist X Rosen, 2008

97

98

Annexe C : Étude des associations génotype-phénotype entre la MOP et les variants communs associés dans la population canadienne-française

Tableau C-1.Association génotype-phénotype pour le variant commun rs484959

Chr1; rs484959 G>A Génotypes p AA AG ou GG non corrigée RR [ IC 95 % ]

Sexe masculin, n (%) 7 (33,33) 140 (60,34) 0,016 0,34 [0,13 - 0,88] Muté SQSTM1/P392L, n (%) 5 (23,81) 23 (9,91) 0,066 2,82 [0,74 - 9,09]

Monostotique, n (%) 6 (28,57) 103 (44,40) 0,16 0,52 [0,20 - 1,40]

Âge au diagnostic 58,95 ± 10,33 63,14 ± 10,59 0,083

(moyenne ± ET) Paget

TOTAL Niveau sérique PAL 5,18 ± 5,81 3,41 ± 5,30 0,15 (moyenne ± ET) Nombre d'os atteints 4,33 ± 4,05 2,72 ± 2,69 0,013 (moyenne ± ET) Indice de Renier 12,77 ± 8,91 10,24 ± 9,01 0,22 (moyenne ± ET)

Sexe masculin, n (%) 6 (37,50) 126 (60,29) 0,074 0,41 [0,14 - 1,17] Monostotique, n (%) 6 (37,50) 98 (46,89) 0,47 0,70 [0,25 - 2,00]

Âge au diagnostic 58,38 ± 11,84 63,51 ± 10,77 0,070

(moyenne ± ET) MUTÉ

- Niveau sérique PAL 4,11 ± 4,53 3,07 ± 3,08 0,21

Paget (moyenne ± ET) NON Nombre d'os atteints 2,69 ± 1,89 2,42 ± 2,07 0,62 (moyenne ± ET) Indice de Renier 10,79 ± 7,30 9,81 ± 8,28 0,65 (moyenne ± ET)

99 Tableau C-2. Association génotype-phénotype pour le variant commun rs499345

Chr1; rs499345 C>A

Génotypes p

AA ou AC CC non corrigée RR [ IC 95 % ]

Sexe masculin, n (%) 113 (67,26) 34 (40,0) 3,3E-05 3,05 [1,78 - 5,24] Muté SQSTM1/P392L, n (%) 13 (7,74) 15 (17,65) 0,018 0,39 [0,18 - 0,87]

Monostotique, n (%) 77 (45,83) 32 (37,65) 0,21 1,39 [0,82 - 2,38]

Âge au diagnostic 63,14 ± 9,90 62,12 ± 11,93 0,47

(moyenne ± ET) Paget

TOTAL Niveau sérique PAL 3,54 ± 5,87 3,59 ± 4,19 0,94 (moyenne ± ET) Nombre d'os atteints 2,73 ± 2,55 3,09 ± 3,38 0,34 (moyenne ± ET) Indice de Renier 10,40 ± 8,80 10,55 ± 9,95 0,90 (moyenne ± ET)

Sexe masculin, n (%) 101 (65,16) 31 (44,29) 0,0032 2,34 [1,31 - 4,15] Monostotique, n (%) 75 (48,39) 29 (41,43) 0,33 1,32 [0,75 - 2,33]

Âge au diagnostic 63,34 ± 10,03 62,71 ± 12,69 0,69

(moyenne ± ET) MUTÉ - Niveau sérique PAL

Paget 3,20 ± 3,12 3,04 ± 3,40 0,74

(moyenne ± ET) NON Nombre d'os atteints 2,46 ± 2,07 2,40 ± 2,05 0,85 (moyenne ± ET) Indice de Renier 10,06 ± 8,29 9,48 ± 8,06 0,62 (moyenne ± ET)

100

Tableau C-3. Association génotype-phénotype pour le variant commun rs10494112

Chr1; rs10494112 A>G

p Génotypes

non corrigée

AG ou GG AA RR [ IC 95 % ]

Sexe masculin, n (%) 86 (67,72) 61 (48,41) 0,0019 2,22 [1,33 - 3,70] Muté SQSTM1/P392L, n (%) 8 (6,30) 20 (15,87) 0,015 0,37 [0,16 - 0,87]

Monostotique, n (%) 49 (38,89) 60 (47,24) 0,18 0,71 [0,43 - 1,17]

Âge au diagnostic 62,75 ± 9,99 62,84 ± 11,25 0,94 (moyenne ± ET)

Paget Niveau sérique PAL TOTAL 3,53 ± 6,47 3,58 ± 3,93 0,94 (moyenne ± ET) Nombre d'os atteints 2,75 ± 2,68 2,96 ± 3,02 0,55 (moyenne ± ET) Indice de Renier 10,18 ± 9,14 10,73 ± 8,91 0,63 (moyenne ± ET)

Sexe masculin, n (%) 79 (66,39) 53 (50,0) 0,013 1,96 [1,15 - 3,36] Monostotique, n (%) 59 (49,58) 45 (42,45) 0,28 1,33 [0,78 - 2,25]

Âge au diagnostic 63,12 ± 10,03 63,17 ± 11,86 0,97

(moyenne ± ET) MUTÉ - Niveau sérique PAL

Paget 3,06 ± 2,98 3,25 ± 3,45 0,67

(moyenne ± ET) NON Nombre d'os atteints 2,49 ± 2,16 2,39 ± 1,94 0,72 (moyenne ± ET) Indice de Renier 9,96 ± 8,56 9,79 ± 7,83 0,88 (moyenne ± ET)

101 Tableau C-4. Association génotype-phénotype pour le variant commun rs2458413

Chr 8; rs2458413 G>A

Génotypes p

AG AA ou GG non corrigée RR [ IC 95 % ]

Sexe masculin, n (%) 85 (55,92) 59 (64,13) 0,21 0,71 [0,42 - 1,22] Muté SQSTM1/P392L, n (%) 15 (9,87) 10 (10,87) 0,80 0,89 [0,38 - 2,06]

Monostotique, n (%) 65 (42,76) 39 (42,39) 0,95 1,01 [0,60 - 1,71]

Âge au diagnostic 61,63 ± 11,07 64,76 ± 9,46 0,025

(moyenne ± ET) Paget

TOTAL Niveau sérique PAL 3,88 ± 6,51 2,96 ± 2,64 0,19 (moyenne ± ET) Nombre d'os atteints 2,88 ± 3,01 2,77 ± 2,53 0,78 (moyenne ± ET) Indice de Renier 10,01 ± 9,05 10,77 ± 8,61 0,52 (moyenne ± ET)

Sexe masculin, n (%) 77 (56,20) 54 (65,85) 0,16 0,67 [0,38 - 1,18] Monostotique, n (%) 63 (45,99) 37 (45,12) 0,90 1,03 [0,60 - 1,79]

Âge au diagnostic 62,03 ± 11,34 65,02 ± 9,75 0,048

(moyenne ± ET) MUTÉ - Niveau sérique PAL 3,21 ± 3,49 3,06 ± 2,75 0,70

Paget (moyenne ± ET) NON Nombre d'os atteints 2,39 ± 1,93 2,52 ± 2,26 0,63 (moyenne ± ET) Indice de Renier 9,41 ± 7,94 10,46 ± 8,58 0,36 (moyenne ± ET)

102

Annexe D : Gènes situés dans les intervalles génomiques étudiés

Tableau D-1. Gènes situés à 0,5 Mb du gène CSF1 (locus 1p13)

Symbole Nom AHCYL1 Adenosylhomocysteinase-like 1 ALX3 Homeobox protein aristaless-like 3 AMIGO1 Adhesion molecule with ig-like domain 1 AMPD2 Adenosine monophosphate deaminase 2 ATXN7L2 Ataxin 7-like 2 CSF1 Colony stimulating factor 1 CYB561D1 Cytochrome b-561 domain containing 1 EPS8L3 Epidermal growth factor receptor kinase substrate 8-like protein 3 FAM40A Family with sequence similarity 40, member a GNAI3 Guanine nucleotide binding protein, alpha inhibiting activity polypeptide 3 GNAT2 Guanine nucleotide binding protein, alpha transducing activity polypeptide 2 GPR61 G protein-coupled receptor 61 GSTM1 Glutathione s-transferase mu 1 GSTM2 Glutathione s-transferase mu 2 (muscle) GSTM3 Glutathione s-transferase mu 3 (brain) GSTM4 Glutathione s-transferase mu 4 GSTM5 Glutathione s-transferase mu 5 HBXIP Hepatitis b virus x interacting protein KCNC4 Potassium voltage-gated channel, shaw-related subfamily, member 4 NDUFA4P1 Nadh dehydrogenase 1 alpha subcomplex, 4, pseudogene 1 PSMA5 Proteasome subunit, alpha type, 5 RBM15 Rna binding motif protein 15 RNU6V Rna, u6 small nuclear variant sequence with snrpe pseudogene sequence SLC16A4 Solute carrier family 16, member 4 SLC6A17 Solute carrier family 6, member 17 SYPL2 Synaptophysin-like 2 UBL4B Ubiquitin-like 4b

Tableau D-2. Gènes situés à 1 Mb du gène TM7SF4 (locus 8q22)

Symbole Nom CTHRC1 Collagen triple helix repeat containing 1 DPYS Dihydropyrimidinase LETM1P3 Leucine zipper-EF-hand containing transmembrane protein 1, pseudogene 3 LOC100420057 Alias: aconitase 2, mitochondrial pseudogene LOC100421893 Alias: insulin-like growth factor 2 mRNA binding protein 2 pseudogene2 LOC100499192 Alias: male-specific lethal 3 homolog (Drosophila) pseudogene LRP12 Low density lipoprotein receptor-related protein 12 MIR1273 MicroRNA 1273 MIR599 MicroRNA 599 MIR875 MicroRNA 875 TM7SF4 Transmembrane 7 superfamily member 4 (DCSTAMP)

103

104

Annexe E : Variants génétiques identifiés au cours de l’étude

Tableau E-1. Nouveaux variants rares ID Localisation / Description du variant Effets fonctionnels prédits in silico Fréquences ACIDES AMINÉS FACTEURS DE SITES D'ÉPISSAGE Fréquences Position Position Nombre Type de PolyPhen (P) TRANSCRIPTION Donneur (D) alléliques Nom attribué génomique génique Nucléotide Acide aminé changement SIFT (S) Gain (G) Accepteur (A) (1000 G) (1000 G) Cas Ctrl Cas Ctrl Condel (C ) Perte (P) Branchement (B) 1:110603311- c.*43_*44del ALX3_3,2 3' UTR 1 0 0,022 0 110603312 CCinsTT ALX3_5 1:110603128 3' UTR c.*227T>C P: AP-1 1 0 0,022 0

ALX3_7 1:110603037 3' UTR c.*318C>G B: Site altéré 1 0 0,022 0

AMPD2_4 1:110168623 Intron c.273-159C>G B: Site altéré 0 1 0 0,13

AMPD2_6 1:110169624 Intron c.637+90C>T G: c-REL B: Site altéré 1 0 0,017 0

CSF1_2 1:110453594 5' UTR c.-52G>C A: Nouveau site 1 0 0,017 0

P: Bénin CTHRC1_3 8:104390332 Exon c.450A>T p.Arg150Ser Radical S: Toléré G: C/EBPβ 0 1 0 0,13

C: Neutre P:Probablement dommageable CTHRC1_4 8:104390430 Exon c.548C>T p.Pro183Leu Radical 0 1 0 0,13 S: Toléré C: Délétère EPS8L3_1 1:110306878 Amont c.-230-229C>T G: PPARgamma 2 0 0,032 0

EPS8L3_5 1:110304733 Intron c.-24-338C>T B: Site altéré 2 0 0,031 0

P: Bénin EPS8L3_9 1:110300940 Exon c.718G>A p.Glu240Lys Radical S: Toléré 1 0 0,016 0

C: Délétère 1:110283009- c.-107_100 GSTM3_1 5' UTR 1 0 0,017 0 110283016 insGGGGCGG GSTM3_2 1:110282465 Exon c.114G>A T38T Synonyme 1 0 0,015 0

GSTM3_5 1:110279822 Intron c.580-31C>T 1 0 0,016 0

GSTM4_2 1:110195930 Amont c.-309-2773C>A 1 0 0,017 0

GSTM4_4 1:110198678 Amont c.-309-25G>A D: Nouveau site 1 0 0,020 0

GSTM4_5 1:110198709 5' UTR c.-303G>C 2 0 0,038 0

GSTM4_7 1:110199940 Intron c.177+39G>C G: NF-kappaB D: Site altéré 1 0 0,018 0

D: Site altéré GSTM4_8 1:110199971 Intron c.177+70G>C 1 0 0,018 0 A: Site altéré GSTM4_9 1:110199972 Intron c.177+71A>C D: Site altéré 1 0 0,018 0

GSTM4_11 1:110200155 Intron c.178-57G>A A: Site altéré 1 0 0,016 0 GSTM4_14 1:110204153 3' UTR c.*277C>T P: NRF-2 1 0 0,016 0

LRP12_4 8:105503533 Exon c.1948G>A p.V650M Conservateur P: Bénin 1 0 0,024 0 S: Toléré C: Délétère PSMA5_1 1:109969041 Amont c.-21-68G>T 1 0 0,017 0

PSMA5_2 1:109968806 Intron c.29+118C>G A: Nouveau site 1 0 0,016 0

PSMA5_4 1:109968504 Intron c.29+420A>G 0 1 0 0,125

TM7SF4_2 8:105351353 Amont c.-50-701G>A A: Site altéré 1 0 0,026 0

TM7SF4_6 8:105361584 Exon c.804G>A P268P Synonyme 1 0 0,016 0

TM7SF4_11 8:105367308 Exon c.1233C>T S411S Synonyme 0 1 0 0,13

105

105 106

Tableau E-2. Variants rares répertoriés dans EntrezSNP (page 1A) Identification Description du variant Effets fonctionnels prédits in silico ACIDES AMINÉS FACTEURS DE SITES D'ÉPISSAGE Position Position Type de PolyPhen (P) TRANSCRIPTION Donneur (D) Nom attribué Identifiant officiel génomique génique Nucléotide Acide aminé changement SIFT (S) Gain (G) Accepteur (A) (1000 G) (1000 G) Condel (C ) Perte (P) Branchement (B) A: Nouveau site ALX3_2 rs140818662 1:110611390 Intron c.277+1568G>C B: Nouveau site D: Nouveau site ALX3_3,1 rs187310064 1:110611263 Intron c.277+1695G>A A: Nouveau site c.*69_*96ins 1:110603286- CCTGCCTGGACA ALX3_4 rs144523285 3' UTR A: Site altéré 110603259 CCACGGAGGAAG CACC D: Site altéré AMPD2_1 rs58720505 1:110162073 Amont c.-432-386G>A A: Nouveau site AMPD2_10 rs41280332 1:110171120 Intron c.1326+3A>G G: NF-kappaB AMPD2_11 rs111379057 1:110171552 Intron c.1490+124A>G G: c-REL AMPD2_12 rs72705206 1:110172176 Intron c.1781+64C>T D: Nouveau site 1:110172351- AMPD2_13 rs72502382 Intron c.1782-68delG 110172350 AMPD2_14 rs2777905 1:110172592 Intron c.1902+54C>A AMPD2_2 rs56079255 1:110162190 Amont c.-432-269C>T AMPD2_3 rs114804066 1:110162995 Intron c.10+95A>G A: Site altéré AMPD2_5 rs116681683 1:110169198 Intron c.450+149C>T AMPD2_7 rs55739424 1:110170640 Intron c.1000-65G>T P: C/EBPβ B: Nouveau site AMPD2_8 rs56246993 1:110170641 Intron c.1000-64C>T P: C/EBPβ AMPD2_9 rs34030799 1:110170728 Exon c.1023G>A S341S Synonyme G: CREB CSF1_1 rs56222520 1:110452920 Amont c.-391-335G>A G: c-REL 8:104388290- c.372+103_372+10 CTHRC1_1 rs72124849 Intron 104388294 7delAAAAA CTHRC1_2 rs35500845 8:104388446 Intron c.372+259A>G A: Nouveau site EPS8L3_10 rs58548898 1:110295553 Intron c.1203+186G>A A: Nouveau site 1:110305247- c.-24-855_-24- EPS8L3_3 rs143958216 Intron A: Nouveau site 110305250 852delAGTA EPS8L3_4 rs146407630 1:110304938 Intron c.-24-543C>T G: c-FOS EPS8L3_6 rs77854863 1:110302505 Intron c.97-47C>T P: Bénin EPS8L3_7 rs17598321 1:110302450 Exon c.105G>A p.Met35Ile Conservateur S: Toléré P: CREB C: Neutre EPS8L3_8 rs3831143 1:110301430 Intron c.462-142delG GSTM3_3 rs186464486 1:110282448 Intron c.124+7C>T GSTM3_4 rs41283504 1:110280680 Intron c.372+33A>C G: CREB A: Site altéré

106

Tableau E-2. Variants rares répertoriés dans EntrezSNP (page 1B) Identification Fréquences

Allèles Hétérozygotes MAF de référence Fréquence Fréquence Nom attribué Identifiant officiel Nombre Nombre ( SNP) allélique génotypique Cas Ctrl Cas Ctrl Cas Ctrl Cas Ctrl ALX3_2 rs140818662 N/D 1 0 0,019 0 1 0 0,037 0 ALX3_3,1 rs187310064 N/D 1 0 0,019 0 1 0 0,037 0

ALX3_4 rs144523285 N/D 24 3 0,48 0,50 8 1 0,32 0,33

AMPD2_1 rs58720505 0,0405 2 0 0,038 0 2 0 0,077 0 AMPD2_10 rs41280332 0,0107 1 0 0,020 0 1 0 0,040 0 AMPD2_11 rs111379057 0,0125 1 0 0,017 0 1 0 0,034 0 AMPD2_12 rs72705206 0,0191 1 0 0,016 0 1 0 0,031 0 AMPD2_13 rs72502382 N/D 16 1 0,258 0,13 16 1 0,52 0,25 AMPD2_14 rs2777905 0,006 1 0 0,015 0 1 0 0,030 0 AMPD2_2 rs56079255 0,02 3 0 0,060 0 3 0 0,12 0 AMPD2_3 rs114804066 0,0071 2 0 0,034 0 2 0 0,069 0 AMPD2_5 rs116681683 0,0194 2 0 0,036 0 2 0 0,071 0 AMPD2_7 rs55739424 0,0247 2 0 0,040 0 2 0 0,080 0 AMPD2_8 rs56246993 0,0152 2 0 0,040 0 2 0 0,080 0 AMPD2_9 rs34030799 0,0141 2 0 0,040 0 2 0 0,080 0 CSF1_1 rs56222520 0,006 2 0 0,036 0 2 0 0,071 0

CTHRC1_1 rs72124849 N/D 2 0 0,040 0 2 0 0,080 0

CTHRC1_2 rs35500845 0,049 7 0 0,15 0 7 0 0,30 0 EPS8L3_10 rs58548898 0,0429 3 0 0,047 0 3 0 0,094 0

EPS8L3_3 rs143958216 N/D 20 0 0,31 0 10 0 0,31 0

EPS8L3_4 rs146407630 N/D 3 1 0,047 0,13 3 1 0,094 0,25 EPS8L3_6 rs77854863 0,034 2 0 0,033 0 2 0 0,067 0

EPS8L3_7 rs17598321 0,014 3 1 0,050 0,13 3 1 0,10 0,25

EPS8L3_8 rs3831143 N/D 13 1 0,20 0,13 13 1 0,41 0,25 GSTM3_3 rs186464486 N/D 2 0 0,030 0 2 0 0,061 0 GSTM3_4 rs41283504 0,0053 1 0 0,016 0 1 0 0,031 0

107 108

Tableau E-2. Variants rares répertoriés dans EntrezSNP (page 2A) Identification Description du variant Effets fonctionnels prédits in silico ACIDES AMINÉS FACTEURS DE SITES D'ÉPISSAGE Position Position Type de PolyPhen (P) TRANSCRIPTION Donneur (D) Nom attribué Identifiant officiel génomique génique Nucléotide Acide aminé changement SIFT (S) Gain (G) Accepteur (A) (1000 G) (1000 G) Condel (C ) Perte (P) Branchement (B) c.465+21_465+23 GSTM3_6 rs58210492 1:110280255 Intron delCTC GSTM4_1 rs115450622 1:110195901 Amont c.-309-2802T>C GSTM4_10 rs116014876 1:110200131 Intron c.178-81C>T B: Site altéré GSTM4_12 rs650985 1:110201580 Intron c.457-42C>T GSTM4_13 rs75484590 1:110201860 Intron c.567+128C>A GSTM4_15 rs142639069 1:110204227 3' UTR c.*351C>T P: C/EBPβ GSTM4_3 1KG_1_110196104 1:110196104 Amont c.-309-2599A>G D: Nouveau site D: Site altéré GSTM4_6 rs140934911 1:110199617 Intron c.112+208T>A A: Nouveau site LRP12_2 rs116702656 8:105543942 Intron c.136+193G>A LRP12_3 1KG_8_105509700 8:105509700 Exon c.1080T>C N360N Synonyme G: c-FOS A: Site altéré PSMA5_3 rs116711017 1:109968616 Intron c.29+308G>A P: PPARgamma B: Site altéré PSMA5_5 rs12118385 1:109953510 Intron c.561+123C>T TM7SF4_1 rs2458417 8:105351191 Amont c.-50-863G>A G: c-REL P: Bénin TM7SF4_12 rs77194116 8:105367370 Exon c.1295C>T p.Pro432Leu Radical S: Toléré C: Neutre TM7SF4_3 rs118038136 8:105351490 Amont c.-50-564G>T A: Site altéré P: Probablement dommageable TM7SF4_5 rs61682032 8:105360994 Exon c.214C>A p.Leu72Met Conservateur S: Délétère C: Délétère TM7SF4_7 rs144377739 8:105361740 Exon c.960C>T L320L Synonyme TM7SF4_8 rs117086639 8:105361803 Exon c.1023C>T H341H Synonyme P: Probablement p.Leu397Ph dommageable TM7SF4_9 rs62620995 8:105367264 Exon c.1189C>T Radical e S: Toléré C: Délétère

108

Tableau E-2. Variants rares répertoriés dans EntrezSNP (page 2B) Identification Fréquences

Allèles Hétérozygotes MAF de référence Fréquence Fréquence Nom attribué Identifiant officiel Nombre Nombre (Entrez SNP) allélique génotypique Cas Ctrl Cas Ctrl Cas Ctrl Cas Ctrl

GSTM3_6 rs58210492 N/D 9 2 0,14 0,25 9 2 0,28 0,50

GSTM4_1 rs115450622 0,034 4 1 0,067 0,13 4 1 0,13 0,25 GSTM4_10 rs116014876 0,0103 3 1 0,047 0,13 3 1 0,094 0,25 GSTM4_12 rs650985 0,0233 5 0 0,076 0 5 0 0,15 0 GSTM4_13 rs75484590 0,0326 4 1 0,061 0,13 4 1 0,12 0,25 GSTM4_15 rs142639069 N/D 1 0 0,016 0 1 0 0,031 0 GSTM4_3 1KG_1_110196104 0,001 1 0 0,017 0 1 0 0,033 0 GSTM4_6 rs140934911 N/D 1 0 0,018 0 1 0 0,036 0 LRP12_2 rs116702656 0,016 0 1 0 0,125 0 1 0,000 0,250 LRP12_3 1KG_8_105509700 0,002 2 0 0,033 0 2 0 0,067 0 PSMA5_3 rs116711017 0,0088 1 0 0,017 0 1 0 0,033 0 PSMA5_5 rs12118385 0,0088 1 0 0,016 0 1 0 0,032 0 TM7SF4_1 rs2458417 N/D 1 0 0,016 0 1 0 0,031 0 TM7SF4_12 rs77194116 0,0143 0 1 0 0,13 0 1 0 0,25 TM7SF4_3 rs118038136 0,008 1 0 0,029 0 1 0 0,059 0

TM7SF4_5 rs61682032 0,027 0 1 0 0,13 0 1 0 0,25

TM7SF4_7 rs144377739 N/D 1 0 0,016 0 1 0 0,031 0 TM7SF4_8 rs117086639 0,014 0 1 0 0,13 0 1 0 0,25

TM7SF4_9 rs62620995 0,0141 1 0 0,019 0 1 0 0,037 0

109 110

Tableau E-3. Variants communs identifiés Effets fonctionnels ID Localisation / Description du variant Fréquences prédits in silico Position PolyPhen (P) MAF de Position génique Type de Nom attribué Identifiant officiel génomique Nucléotide Acide aminé SIFT (S) référence (1000 G) changement (1000 G) Condel (C ) (Entrez SNP) AMPD2_A rs55646629 1:110162548 5' UTR c.-343C>T 0,19

AMPD2_B rs28362580 1:110162918 Intron c.10+18T>C 0,16

AMPD2_C rs28362581 1:110163879 Intron c.10+979G>A 0,21

AMPD2_D rs493972 1:110168888 Intron c.341+38C>G 0,22

AMPD2_E rs865774 1:110169190 Intron c.450+141C>T 0,10

AMPD2_F rs524998 1:110169957 Intron c.779+19A>G 0,18

AMPD2_G rs863978 1:110170896 Exon c.1191T>C H397H Synonyme 0,22

AMPD2_H rs560674 1:110171525 Intron c.1490+97C>G 0,11

AMPD2_I rs523786 1:110171705 Intron c.1491-26A>C 0,19

AMPD2_J rs2269340 1:110172236 Intron c.1781+124T>C 0,27

AMPD2_K rs2269341 1:110172362 Intron c.1782-56C>T 0,37

AMPD2_L rs568686 1:110173775 3' UTR c.*1G>T 0,11

CSF1_A rs2297706 1:110456866 Intron c.40-15C>A 0,31

CSF1_B rs2275123 1:110458234 Intron c.163-22G>A 0,21

CSF1_C rs3093044 1:110459730 Intron c.226-185G>A 0,26

CSF1_D rs333967 1:110459773 Intron c.226-142C>T 0,30

CSF1_E rs333970 1:110466338 Exon c.1095C>A T365T Synonyme 0,44

CSF1_F rs2229166 1:110466810 Exon c.1567C>A R523R Synonyme 0,32

CTHRC1_A rs3736052 8:104383755 5' UTR c.-130G>C 0,07

CTHRC1_B rs6468870 8:104388276 Intron c.372+89A>T 0,24

CTHRC1_C rs2917549 8:104388418 Intron c.372+231A>G 0,27

CTHRC1_D rs7845210 8:104388574 Intron c.372+387A>C 0,24

CTHRC1_E rs2687364 8:104390224 Intron c.373-31T>A 0,49

CTHRC1_F rs3098232 8:104394631 Intron c.590-55A>G 0,10

CTHRC1_G rs3098233 8:104394744 Exon c.648T>C G216G Synonyme 0,27

EPS8L3_A rs943641 1:110306531 5' UTR c.-112T>C 0,18

EPS8L3_B rs878605 1:110306469 5' UTR c.-50G>C 0,17

EPS8L3_C rs878604 1:110306416 Intron c.-25+28G>A 0,17

EPS8L3_D rs878603 1:110306384 Intron c.-25+60C>A 0,17

EPS8L3_E rs3738771 1:110306211 Intron c.-25+233A>G 0,33

EPS8L3_F rs7534315 1:110305699 Intron c.-25+745C>G 0,24

EPS8L3_G rs78633716 1:110305687 Intron c.-25+757A>G 0,06

EPS8L3_H rs7534218 1:110305588 Intron c.-25+856C>G 0,20

EPS8L3_I rs7534019 1:110305452 Intron c.-25+992C>T 0,24

EPS8L3_J rs7542853 1:110305409 Intron c.-24-1014G>A 0,17

110

Effets fonctionnels ID Localisation / Description du variant Fréquences prédits in silico Position PolyPhen (P) MAF de Position génique Type de Nom attribué Identifiant officiel génomique Nucléotide Acide aminé SIFT (S) référence (1000 G) changement (1000 G) Condel (C ) (Entrez SNP) EPS8L3_K rs7533771 1:110305188 Intron c.-24-793C>A 0,18

EPS8L3_L rs17024790 1:110304777 Intron c.-24-382C>T 0,06

EPS8L3_M rs6676659 1:110304537 Intron c.-24-142C>T 0,30

P: Bénin EPS8L3_N rs6693815 1:110301260 Exon c.490G>A p.Gly164Ser Radical S: Toléré 0,31 C: Neutre EPS8L3_O rs11102002 1:110300277 Intron c.898-100G>A 0,11

P: Bénin EPS8L3_Q rs11102001 1:110299691 Exon c.1069C>T p.Pro357Ser Conservateur S: Toléré 0,15 C: Délétère EPS8L3_R rs2094469 1:110299550 Intron c.1121+89T>C 0,23

EPS8L3_S rs1887548 1:110295890 Intron c.1122-70G>C 0,26

EPS8L3_T rs1887547 1:110295772 Exon c.1170A>G S390S Synonyme 0,25

EPS8L3_U rs1887546 1:110295643 Intron c.1203+96C>A 0,33

EPS8L3_V rs2274536 1:110294577 Intron c.1437+40T>C 0,33

EPS8L3_W rs45612540 1:110293989 Intron c.1567-16T>C 0,07

EPS8L3_X rs15864 1:110292856 3' UTR c.*157C>G 0,34

GSTM3_A rs4970777 1:110283785 Intron c.-225+513G>A 0,26

GSTM3_B rs1332018 1:110282972 5' UTR c.-63C>A 0,27

GSTM3_D rs1537234 1:110279821 Intron c.580-30G>T 0,47

P: Bénin GSTM3_E rs7483 1:110279701 Exon c.670G>A p.Val224Ile Conservateur S: Toléré 0,36 C: Erreur GSTM3_F rs2234696 1:110279602 3' UTR c.*91A>C 0,13

GSTM4_A rs668413 1:110195944 Amont c.-309-2759C>A 0,40

GSTM4_B rs569998 1:110196305 Amont c.-309-2398A>T 0,40

GSTM4_C rs656025 1:110196429 Amont c.-309-2274G>A 0,40

GSTM4_D rs2781815 1:110196507 Amont c.-309-2196T>C 0,13

GSTM4_E rs1010167 1:110198727 5' UTR c.-303C>G 0,43

GSTM4_F rs560018 1:110200360 Intron c.260-34T>C 0,18

GSTM4_G rs506008 1:110201699 Exon c.534T>C F178F Synonyme 0,20

GSTM4_H rs562996 1:110201809 Intron c.567+77G>T 0,10

GSTM4_I rs563003 1:110201812 Intron c.567+80A>G 0,10

GSTM4_L rs670439 1:110207482 Aval c.+440+3160C>T 0,10

GSTM4_M rs1051137 1:110208089 Aval c.+440+3767A>T 0,28

LRP12_A rs16871500 8:105510326 Intron c.476-22A>C 0,14

111 111 112

Effets fonctionnels ID Localisation / Description du variant Fréquences prédits in silico Position PolyPhen (P) MAF de Position génique Type de Nom attribué Identifiant officiel génomique Nucléotide Acide aminé SIFT (S) référence (1000 G) changement (1000 G) Condel (C ) (Entrez SNP) PSMA5_A rs3820667 1:109968410 Intron c.29+514T>G 0,44

PSMA5_B rs17647543 1:109964605 Intron c.30-57A>G 0,06

PSMA5_C rs1465607 1:109958035 Intron c.97-50A>G 0,26

TM7SF4_A rs3808396 8:105350763 Amont c.-50-1291G>A 0,06

TM7SF4_B rs2458418 8:105350851 Amont c.-50-1203A>G 0,34

TM7SF4_C rs3824155 8:105351070 Amont c.-50-984C>T 0,12

TM7SF4_D rs2514666 8:105351943 Amont c.-50-111C>T 0,34

TM7SF4_E rs2458415 8:105351998 Amont c.-50-56A>C 0,33

TM7SF4_F rs3088027 8:105361095 Exon c.315C>T I105I Synonyme 0,12

P: Bénin TM7SF4_G rs67114147 8:105361354 Exon c.574G>C p.Glu192Gln Radical S: Toléré 0,12 C: Délétère TM7SF4_H rs2458431 8:105367096 Intron c.1030-9T>C 0,42

P: Bénin TM7SF4_I rs3802204 8:105367121 Exon c.1046A>G p.Asp349Gly Radical S: Toléré 0,10 C: Neutre TM7SF4_J rs4734780 8:105368408 Exon c.1395A>G A465A Synonyme 0,06

TM7SF4_K rs3808401 8:105368685 3' UTR c.*259G>C 0,10

TM7SF4_L rs75453075 8:105368929 Aval c.+491+12T>A 0,43

TM7SF4_M rs2669453 8:105368930 Aval c.+491+13C>A 0,48

TM7SF4_N rs2514665 8:105351531 Amont c.-50-523C>T 0,31

112