UNIVERSITÉ TOULOUSE III - PAUL SABATIER U.F.R. Sciences de la Vie et de la Terre (SVT) École Doctorale Biologie-Santé-Biotechnologies

THÈSE Pour l’obtention du grade de DOCTEUR DE L’UNIVERSITÉ TOULOUSE III Spécialité Biologie Cellulaire et Moléculaire

Présentée et soutenue par Eve TOULZA le 20 octobre 2006

EXPRESSION GÉNIQUE AU COURS DE LA DIFFÉRENCIATION DE L’ÉPIDERME HUMAIN

Jury : David CRIBBS Président Thierry MAGNALDO Rapporteur Philippe MUSETTE Rapporteur Daniel ABERDAM Examinateur Guy SERRE Examinateur Marina GUERRIN WEBER Directeur de thèse

Unité Différenciation Épidermique et Auto-immunité Rhumatoïde UMR 5165 CNRS – Université Toulouse III, Faculté de Médecine 37, allées J. Guesde - 31073 Toulouse

1

Cette thèse, pour vous qui me lisez, c’est 282 pages, 41 illustrations, 64 762 mots, 431 168 caractères et 385 références.

Mais pour moi ce fût aussi : – 152 minibanques – plus de 100 000 clones – 22 585 ORESTES – 27 000 séquences – 54 plaques de 384 puits – 1200 unités de Taq – 1 demi-milliard de cellules – 288 heures d’enseignement – 23 litres de LB – 18 flacons de trypsine – 760 microgrammes d’ARN – 550 litres de café – 468 000 marches d’escalier – 1 225 grammes d’agarose – 2,66 m² de bureau – 322 amorces de PCR quantitative – 80 gigaoctets de fichiers – 130 kilogrammes de documents – 4 ans de bons moments...

3

Remerciements

J’exprime toute ma gratitude à Guy Serre pour m’avoir accueillie dans son unité. Merci de m’avoir permis de travailler dans les meilleures conditions, de m’avoir encouragée et de m’avoir fait confiance quand j’ai souhaité faire de l’enseignement.

Je remercie Thierry Magnaldo, Directeur de Recherche CNRS à l’Institut Gustave Roussy (Villejuif, UPR2169 CNRS), et Philippe Musette, Professeur de dermatologie de Rouen, de me faire l’honneur d’évaluer ces travaux. Merci d’avoir accepté la lourde tâche de rapporteurs. Merci aussi à Daniel Aberdam, Directeur de Recherche INSERM (Nice, INSERM U634) et David Cribbs, Professeur de génétique à l’Université Paul Sabatier (Toulouse III) d’avoir accepté de participer au jury de cette thèse malgré un emploi du temps chargé.

Mes remerciements les plus sincères à Marina Guerrin Weber, mon directeur de thèse. Sa passion pour son métier, son enthousiasme, son exigence et le soutien auquel j’ai eu droit tout au long de ces travaux, qu’il soit moral ou intellectuel, resteront mes bases et mon élan pour de futurs projets. Merci de m’avoir donné un sujet extrêmement passionnant, et de m’avoir fait confiance pendant ces 5 ans. Je voudrais également te remercier pour le temps, la disponibilité et l’énergie dont tu as fait preuve pendant cette thèse.

Il me tient à coeur également d’exprimer ici toute ma reconnaissance et ma profonde amitié à Mitou Ribouchon. Mitou, tes doigts d’or, ta bonne humeur permanente et les nombreuses attentions dont tu as fait preuve à mon égard se sont révélées extrêmement précieuses depuis ton arrivée au laboratoire. Merci pour notre café du matin qui a souvent été l’occasion de plaisantes discussions.

Je salue avec grand plaisir tous les membres de l’équipe et du laboratoire qui m’ont chaleureusement entourée tout au long de cette thèse. Merci en particulier à Florence Galliano pour son travail sur l’A2ML1, à Nathalie Jonca pour sa disponibilité et nos discussions enrichissantes, Hélène Gallinaro pour ses analyses immunohistochimiques. Merci à Anne Huchenq-Champagne pour avoir supporté ma pagaille avec bonne humeur.

Je remercie plus particulièrement Nicolas Mattiuzzo, mon colocataire et « compagnon de transcriptome ». Merci d’avoir essayé de m’initier, en vain, au plaisir de l’analyse statistique. Merci surtout pour nos discussions concernant la biologie de l’armadillo, les chats de l’île Kerguelen ou l’alignement des orbites des planètes du système solaire sur un même plan. Merci enfin pour ta... bonhomie ! Merci également à Emilie Leclerc pour ses nombreuses relectures et ses coups de pouce salvateurs lors de la mise en forme de ce manuscrit. Merci pour ta disponibilité et pour ta bonne humeur au quotidien. Je vous souhaite à tous les deux bon courage pour vos oeuvres doctorales respectives.

Céline, miss PAD6, nous avons partagé les moments d’angoisse, de doute, et parfois (?) d’espoir. Je te souhaite autant de plaisir à terminer ta rédaction que j’en ai eu à mettre un point final à ce manuscrit. Le relais qui m’a été transmis par Cécile et Rachida est désormais entre tes mains !

5

J’ai pris beaucoup de plaisir à travailler avec les nombreux stagiaires qui ont contribué, le temps de quelques mois ou seulement de quelques séquences, à l’avancée de ces travaux : Aurélie, Christophe, Matthieu, Delphine, Emilie, Daniela, Dany, Bénédicte, Ikrame... Merci à vous.

Je remercie l’équipe administrative de l’unité, Claudine, Hélène, Christel et Catherine pour leur aide (et les bons de commandes oligos toujours urgentissimes).

Un grand merci à Hélène Brun et Claudie Offer du service commun de séquençage de l’IFR30 pour leur efficacité et leur gentillesse. Merci à Marie-Françoise Isaïa et Marie-Paule Henry pour leur expertise dans l’utilisation du cryotome, ou l’art de couper les poils en 4. Un merci tout particulier à Marie-Noëlle qui a partagé avec moi un coin de bureau, ainsi que quelques analyses de séquences...

Je remercie nos collaborateurs du Genoscope et du centre de bioinformatique de Bordeaux pour leur aide dans la production et l’analyse des séquences. Merci aussi à Christian Vincent et Aurélien Rougemont pour leur aide dans la construction de la première base de données... et à Jim Kent pour son extraordinaire genome browser !

Merci aux enseignants de l’Université Paul Sabatier de m’avoir fait confiance pendant ces 3 ans de monitorat et cette dernière année d’ATER, Martine Briet, Pascale Belenguer, Gwenaëlle Fichant, Catherine Mathé et Pierre Ferrer. Merci infiniment à ce dernier de m’avoir encouragée à me diriger vers le DEA de biologie moléculaire. Merci à Michel Weber pour m’avoir acceptée au sein de sa formation doctorale, ainsi que pour l’aide qu’il m’a apportée dans l’utilisation du genome browser de l’UCSC. Merci enfin à Bruno Dagues et Bernadette Santoni du Centre d’Initiation à l’Enseignement Supérieur de Toulouse pour m’avoir permis de continuer à enseigner grâce à un support ATER spécifique.

Merci à mesdames Casanova et Sutra, professeurs de biologie, respectivement au collège Victor Hugo de Lavelanet et au lycée de Mirepoix, de m’avoir transmis leur savoir et leur passion.

Enfin et surtout, merci à mes proches de m’avoir supportée, au sens propre comme au sens figuré. Maman, Vital et Pierre-Guy, merci de votre patience. Charles, tu as traversé ces 4 années de thèse avec moi. Merci pour ton soutien et ta compréhension. Vous avez subi mes humeurs et mes états d’âme au quotidien, cette thèse n’existerait pas sans vous tous.

Je dédie cette thèse à la mémoire de mon père.

6

Liste des abréviations aa : acides aminés ADN : Acide Désoxyribo-Nucléique ADNc : ADN Complémentaire AMP : Adénosine Mono-Phosphate AMPc : AMP cyclique ARN : Acide Ribo-Nucléique ARNm : ARN messager ATF : Activating Transcription Factor ATP : Adenosine Tri-Phosphate BAC : Bacterial Artificial CCD : Charge-Coupled Device CDE : Complexe de Différenciation Epidermique CMH : Complexe Majeur d’Histocompatibilité CRE : cAMP Responsive Element Ct : threshold Cycle Dnase : deoxyribonuclease EBS : Epidermolyse Bulleuse Simple EDC : Epidermal Differentiation Complex EST : Expressed Sequence Tags FRET : Fluorescence Resonance Energy Transfer HT-ISH : High Throughput In Situ Hybridization GAPDH : GlycerAldehyde 3-Phosphate DesHydrogenase GFP : Green Fluorescent Protein GLGI : Generation of Longer cDNA fragments from SAGE tags for Identification GPI : glycosylphosphatidylinositol HLA : Human Leukocyte Antigen IFAP : Intermediate Filament Associated Protein IL : interleukine IP3 : Inositol tri-phosphate kDa : kilodaltons LEF1 : Lymphoid enhancer-binding factor-1 LPS : lipopolysaccharide MAPK : Mitogen-Activated Protein Kinase pb : paire(s) de bases PCR : Polymerase Chain Reaction PGN : peptidoglycane RE : Réticulum Endoplasmique RT : Reverse Transcription SAGE : Serial Analysis of Gene Expression siRNA : small interfering RNA SNP : Single Nucleotide Polymorphism SSH : Suppression Subtractive Hybridization SST : Signal Sequence Trap Tm : melting Temperature TPA : phorbol ester 12-O-tetradecanoylphorbol-13-acetate TRE : TPA Responsive Element UV : rayons ultraviolets YAC : Yeast Artificial Chromosome

7

Résumé

La fonction barrière de l’épiderme est assurée par sa partie la plus superficielle, la couche cornée, constituée de cornéocytes, des cellules très intercohésives, entourées d’un milieu extracellulaire riche en lipides. Les cornéocytes résultent de la cornification, une apoptose particulière. Les éléments constitutifs de ces cellules, ainsi que les enzymes qui régulent leur détachement pour permettre la desquamation, sont principalement synthétisés par les kératinocytes de la couche cellulaire sous jacente, la couche granuleuse. Le kératinocyte granuleux correspond non seulement au stade ultime de différenciation épidermique en termes de transcription et de traduction, mais aussi au point culminant de cette activité. Ce travail concerne l’étude du transcriptome du kératinocyte granuleux de l’épiderme humain, dans le but d’identifier de nouveaux gènes pour mieux comprendre la fonction de barrière et la régulation de la desquamation de l’épiderme normal. La mise au point d’une méthode d'incubations itératives à froid dans de la trypsine de lambeaux d’épiderme provenant de pièces opératoires, a permis de dissocier progressivement les kératinocytes épidermiques à partir de la couche basale pour obtenir des fragments majoritairement constitués de cornéocytes (sans activité transcriptionnelle) et de kératinocytes granuleux. En collaboration avec le Genoscope, 22 000 EST de kératinocytes granuleux ont été produits par la technique des ORESTES. Au total, 3387 gènes ont été identifiés dans les kératinocytes granuleux, dont une centaine environ codent pour des protéines hypothétiques. Parmi eux se trouvait un gène codant pour une protéine de fonction inconnue, la dermokine. Au cours de ce travail, 13 nouvelles isoformes de ce gène ont été mises en évidence. Un nouveau gène, l’Alpha 2-Macroglobulin-Like 1 (A2ML1), codant pour un inhibiteur de protéases a été identifié et son produit caractérisé. D’autres gènes, dont l’expression au cours de la différenciation épidermique n’avait jamais été décrite, ont été testés par PCR quantitative en temps réel. Une quarantaine de gènes codant pour des protéines peu connues se sont révélés spécifiques de la couche granuleuse. Un nouveau membre potentiel de la famille des LCE (Late Cornified Envelope), a été par exemple identifié, ainsi qu’un rétrogène de la prosaposine. Ce travail ouvre la voie à la caractérisation de nouvelles protéines intervenant dans la différenciation kératinocytaire, qui constituent autant de nouvelles cibles pharmacologiques potentielles et pourrait déboucher sur l’identification de gènes candidats dans les ichthyoses de substratum génique inconnu.

9

Abstract

Barrier function of the epidermis is provided by its most superficial portion, the cornified layer, formed by corneocytes, strongly interconnected cells surrounded by a lipid-rich extracellular environment. Corneocytes result from cornification, a specific programmed cell death. Their constituents, as well as enzymes regulating their release leading to desquamation, are mainly produced by keratinocytes of the subjacent granular layer. Granular keratinocytes not only represent the last step of epidermis differentiation, but also the climax of this process. This pioneer analysis of the transcriptome of human granular keratinocytes, aims for identification of new to improve the understanding of barrier function and regulation of desquamation in normal epidermis. Improvement of a method based on iterative trypsinizations of chilled epidermis fragments from surgery, allowed progressive dissociation of keratinocytes from basal to upper layers, until getting fragments mainly composed of corneocytes (devoid of transcriptional activity) and granular keratinocytes. In collaboration with Genoscope, 22 000 EST from granular keratinocytes were produced according to the ORESTE method. Altogether, 3387 genes were identified in granular keratinocytes, including almost a hundred coding for hypothetical proteins. Among them was a gene coding for a protein with unknown function, named dermokine. During this work, 13 new isoforms of dermokine gene were identified. Another gene, Alpha 2-Macroglobulin-Like 1 (A2ML1), coding for a protease inhibitor, was discovered, and its product described for the first time. Other genes, whose expression during epidermis differentiation had not previously been shown, were tested by quantitative real-time PCR. About fourty, coding for poorly characterized proteins, were specific to granular layer. For example, a putative new member of LCE (Late Cornified Envelope) family was discovered, as well as a prosaposin retrogene. This work paves the way for description of additional genes involved in keratinocytes differentiation, as so many potential pharmacological targets, and might lead to identification of candidate genes for ichthyosis with unknown gene substratum.

10

Table des matières

I. INTRODUCTION ...... 15

1 LES METHODES D’ETUDE DU TRANSCRIPTOME...... 18

1.1 INTRODUCTION ...... 18 1.2 TECHNIQUES D’ANALYSE STATIQUE DU TRANSCRIPTOME ...... 19 1.2.1 LES BANQUES D’EST (EXPRESSED SEQUENCE TAGS)...... 19 1.2.1.1 Principe ...... 19 1.2.1.2 Avantages et inconvénients...... 20 1.2.1.3 Applications ...... 20 1.2.2 LA TECHNIQUE DES ORESTES ...... 21 1.2.2.1 Principe ...... 21 1.2.2.2 Avantages et inconvénients...... 22 1.2.2.3 Applications ...... 23 1.3 TECHNIQUES D’ANALYSE DYNAMIQUE DU TRANSCRIPTOME ...... 23 1.3.1 BANQUES SOUSTRAITES ET HYBRIDATION SOUSTRACTIVE SUPPRESSIVE...... 23 1.3.1.1 Principe ...... 23 1.3.1.1.1 Les banques soustraites...... 23 1.3.1.1.2 Hybridation soustractive suppressive (SSH)...... 24 1.3.1.2 Avantages et inconvénients...... 24 1.3.1.3 Applications ...... 26 1.3.2 LE DIFFERENTIAL DISPLAY...... 26 1.3.2.1 Principe ...... 26 1.3.2.2 Avantages et inconvénients...... 26 1.3.2.3 Applications ...... 27 1.3.3 LA TECHNIQUE DU SAGE ...... 28 1.3.3.1 Principe ...... 28 1.3.3.2 Avantages et inconvénients...... 28 1.3.3.3 Conversion en EST 3’...... 30 1.3.3.4 Applications ...... 30 1.3.4 LA PCR QUANTITATIVE EN TEMPS REEL...... 30 1.3.4.1 Principe ...... 30 1.3.4.2 Les différents types de chimie (figure 5) ...... 31 1.3.4.2.1 Sondes spécifiques ...... 31 1.3.4.2.2 Le SYBR Green, un intercalant non spécifique...... 32 1.3.4.3 Amplification théorique et principe du Ct ...... 33 1.3.4.4 Les méthodes de quantification...... 34 1.3.4.4.1 Définition des termes utilisés...... 34 1.3.4.4.2 Quantification dite absolue : méthode des courbes standard ...... 34 1.3.4.4.3 Quantification relative par la méthode de comparaison de Ct ...... 34 1.3.4.5 Avantages et inconvénients de la PCR quantitative en temps réel ...... 35 1.3.4.6 Applications ...... 36 1.3.5 LES PUCES A ADN...... 36 1.3.5.1 Principe ...... 36 1.3.5.2 Analyse des données ...... 38 1.3.5.3 Avantages et inconvénients...... 39 1.3.5.4 Applications ...... 40 1.4 TECHNIQUES SPECIFIQUES...... 41 1.4.1 HYBRIDATION IN SITU A HAUT DEBIT (HT-ISH)...... 41

11

1.4.1.1 Principe ...... 41 1.4.1.2 Avantages et inconvénients...... 41 1.4.1.3 Applications ...... 41 1.4.2 « SIGNAL SEQUENCE TRAP » (SST) ...... 42 1.4.2.1 Principe ...... 42 1.4.2.2 Avantages et inconvénients...... 43 1.4.2.3 Applications ...... 43 1.5 BIOANALYSE ET GESTION INFORMATIQUES DES DONNEES...... 43 1.5.1 LES DIFFERENTES BANQUES DE DONNEES...... 43 1.5.2 LES SYSTEMES DE VISUALISATION DU GENOME HUMAIN (« GENOME BROWSERS ») ...... 45 1.5.3 DATA MINING ...... 46

2 LA DIFFERENCIATION EPIDERMIQUE ...... 47

2.1 PRESENTATION GENERALE ...... 47 2.1.1 LA PEAU ...... 47 2.1.1.1 L’hypoderme...... 48 2.1.1.2 Le derme ...... 48 2.1.1.3 La jonction dermo-épidermique...... 48 2.1.1.4 L’épiderme...... 48 2.1.1.5 Les annexes épidermiques ...... 48 2.2 LA DIFFERENCIATION KERATINOCYTAIRE ...... 49 2.2.1 ASPECTS MORPHOLOGIQUES ...... 49 2.2.1.1 Couche basale ou stratum basale...... 49 2.2.1.2 Couche épineuse ou stratum spinosum ...... 49 2.2.1.3 Couche granuleuse ou stratum granulosum...... 50 2.2.1.4 Couche cornée ou stratum corneum...... 50 2.2.2 ASPECTS BIOCHIMIQUES ...... 52 2.2.2.1 Couche basale ...... 52 2.2.2.2 Couche épineuse ...... 55 2.2.2.3 Couche granuleuse et couche cornée ...... 55 2.2.2.4 Mise en place de la fonction barrière ...... 55 2.2.2.5 La cornification...... 55 2.2.2.5.1 Disparition des organites, un point commun avec l’apoptose ?...... 56 2.2.2.5.2 Formation de la matrice fibreuse ...... 58 2.2.2.5.2.1 Filaments intermédiaires ...... 58 2.2.2.5.2.2 Agrégation des FI...... 60 2.2.2.5.3 Formation de l’enveloppe cornée...... 61 2.2.2.6 Le complexe de différenciation épidermique ou EDC (« Epidermal Differenciation Complex »)...... 65 2.2.2.6.1 Historique et description générale...... 65 2.2.2.6.2 La famille des gènes de fusion: « fused gene family » ...... 67 2.2.2.6.3 Famille SPRR (Small Proline Rich proteins)...... 69 2.2.2.6.4 LELP1 (Late cornified Envelope-Like Proline-rich 1) ...... 70 2.2.2.6.5 Famille LCE (Late Cornified Envelope)...... 71 2.2.2.6.6 L’involucrine...... 73 2.2.2.6.7 La loricrine...... 74 2.2.2.6.8 SMCP, l’intrus ! ...... 75 2.2.2.6.9 Les récepteurs au peptidoglycane PGLYRP3 et PGLYRP4 (ou PGRP, Peptidoglycan Recognition Protein) ...... 76 2.2.2.6.10 Les gènes S100A...... 77 2.2.2.6.11 Conservation de l’EDC ...... 79 2.2.2.6.12 Conclusion sur l’EDC ...... 79

12

2.2.2.7 SSC (Stratified epithelium Secreted peptides Complex), un locus contenant les gènes codant pour 3 nouvelles protéines sécrétées ...... 80 2.2.2.8 Rôle des systèmes jonctionnels dans l’établissement de la fonction barrière ...... 82 2.2.2.8.1 Jonctions serrées ...... 83 2.2.2.8.2 jonctions d’ancrage ...... 86 2.2.2.8.2.1 Ceinture d’adhérence ou zonula adherens ...... 86 2.2.2.8.2.2 Desmosomes et cornéodesmosomes ...... 87 2.2.2.8.2.2.1 La plaque desmosomale...... 88 2.2.2.8.2.2.2 Le cœur desmosomal ...... 89 2.2.2.8.2.2.3 Les cornéodesmosomes...... 91 2.2.2.8.3 Jonctions communicantes ...... 92 2.2.2.9 Rôle des lipides intercornéocytaires...... 93 2.2.3 LA DESQUAMATION...... 97 2.2.4 ROLE ANTIMICROBIEN DES KERATINOCYTES...... 99 2.2.4.1 Les défensines...... 99 2.2.4.1.1 hBD1...... 100 2.2.4.1.2 hBD2...... 100 2.2.4.1.3 hBD3...... 100 2.2.4.2 Les cathélicidines...... 101 2.2.4.3 Autres protéines ...... 101 2.2.4.3.1 L’adrénomédulline...... 101 2.2.4.3.2 SKALP et SLPI...... 102 2.3 REGULATION DE L’EXPRESSION GENIQUE AU COURS DE LA DIFFERENCIATION...... 102 2.3.1 ROLE DU CALCIUM ...... 102 2.3.2 FACTEURS DE TRANSCRIPTION...... 103 2.3.2.1 Initiation de la différenciation terminale...... 104 2.3.2.1.1 Protéines de la famille Rb ...... 104 2.3.2.1.2 Protéines AP-1 et AP-2...... 104 2.3.2.1.3 Facteurs à domaines POU...... 106 2.3.2.1.4 FOXN1...... 106 2.3.2.2 Etapes tardives de la différenciation ...... 107 2.3.2.2.1 DLX3 ...... 107 2.3.2.2.2 KLF4...... 107 2.3.3 AUTRES PROTEINES...... 109 2.3.3.1 La stratifine ...... 109 2.3.3.2 La kinase AKT1...... 109 2.3.3.3 La kinase TAK1...... 110 2.4 PATHOLOGIES DE LA DIFFERENCIATION EPIDERMIQUE...... 110 2.4.1 LE PSORIASIS ...... 110 2.4.2 LES CARCINOMES EPIDERMOÏDES ...... 111 2.4.3 LES GENODERMATOSES...... 112

3 TRANSCRIPTOME ET DIFFERENCIATION EPIDERMIQUE...... 114

3.1 TRANSCRIPTOME EPIDERMIQUE ET PATHOLOGIE ...... 114 3.1.1 EXPRESSION GENIQUE AU COURS DE L’INFLAMMATION ...... 114 3.1.2 EXPRESSION GENIQUE AU COURS DE LA CICATRISATION...... 115 3.1.3 EXPRESSION GENIQUE AU COURS DE LA CARCINOGENESE ...... 117 3.1.4 EXPRESSION GENIQUE AU COURS DU PSORIASIS ...... 118 3.2 TRANSCRIPTOME ET PHYSIOLOGIE EPIDERMIQUE ...... 119 3.2.1 EXPRESSION GENIQUE AU COURS DE LA MELANOGENESE ...... 119 3.2.2 EXPRESSION GENIQUE AU COURS DE LA SENESCENCE ...... 120 3.3 TRANSCRIPTOME EPIDERMIQUE ET DIFFERENCIATION KERATINOCYTAIRE ...... 121 3.3.1 EXPRESSION GENIQUE AU COURS DE LA DIFFERENCIATION IN VITRO...... 121

13

3.3.2 EXPRESSION GENIQUE AU COURS DE LA STRATIFICATION ...... 123 3.3.3 EXPRESSION GENIQUE DE L’EPIDERME HUMAIN NORMAL ...... 124

II. RÉSULTATS EXPÉRIMENTAUX ...... 127

The human dermokine gene: description of novel isoforms with different tissue-specific expression and subcellular location...... 129 Eve Toulza, Marie-Florence Galliano, Nathalie Jonca, Hélène Gallinaro, Akemi Ishida- Yamamoto, Guy Serre and Marina Guerrin. J Invest Dermatol 126(2):503-6 (2006)

A novel protease inhibitor of the alpha2-macroglobulin family expressed in the human epidermis...... 137 Marie-Florence Galliano, Eve Toulza, Nathalie Jonca, Akemi Ishida-Yamamoto, Guy Serre and Marina Guerrin. J Biol Chem 281(9):5780-9 (2006)

Large scale identification of genes implicated in epidermal barrier function...... 151 Eve Toulza et al. (manuscrit en préparation)

III. RÉSULTATS COMPLÉMENTAIRES ET DISCUSSION ...... 191

1 LA DERMOKINE ...... 193

2 L’ALPHA 2 MACROGLUBULIN-LIKE 1 (A2ML1)...... 198

3 ANALYSE DU TRANSCRIPTOME DU KERATINOCYTE GRANULEUX ...... 199

3.1 PURIFICATION DES KERATINOCYTES GRANULEUX DE L’EPIDERME HUMAIN ...... 199 3.2 LA TECHNIQUE DES ORESTES ...... 202 3.3 IDENTIFICATION DE NOUVEAUX GENES ...... 207 3.3.1 GENES DE L’EDC ...... 207 3.3.1.1 Gènes de la « fused family »...... 207 3.3.1.2 Gènes des familles LCE et SPRR ...... 208 3.3.1.3 Involucrine, loricrine, et PGRP...... 209 3.3.2 PROSAPOSIN-LIKE 1 (PSAPL1) ...... 209 3.3.3 CLAUDINE 23 (CLDN23) ...... 210 3.3.4 SERINE PROTEASE INHIBITOR A12 (SERPINA12) ...... 211 3.3.5 LOCUS ASSOCIES A DES PATHOLOGIES NON CARACTERISEES ...... 211 3.4 ANALYSE DU TRANSCRIPTOME A L’AIDE DE PUCES A ADN PANGENOMIQUES...... 212 3.5 CONCLUSION GENERALE...... 213

IV. ANNEXES ...... 215

V. BIBLIOGRAPHIE ...... 257

14

I. INTRODUCTION

15

Introduction

La fonction barrière de l’épiderme est assurée par sa partie la plus superficielle, la couche cornée, constituée de cornéocytes, qui correspondent à l'état cellulaire ultime du programme de différenciation terminale kératinocytaire. Ces cellules, très cohésives et entourées d’un milieu extracellulaire riche en lipides, résultent de la cornification, une apoptose particulière. Les éléments constitutifs de ces cellules, ainsi que les enzymes qui régulent leur détachement pour permettre la desquamation, sont principalement synthétisés par les kératinocytes de la couche cellulaire sous-jacente, la couche granuleuse. Ainsi, les kératinocytes granuleux doivent leur nom à leur grande activité de synthèse protéique qui conduit au stockage dans leur cytosol de nombreuses protéines sous forme de grains. Ils sont aussi responsables de la synthèse de nombreux inhibiteurs de protéases et de protéases, sécrétés par les kératinosomes, des vésicules spécialisées qui transportent aussi les lipides responsables de l’étanchéité de la couche cornée. Le kératinocyte granuleux correspond donc non seulement au stade ultime de différenciation épidermique en termes de transcription et de traduction, mais aussi au point culminant de cette activité. Enfin, et de manière attendue, la plupart des génodermatoses déjà caractérisées sont liées à des mutations de gènes exprimés uniquement à ce stade de différenciation. L’épiderme a toutefois fait l’objet de très peu d’études moléculaires systématiques, comme attesté par le petit nombre d’EST présents dans les banques de données. Pour caractériser les gènes activés au cours de la différenciation terminale kératinocytaire, nous avons choisi de travailler à partir de prélèvements humains plutôt que de cellules en culture, et à partir de populations les plus homogènes possibles correspondant à un stade de différenciation particulier, le kératinocyte granuleux, plutôt que d'épiderme entier. L’objectif de cette thèse est donc d’établir un catalogue des gènes exprimés par les kératinocytes granuleux, et d’identifier parmi eux les gènes spécifiques de ces derniers kératinocytes vivants. Ce travail a aussi conduit à la mise en évidence de nouveaux acteurs des étapes les plus tardives de la différenciation épidermique, qui permettront de mieux comprendre les bases moléculaires des processus de cornification et de desquamation. De manière atypique nous avons choisi de présenter la méthodologie, i.e. les techniques d’étude du transcriptome, avant la différenciation épidermique qui constitue la thématique du sujet, pour finir par les données de la littérature concernant l’étude à grande échelle de l’expression génique dans différentes situations physiologiques et pathologiques au cours de la différenciation kératinocytaire. Ce choix a été guidé d’une part par l’essor extraordinaire apporté à la biologie par les méthodes d’analyse à grande échelle, et d’autre part par la nécessité de regrouper les données concernant la différenciation kératinocytaire dans un souci de cohérence du document.

17 Introduction

1 Les méthodes d’étude du transcriptome

1.1 Introduction

Le premier assemblage de la séquence du génome humain a été publié au début de l’année 2001, en parallèle par le consortium public HGP ( Project), et par la société Celera (Lander et al., 2001; Venter et al., 2001). Ce « projet Apollo » de la biologie a permis l’assemblage d’environ 2,91 gigabases d’euchromatine (partie de l’ADN riche en gènes et représentant environ 90% de l’ensemble du génome) pour un total estimé de 30 à 40 000 gènes, alors que les estimations précédentes s’établissaient jusque là aux alentours de 120 000 gènes (Liang et al., 2000). Un pari fût lancé, GeneSweep, et 228 participants misèrent sur une moyenne de 62 598 gènes avec un minimum de 27 462 et un maximum de 200 000. Finalement, le gros lot fut attribué au plus petit parieur (Pennisi, 2003). C’est seulement presque 4 ans plus tard que cet assemblage est considéré comme une séquence définitive d’euchromatine de 2,85 gigabases (International Human Genome Sequencing Consortium, 2004). Cette séquence couvre 99% de l’euchromatine, avec seulement 341 intervalles manquants (gaps) (soit environ 450 fois moins que la version de 2001) et une précision d’environ une erreur toutes les 100 000 bases. De nombreuses erreurs d’assemblage ont été éliminées (inversions de séquences, duplications artefactuelles, incorporation de séquences contaminantes, délétions). Le nombre de gènes codant pour des protéines a encore été revu à la baisse (20 000 à 25 000), un nombre à peine supérieur à celui du génome du nématode Caenorhabditis elegans qui contient 19 à 20 000 gènes (Consortium, 1998; Vaglio et al., 2003). Cette découverte surprenante suggère que ce n’est pas tant le nombre de gènes qui est responsable de la complexité de l’organisme, mais leur régulation. L’épissage alternatif, qui concernerait chez l’homme jusqu’à 80% des gènes (Lee and Wang, 2005), est responsable de nombreuses variations potentielles dans la séquence protéique. De plus, au moins 10% des transcrits résultent de l’usage d’un promoteur 5’ alternatif (Zhang et al., 2004), et 13% utilisent une région 3’ non traduite alternative (Carninci et al., 2005). La mise à disposition des premières séquences pour la communauté scientifique dès 1998, a ouvert le début d’une ère post-génomique rendant désormais possible l’utilisation du transcriptome pour annoter le génome. L’augmentation constante de la quantité et de la

18 Introduction qualité des séquences disponibles a permis l’identification des régions transcrites mais aussi d’éléments régulateurs au sein du génome, notamment grâce à l’apport du séquençage d’autres espèces telles que le chimpanzé, la souris, le rat, le poulet et encore bien d’autres, en permettant la mise en évidence de séquences conservées.

1.2 Techniques d’analyse statique du transcriptome

Les techniques d’analyse du transcriptome d’un échantillon peuvent être regroupées en trois grandes catégories, selon qu’elles permettent une étude statique des gènes exprimés, une comparaison entre deux populations cellulaires ou enfin la détection plus spécifique à haut débit de certaines catégories de gènes. La production de banques d’EST classiques, la technique des ORESTES, ou la technique du SAGE, donnent une vision statique du transcriptome tel qu’il est dans une population cellulaire donnée à l’instant t. Les banques soustractives, le « differential display » (DD), la PCR quantitative en temps réel ou encore les puces à ADN permettent au contraire une analyse dynamique du transcriptome par la comparaison d’échantillons dans différentes conditions (traitement pharmacologique, état de différenciation, tumorigenèse). Enfin, il existe des techniques plus spécifiques comme par exemple l’hybridation in situ à haut débit (HT-ISH) ou le « signal sequence trap » (SST), respectivement dédiées à une analyse spatio-temporelle de l’expression génique et à l’étude des gènes codant pour des protéines potentiellement sécrétées ou du système endomembranaire. Chacune de ces techniques sera détaillée ainsi que ses applications en biologie cutanée, chaque fois que possible.

1.2.1 Les banques d’EST (expressed sequence tags)

1.2.1.1 Principe

C’est la technique d’analyse systématique du transcriptome la plus ancienne. Les EST sont de courtes séquences d’ADNc (quelques centaines de nucléotides), correspondant généralement à une lecture unique de séquenceur, et représentent les gènes exprimés dans une cellule, un tissu, un organisme dans des conditions particulières (Adams et al., 1991). Les ARNm sont convertis en ADNc, clonés dans un vecteur puis séquencés de façon systématique à une de leurs extrémités. Selon que le clonage se fait de façon orientée ou non, et que le séquençage se fait par l’une ou l’autre des extrémités, les EST obtenus correspondent à la partie 5’ ou 3’ de l’ARNm. Les EST 3’ correspondent généralement à la région 3’ non traduite de l’ARNm.

19 Introduction

Cette partie du transcrit qui ferait en moyenne autour de 750 nucléotides chez l’homme (Lander et al., 2001; Pesole et al., 1999), est la moins conservée et permet ainsi une identification univoque du gène correspondant. Les EST 5’ couvrent quant à eux plus fréquemment la région codante. D’une part, la région 5’ non traduite est plus courte (en moyenne 300 pb), et il arrive d’autre part que les ADNc synthétisés avec une amorce oligo(dT) soient incomplets à leur extrémité 5’ en raison de la faible efficacité de la reverse transcriptase et de la présence de structures secondaires au sein de l’ARNm. Ils peuvent ainsi se révéler utiles pour la mise en évidence d’épissages alternatifs ou pour l’alignement de séquences codantes conservées entres espèces différentes.

1.2.1.2 Avantages et inconvénients

La production d’EST permet l’identification des séquences codantes à l’échelle d’un génome et ainsi la découverte de nouveaux gènes. Elle est aujourd’hui plus particulièrement utilisée pour la constitution de banques spécifiques (tissus, stade embryonnaire...). La principale limite de cette technique réside dans son manque de sensibilité pour la détection des ARNm de faible abondance, qui constituent 85 à 95% des transcrits (Bishop et al., 1974). Afin d’éviter le séquençage répétitif des transcrits les plus fréquents, plusieurs méthodes de normalisation ont été mises au point. C’est le cas par exemple des banques soustraites ou de la technique des ORESTES, décrites ci-après.

1.2.1.3 Applications

Mi-2006, la division dbEST de GenBank contenait 36 750 628 séquences d’EST dont 7 741 746 EST humains, espèce la plus largement représentée dans cette banque de données (http://www.ncbi.nlm.nih.gov/dbEST/dbEST_summary.html). Viennent ensuite la souris, avec 4 719 380 séquences, puis le riz, le poisson-zèbre, le xénope et le bœuf avec chacun environ un million d’EST. De nombreuses autres espèces, d’intérêt scientifique, agronomique ou médical y sont aussi diversement représentées. Pour une grande partie de ces espèces, la base de données UniGene du NCBI rassemble les EST chevauchants ou correspondant à un même ARNm dans un « cluster », c'est-à-dire un groupe de séquences correspondant à un gène unique, et indique l’origine tissulaire de chaque EST lorsqu’elle est connue. Tous les EST annotés correspondent à autant de données d’expression : gène correspondant, origine cellulaire ou tissulaire de l’ARNm, stade de différenciation… Plusieurs initiatives de développement de programmes d’analyse virtuelle du transcriptome à partir de ces données ont vu le jour. C’est par exemple le cas de ExQuest (Expressional Quantification of EST) qui

20 Introduction permet d’identifier pour un gène donné le nombre d’EST provenant de chaque tissu ou organe et propose une normalisation de ces profils par rapport au nombre total de séquences (Brown et al., 2004). Il est également possible de visualiser pour un tissu donné la répartition des EST sur une région chromosomique, correspondant à un locus d’intérêt par exemple, sous la forme d’un diagramme.

1.2.2 La technique des ORESTES

1.2.2.1 Principe

La production d’ORESTES (Open Reading Frame EST) repose sur la construction de minibanques d’EST par RT-PCR à faible stringence à l’aide d’amorces choisies de façon arbitraire. Il peut s’agir de n’importe quelle amorce d’une vingtaine de nucléotides, pourvu que sa séquence n’aie d’homologie parfaite avec aucun des transcrits potentiels du tissu étudié : séquence choisie au hasard, séquence génomique non codante (intergénique, intronique ou brin non transcrit), ou séquence correspondant à une espèce différente. Initialement dénommés RAP-EST (RNA arbitrarily primed-EST) (Neto et al., 1997), ces ORESTES correspondent à des séquences distribuées au hasard sur les ARNm et donc susceptibles de correspondre aux régions codantes, d’où leur nom. Après extraction des ARNm de l’échantillon, une transcription inverse est réalisée à une température de 37°C, permettant l’hybridation imparfaite de l’amorce choisie à une sous- population des ces ARNm. La première étape de la PCR qui suit, se fera de même à faible stringence, à 37°C (figure 1). Cette RT-PCR constitue le principe de la normalisation conceptuelle de la méthode : l’hybridation de l’amorce arbitraire ne dépend pas de l’abondance relative des différents ARNm, comme c’est le cas avec des amorces oligo(dT), et favorise ainsi l’amplification des transcrits rares. Les produits d’amplification sont ensuite déposés sur gel et les bandes visibles, correspondant à l’amplification préférentielle d’une molécule donnée, sont éliminées, constituant une étape supplémentaire de normalisation. La construction de nombreuses minibanques d’une centaine de clones avec l’utilisation d’amorces différentes, rend possible l’établissement d’un « catalogue » des gènes exprimés et l’identification de gènes spécifiques du type cellulaire considéré.

21 Introduction

Figure 1 : principe de la technique des ORESTES.

1.2.2.2 Avantages et inconvénients

Le premier avantage de la technique des ORESTES est son principe de normalisation : l’amorce s’hybridera lors de la première étape de transcription inverse à faible stringence (diminution de la température de la réaction à 37°C) avec la même probabilité sur un ARNm abondant ou sur un ARNm rare. L’amplification d’un transcrit donné dépendra donc principalement de sa séquence et non de son abondance. La production de minibanques d’EST avec des amorces différentes ainsi que la purification sur gel a posteriori ajoutent encore à cette normalisation conceptuelle. De fait, une normalisation du nombre de séquences par rapport à l’abondance relative des messagers a été démontrée (Dias Neto et al., 2000). Cette technique permet en outre la production de séquences distribuées statistiquement selon une courbe de Gauss centrée au milieu de la séquence de l’ARNm correspondant, donc en majorité à sa partie codante. Elle est ainsi complémentaire des techniques classiques de séquençage en 5’ et en 3’, pour l’obtention de segments contigus (contigs) d’EST, et pour la mise en évidence d’épissages alternatifs affectant le cadre de lecture et par conséquent la protéine produite (Sakabe et al., 2003). L’amplification des séquences se faisant au hasard parmi toutes les molécules d’ARN disponibles, une attention toute particulière doit être portée à la purification des ARNm poly- adénylés qui ne constituent en fait que 1 à 5% des ARN cellulaires. Une étude par la technique des ORESTES du transcriptome d’ARNm poly-adénylés purifiés à partir de prélèvements de tumeurs mammaires humaines a montré que parmi 10 000 séquences,

22 Introduction environ 10% correspondent toutefois à des contaminations ribosomiques, mitochondriales et bactériennes (Dias Neto et al., 2000).

1.2.2.3 Applications

Dans le but d’identifier de nouveaux gènes du chromosome 22, alors totalement séquencé, un consortium brésilien a utilisé la technique des ORESTES à partir d’échantillons de tumeurs de sein, colon, estomac, tête et cou pour produire plus de 250 000 séquences réparties en 81 429 clusters (de Souza et al., 2000). 1181 clusters d’ORESTES ont été alignés à la séquence du chromosome 22. 219 correspondaient à des gènes encore non identifiés et non annotés sur ce chromosome, avec au moins un intron et un cadre de lecture prédit. Le même groupe a ensuite produit 700 000 séquences humaines, transcrites à partir de 24 tissus humains, contribuant à l’annotation du génome (Camargo et al., 2001). Ce type de séquences représente aujourd’hui environ 1 million parmi 7 millions d’EST disponibles dans la banque de données GenBank. Plus de 50 000 ORESTES ont aussi été produits à partir de cellules d’épithélium mammaire normal (21 437 séquences) ou tumoral (37 890 séquences) et comparés (Leerkes et al., 2002). Ces données, couplées à l’analyse des séquences présentes dans les base de données SAGE et UniGene, ont permis de mettre en évidence 11 gènes hypothétiques potentiellement surexprimés dans ces tumeurs. Des analyses en PCR semi-quantitative ont confirmé la surexpression pour 9 d’entre eux. Plus récemment, cette méthode a été utilisée pour l’étude du transcriptome de l’abeille (Nunes et al., 2004) et de la glande mammaire de la vache (da Mota et al., 2004) et a ainsi permis de produire respectivement 15 500 ORESTES (3408 clusters) et 6481 ORESTES (1798 clusters).

1.3 Techniques d’analyse dynamique du transcriptome

1.3.1 Banques soustraites et hybridation soustractive suppressive

1.3.1.1 Principe

1.3.1.1.1 Les banques soustraites

Cette technique repose sur l’hybridation d’un mélange de deux populations d’ADNc où seules les séquences non appariées seront clonées et séquencées (Duguid et al., 1988). La banque produite est ainsi enrichie en ADNc spécifiques de l’un ou l’autre des deux échantillons selon le sens de l’hybridation. Si nécessaire, plusieurs cycles successifs de soustraction peuvent être réalisés (figure 2).

23 Introduction

Figure 2 : principe des banques soustraites.

1.3.1.1.2 Hybridation soustractive suppressive (SSH)

Les évolutions techniques apportées par cette méthode permettent d’amplifier directement les ADNc différentiellement exprimés (Diatchenko et al., 1996), et donc de travailler avec de moindres quantités d’ARN pour aboutir à un enrichissement jusqu’à 1000 fois en ADNc spécifiques. Les ADNc produits à partir de l’échantillon à analyser (« tester ») sont séparées en 2 lots, ligués à 2 adaptateurs différents. L’ADNc utilisé pour la soustraction (« driver ») est ajouté en excès (environ 100 fois) à chacun des 2 lots. Seuls les hybrides comportant les séquences adaptatrices, utilisées comme amorces pour la PCR qui suit, seront amplifiés de façon exponentielle. Il s’agit des hybrides « tester-tester ». Les 2 lots alors mélangés. Seuls les hybrides asymétriques flanqués par des adaptateurs différents seront amplifiés par la seconde étape de PCR suppressive (figure 3).

1.3.1.2 Avantages et inconvénients

La fabrication des banques soustraites a été le premier moyen de normalisation pour la production d’EST. Cette technique a permis une amélioration considérable du rendement de

24 Introduction la production d’EST en termes de ratio du nombre de clones séquencés par rapport au nombre de gènes identifiés. L’inconvénient principal de cette technique est qu’elle ne permet pas l’analyse simultanée des gènes surexprimés et sous-exprimés dans un échantillon par rapport à l’autre. Il est donc nécessaire de faire les deux soustractions réciproques.

Figure 3 : principe de l’hybridation soustractive suppressive.

25 Introduction

1.3.1.3 Applications

Des ADNc préparés à partir d’épiderme d’embryons de rat de 14 jours ont été soustraits à des ADNc d’embryons de 17 jours afin de mettre en évidence des gènes spécifiques de la stratification de l’épiderme (Oomizu et al., 2000). Cette étude a permis l’identification de Kdap (keratinocyte differentiation-associated protein) dans cette espèce. Ce gène a été identifié chez l’homme par SST (Signal Sequence Trap, cf. paragraphe 1.4.2) (Tsuchida et al., 2004). La production d’une banque soustractive suppressive à partir d’ADNc de kératinocytes basaux ou suprabasaux d’épiderme de souris a conduit à l’identification de 2 nouveaux gènes de la différenciation : la suprabasine (Park et al., 2002) et Scarf (skin calmodulin-related factor) (Hwang and Morasso, 2003).

1.3.2 Le differential display

1.3.2.1 Principe

Cette technique, qui s’appuie sur l’amplification systématique de la partie 3’ des ARNm, permet d’identifier des changements d’expression de gènes impliqués dans divers processus biologiques (Liang et al., 1993; Liang and Pardee, 1992). Les ADNc sont produits avec une amorce oligo(dT) comportant une « séquence d’ancrage » d’un ou deux nucléotides en 3’ (3 ou 12 amorces différentes, respectivement). L’amplification par PCR est réalisée avec cette même amorce « antisens » en combinaison avec une amorce « sens » arbitraire (série de différents oligonucléotides dégénérés). Les produits obtenus pour chaque combinaison sont marqués puis séparés par électrophorèse sur gel d’acrylamide dénaturant. La visualisation des profils permet de repérer les fragments d’intérêt correspondant à des gènes différentiellement exprimés entre 2 échantillons. Ces fragments sont extraits du gel puis séquencés.

1.3.2.2 Avantages et inconvénients

Cette méthode peut-être mise en œuvre avec de faibles quantités d’ARN. Sa sensibilité permet la détection de variations d’expression à partir de 1,5 fois. Elle manque néanmoins de sensibilité et introduit de ce fait un biais important en faveur des ARNm les plus abondants (Bertioli et al., 1995). Plusieurs expérimentations indépendantes doivent être menées en parallèle afin de diminuer le nombre excessif de faux positifs. Enfin, cette technique ne permet pas la comparaison de conditions radicalement différentes qui génèrent des profils d’amplification trop éloignés.

26 Introduction

1.3.2.3 Applications

L’expression génique de carcinomes épidermoïdes de l’hypopharynx a été comparée à celle du tissu sain par la technique du differential display (Carles et al., 2006). Après analyse de 98 échantillons de patients, 820 gènes différentiellement exprimés ont été repérés (432 surexprimés dans la tumeur par rapport au tissu sain, 349 sous-exprimés, et 39 montrant en profil différent selon les échantillons). Ces résultats ont été confirmés par fabrication de macroarrays sur filtres de nylon. Trois gènes codant pour de nouvelles protéines hypothétiques et pouvant constituer des cibles thérapeutiques potentielles ont été sélectionnés, TMEM16A, qui code pour une protéine transmembranaire, ARHGAP21, un nouveau membre des Rho-GAP, et PHLDB2, contenant un domaine de liaison à l’IP3 (Inositol tri-phosphate). Ces travaux constituent une application à haut débit de la technique du differential display et illustrent son intérêt quant à la découverte de nouveaux gènes. Cette méthode a aussi été utilisée pour rechercher des gènes spécifiquement exprimés lors la mise en place d’un épiderme pluristratifié au cours du développement embryonnaire de la souris. L’ADNc codant pour l’hornerine (cf. chapitre 2.2.2.6 concernant l’EDC) a été cloné ainsi (Makino et al., 2001). Une autre étude a cherché à mettre en évidence les effets du « gaz moutarde » (bis (2-chloroethyl) sulfide) sur le transcriptome des kératinocytes de l’épiderme humain afin de mieux comprendre la formation de bulles épidermiques provoquée par cet agent cytotoxique (Platteborze, 2003). Ce travail a permis le repérage de 32 gènes surexprimés et 28 gènes sous-exprimés dans des kératinocytes primaires cultivés en monocouche après 4h d’exposition. Les auteurs ont montré en particulier la surexpression de gènes impliqués dans la réparation de l’ADN et l’arrêt du cycle cellulaire tels que GADD45 (Growth Arrest and DNA Damage-inducible). D’autre part, une diminution importante de la transcription de KRT14 a été observée ce qui pourrait, selon les auteurs, expliquer la formation de bulles épidermiques. Enfin, le gène codant pour une nouvelle protéine riche en proline spécifique de la couche granuleuse de l’épiderme, KPRP (Keratinocyte Proline-Rich Protein), a été identifié chez le rat par la technique du differential display au cours du développement embryonnaire de la peau (cf. chapitre 2.2.2.6 concernant l’EDC) (Kong et al., 2003).

27 Introduction

1.3.3 La technique du SAGE

1.3.3.1 Principe

La technique du SAGE (Serial Analysis of Gene Expression) permet l’analyse à haut débit de l’ensemble des ARNm d’un échantillon représentés chacun par une courte séquence de 10 nucléotides (Velculescu et al., 1995). Les ADNc sont produits avec une amorce oligo(dT) couplée à la biotine, fixés à des billes de streptavidine puis digérés par une endonucléase de restriction (« enzyme d’ancrage ») reconnaissant une séquence de 4 nucléotides (classiquement NlaIII ou Sau3A). Statistiquement, ces enzymes coupent en moyenne toutes les 256 paires de bases. Les fragments obtenus (situés dans la partie 3’ de l’ARNm) sont divisés en 2 lots, liés à des adaptateurs différents, contenant un site de reconnaissance pour une endonucléase (« enzyme d’étiquetage ») qui coupe environ 10 nucléotides en 3’ dans le fragment d’ADNc (BsmF1). Les 2 types d’étiquettes sont ensuite assemblés puis amplifiées par PCR (obtention de « ditags »). Les « ditags » sont finalement libérés des séquences adaptatrices par l’endonucléase de départ (NlaIII ou Sau3A), concaténés, clonés puis séquencés (figure 4).

1.3.3.2 Avantages et inconvénients Cette méthode à haut débit permet en théorie une quantification absolue de l’ensemble des transcrits, leur niveau d’expression étant directement corrélé avec la fréquence de la séquence SAGE correspondante. Les données obtenues peuvent être facilement utilisées pour des comparaisons multiples entre échantillons. La limite principale de cette technique réside dans le fait que beaucoup de séquences SAGE n’ont pas de correspondance dans les bases de données et pourraient représenter des gènes encore non identifiés ou de nouveaux épissages alternatifs. L’autre difficulté est que plusieurs ARNm différents peuvent partager la même séquence SAGE. De la même manière, un gène peut comporter plusieurs séquences SAGE différentes (dues par exemple à des signaux de poly-adénylation alternatifs). L’ARNm doit en outre obligatoirement comporter au moins un site de restriction pour l’« enzyme d’ancrage ». Il a été montré que les séquences riches en GC peuvent affecter l’analyse (Margulies et al., 2001). Enfin, la moindre erreur de séquençage ou des polymorphismes peuvent fausser l’identification de l’ARNm correspondant. Plus de 8.6% des gènes humains présenteraient au moins une étiquette SAGE alternative correspondant à un polymorphisme nucléotidique (Silva et al., 2004).

28 Introduction

Figure 4 : principe de la technique SAGE. Une amélioration de cette technique a été apportée par l’utilisation de l’« enzyme d’étiquetage » MmeI, qui coupe environ 17 nucléotides après son site de reconnaissance (LongSAGE). Néanmoins, seulement 75% des séquences sont réellement identifiées par cette méthode (Saha et al., 2002). Enfin, une dernière mise au point de la technique avec

29 Introduction l’utilisation de l’ « enzyme d’étiquetage » EcoP15l a été décrite sous le nom de SuperSAGE (Matsumura et al., 2003). Elle permet d’obtenir des séquences de 26 nucléotides.

1.3.3.3 Conversion en EST 3’

Afin de contourner le problème d’identification posé par les séquences courtes, une technique de conversion en EST 3’, GLGI (Generation of Longer cDNA fragments from SAGE tags for Gene Identification), a été développée (Chen et al., 2000). Il s’agit de séquencer la partie située en 3’ de la séquence SAGE afin d’identifier le transcrit correspondant sans ambiguïté. Une amorce sens contenant la séquence SAGE et une amorce oligo(dT) antisens sont utilisées en PCR pour générer des fragments d’environ 200 à 500 paires de bases en moyenne (figure 4). Cette méthode d’extension compromet néanmoins le caractère à haut débit de la technique SAGE initiale.

1.3.3.4 Applications

La première étude partielle du transcriptome de l'épiderme entier ex vivo a été réalisée par la méthode du SAGE classique (van Ruissen et al., 2002b). L’épiderme entier est obtenu par clivage du derme à la dispase. A partir d’environ 3 millions de cellules, 15 131 étiquettes SAGE, dont 7645 uniques, ont été collectées et comparées aux bases de données. Les transcrits correspondant à 1100 étiquettes n’ont pu être identifiés et pourraient en partie correspondre à de nouveaux gènes. Parmi les 20 étiquettes les plus représentées, 6 n’ont pu être identifiées et 10 correspondent à des protéines ribosomiques. La galectine 7, une lectine épidermique, et le gène hypothétique KIAA0375, identifié depuis comme codant pour RUSC2 (RUN and SH3 domain containing 2, ou Iporine, un partenaire de Rab1 exprimé de façon ubiquiste), font partie des gènes les plus fortement détectés (Bayer et al., 2005). Enfin, seulement 2 étiquettes correspondent à des gènes tardifs de la différenciation épidermique, KRT10 et KDAP (Keratinocyte Differentiation Associated Protein).

1.3.4 La PCR quantitative en temps réel

1.3.4.1 Principe

La RT-PCR est de loin la méthode la plus sensible, du fait qu’elle correspond à l’amplification exponentielle d’une séquence à l’aide d’un couple d’amorces spécifiques. Dans les techniques de PCR quantitative en temps réel, la synthèse d’ADN est mesurée au cours de chacun des cycles par le suivi de la fluorescence émise et permet d’obtenir une

30 Introduction courbe étalon utilisée pour calculer la quantité initiale de matrice, et ce parmi une large gamme de concentrations recouvrant plusieurs ordres de magnitude. A partir de cette courbe, il est ensuite possible d’extrapoler la quantité relative de cible de départ dans les échantillons analysés. Deux grands types de chimie sont utilisés. Les chimies « Taqman », « Lightcycler » (Roche) et « molecular beacons » (www.molecular-beacons.org) utilisent des sondes spécifiques marquées. Le « SYBR green I » (Molecular Probes) est quant à lui un intercalant non spécifique de l’ADN double brin. Les 2 modes de quantification généralement utilisés (indifféremment pour l’un ou l’autre type de chimie) sont la méthode des courbes standard et la méthode de comparaison des Ct (voir plus loin) (Rutledge and Cote, 2003), (Applied User Bulletin).

1.3.4.2 Les différents types de chimie (figure 5)

Figure 5 : les différents types de chimie utilisés en PCR quantitative en temps réel.

1.3.4.2.1 Sondes spécifiques

La chimie Taqman (Heid et al., 1996) permet d’obtenir un signal fluorescent grâce à l’utilisation d’une sonde d’hydrolyse spécifique d’une région interne du fragment amplifié. Elle est marquée en 5’ par un fluorophore rapporteur et en 3’ par un fluorophore extincteur.

31 Introduction

La fluorescence du rapporteur est éteinte par la proximité de l’extincteur émettant dans un spectre chevauchant. Pendant la polymérisation, la sonde est dégradée par l’activité 5’-3’ exonucléase de la polymérase ce qui permet de mesurer la fluorescence du fluorophore rapporteur. Le nombre de copies synthétisées peut être par conséquent corrélé à la fluorescence émise. L’analyse simultanée de plusieurs fluorophores émettant dans des longueurs d’ondes différentes rend possibles des PCR « en multiplex » avec jusqu’à 4 sondes différentes par réaction. La chimie « Molecular Beacons » est basée sur l’utilisation de sondes d’hybridation oligonucléotidiques composées d’une structure tige-boucle (Tyagi and Kramer, 1996). La boucle, qui contient la séquence complémentaire de la cible à détecter, est encadrée de 2 séquences complémentaires dont les extrémités sont liées à un fluorophore d’un côté, et à un extincteur de l’autre côté. En présence de la cible, l’hybride sonde-cible, plus stable que la structure tige-boucle, permet de restaurer la fluorescence. L’utilisation de différents fluorophores permet là aussi des analyses « en multiplex ». Un seul mésappariement entre la séquence sonde et la cible diminue la stabilité de l’hybride par rapport à la structure tige- boucle formée par la sonde seule. Il n’y alors pas d’émission de fluorescence. Cette très grande spécificité de la chimie « molecular beacons » permet son utilisation pour la détection de mutations (génotypage). Le système Lightcycler s’appuie sur l’utilisation de deux sondes d’hybridation oligonucléotidiques qui s’hybrident côte à côte sur leur cible (Wittwer et al., 1997a; Wittwer et al., 1997b). La première sonde est marquée en 3’ par la fluorescéine, le fluorophore « donneur », et la seconde est marquée en 5’ par un autre fluorophore « accepteur ». Celui-ci n’est capable de fluorescer que lorsqu’il est excité par la fluorescéine voisine par transfert d’énergie (FRET), c'est-à-dire lorsque les 2 sondes sont hybridées avec leur cible. La mesure de fluorescence s’effectue à la longueur d’onde émise par le fluorophore accepteur. Là encore, des fluorophores différents permettent des analyses en multiplex.

1.3.4.2.2 Le SYBR Green, un intercalant non spécifique

Le SYBR Green est un agent intercalant qui ne devient fluorescent que lorsqu’il se lie à l’ADN double brin (sillon mineur), ce qui rend possible son utilisation pour le suivi de l’amplification par PCR en temps réel (Morrison et al., 1998). La fluorescence émise au cours de chacun des cycles est directement proportionnelle à la quantité d’ADN double brin produit. Plus facile d’emploi et beaucoup moins coûteuse que la chimie Taqman, cette méthode ne nécessite pas le choix d’une sonde. Elle est par contre moins spécifique, car la fluorescence

32 Introduction mesurée peut provenir en partie d’un produit d’amplification parasite, ou de la formation de dimères d’amorces. Il convient donc de vérifier que le fragment amplifié est unique. Après dénaturation à 96°C, la fluorescence émise lors de la renaturation est reportée sur une courbe en fonction de la température (courbe de dissociation). Un pic apparaît correspondant au Tm (température d’hybridation) des 2 brins du fragment amplifié. Si ce fragment est unique, on observe un seul pic de fluorescence (Wittwer et al., 1997a).

1.3.4.3 Amplification théorique et principe du Ct

L’augmentation de la quantité d’ADN se décompose en 2 phases. La première, exponentielle, n correspond à l’équation Nn = N0 X (1+E) où N est le nombre de molécules d’ADN au cycle n, N0 le nombre de molécules d’ADN de départ, et E le coefficient d’efficacité de la PCR compris entre 0 et 1. Ce coefficient E dépend de nombreux paramètres comme le tampon de réaction, la température d’hybridation, le temps d’élongation ou le choix des amorces. En outre, il varie considérablement au cours de la réaction à cause de la baisse d’activité de la polymérase, de l’accumulation de pyrophosphates et de la consommation de réactifs. Sa valeur tend vers 0 jusqu’à aboutir à la formation d’un plateau. C’est la seconde phase de la PCR, qui correspond à un ralentissement puis un arrêt de l’amplification. Cette phase, difficilement reproductible, n’est pas modélisable. La mesure est donc effectuée sur la partie détectable de la phase exponentielle. En théorie, si E = 1, alors on peut calculer à partir de la pente de la courbe la valeur N0 du nombre de molécules d’ADN de départ. En pratique, l’efficacité de la réaction n’est jamais de 100% et il faut donc inclure à chaque expérience un échantillon standard de concentration connue. L’alternative possible est d’utiliser les résultats uniquement pour comparer plusieurs échantillons entre eux sans passer par le nombre de copies initiales. Dans ce cas, la quantité d’ADNc totale présente au début de la réaction pour un gène donné dans chaque échantillon doit être normalisée par rapport à un gène constitutif de référence. Pour accéder à la quantification relative du nombre initial de copies de l’ADNc, on définit un seuil de fluorescence pour lequel la courbe d’amplification entre dans sa phase exponentielle et dépasse le bruit de fond des premiers cycles (typiquement 10 fois plus élevée que la fluorescence basale moyenne). Ce seuil est dénommé Ct (threshold cycle) car il correspond au nombre de cycles de PCR nécessaires pour atteindre ce niveau de fluorescence. Lorsqu’on compare le niveau d’expression d’un gène entre 2 échantillons il est impératif de normaliser la quantité d’ADNc par rapport à une courbe standard pour ce gène ou par rapport à un gène de référence exprimé au même taux dans les 2 conditions.

33 Introduction

1.3.4.4 Les méthodes de quantification

1.3.4.4.1 Définition des termes utilisés

Standard : échantillon de concentration connue. Référence : signal utilisé pour la normalisation des résultats expérimentaux – Référence active : le signal est généré par amplification PCR d’un ADN présent dans chaque échantillon utilisé pour la normalisation par rapport à la quantité totale d’ARN (contrôle endogène : ADNc produit à partir d’un ARN exprimé de façon équivalente dans tous les échantillons analysés). L’ajout d’un ADN de concentration connue à chaque échantillon permet une normalisation par rapport à l’efficacité de la RT-PCR (contrôle exogène). – Référence passive : Colorant permettant la normalisation par rapport aux fluctuations de fluorescence indépendantes de l’amplification PCR. Il s’agit la plupart du temps de la molécule ROX. Calibrateur : échantillon utilisé pour la comparaison des résultats.

1.3.4.4.2 Quantification dite absolue : méthode des courbes standard

Plusieurs dilutions en série d’un standard permettent d’obtenir une courbe de quantification linéaire log (N0) = f (Ct), dite courbe standard. Le report du Ct pour un échantillon donné sur cette droite permet d’accéder directement à la quantification du nombre de molécules de départ. Il est impératif que le standard soit constitué de molécules identiques sans contaminations par d’autres acides nucléiques, stables dans le temps. Une quantification relative est aussi en théorie possible à partir de dilutions en série de l’échantillon calibrateur. Dans ce cas, il faut construire deux courbes standard, pour le gène à analyser et pour un gène de référence. La méthode de comparaison de Ct, beaucoup plus largement utilisée, est une alternative simple et économique.

1.3.4.4.3 Quantification relative par la méthode de comparaison de Ct

Une quantification relative est possible lorsqu’on utilise par exemple un lot unique d’ARN ou d’ADN comme calibrateur. Cette méthode nécessite un pipetage précis pour les dilutions de l’échantillon. Elle se base sur la comparaison directe de 2 populations d’ARNm après normalisation par rapport à un gène de référence dont l’expression ne varie pas entre les échantillons (Livak and Schmittgen, 2001). Classiquement, l’actine, GAPDH ou encore l’ARN ribosomique 18S sont utilisés. Les valeurs de Ct de chaque échantillon (a et b) pour le

34 Introduction gène à analyser (X) et le gène de référence (ref) sont soustraites (ΔCt), et le ratio d’expression du gène étudié est donné par la formule : ΔΔCt 2 avec ΔΔCt = [(Ct X – Ct ref)a – (Ct X – Ct ref)b] L’inconvénient principal de cette méthode de quantification est qu’elle considère que le coefficient d’efficacité de la PCR E est le même entre les 2 gènes considérés, ce qui peut introduire un biais dans le calcul du ratio.

1.3.4.5 Avantages et inconvénients de la PCR quantitative en temps réel

Cette technique est très sensible et permet une analyse rapide (environ 2h de réaction) d’un grand nombre d’échantillons simultanément tout en s’affranchissant des manipulations post- PCR. L’utilisation de sondes spécifiques permet des analyses en multiplex. Néanmoins, l’utilisation de sondes marquées reste coûteuse, et la chimie non spécifique (SYBR green), plus économique, présente une moins bonne spécificité et ne permet pas d’analyse en multiplex. Une quantification par la méthode des courbes standard nécessite la présence sur la plaque, pour chaque gène testé, de plusieurs dilutions en série de l’échantillon, occupant finalement un espace considérable sur une plaque 96 puits. Lorsque plusieurs gènes différents doivent être analysés, la quantification relative permet d’optimiser le nombre d’échantillons par plaque. Ainsi, ce sont souvent un petit nombre de gènes qui sont analysés par cette technique. Le choix du ou des gènes de référence est notamment d’une importance capitale. Il a été montré par exemple que l’expression de la GAPDH, gène « de ménage » communément utilisé pour la normalisation, varie au cours de la différenciation épidermique ainsi que dans différents états pathologiques comme le psoriasis ou sous l’exposition aux UVB (Wu and Rees, 2000). Dans différents types de lymphocytes, les niveaux d’expression de GAPDH et de β-actine varient alors que l’utilisation de l’ARN ribosomique 18S permet une normalisation correcte (Bas et al., 2004). Néanmoins, l’utilisation des ARN ribosomiques pour la normalisation du niveau d’expression d’un ARNm pose le problème de leur niveau d’expression par rapport à celui des ARNm. Leur amplification se fait beaucoup plus rapidement et nécessite de les utiliser à une dilution différente de celle utilisée pour les gènes à normaliser. Une dizaine de gènes pour la normalisation de résultats de PCR quantitative en temps réel ont été testés sur différents tissus tumoraux humains, aucun ne constituant à lui seul un bon contrôle interne (Tricarico et al., 2002). Il a été proposé que l’utilisation simultanée de plusieurs gènes de contrôle constitue un facteur de normalisation (Vandesompele et al., 2002).

35 Introduction

Cette étude s’appuie sur l’utilisation de 10 gènes de ménage (ACTB, B2M, GAPD, HMBS, HPRT1, RPL13A, SDHA, TBP, UBC et YWHAZ) pour établir un facteur de normalisation correspondant à la moyenne géométrique de plusieurs d’entre eux. Pour chacun des gènes témoins testés, la variation de leur expression est calculée par rapport à celle de chacun des autres gènes témoins. Cette variation reflète le fait que l’un des gènes n’est pas exprimé de façon constante. La moyenne de ces ratios constitue le facteur M. Les gènes dont la valeur de ce facteur est la plus petite sont ceux dont l’expression est la plus stable. Les différents gènes choisis l’ont été dans des voies métaboliques différentes afin d’éviter un biais dû à une corégulation de certains de ces gènes. Une application Visual Basic (geNorm, http://medgen.ugent.be/~jvdesomp/genorm/) développée par ces auteurs est accessible à la communauté scientifique pour un calcul automatisé de ce facteur de normalisation M.

1.3.4.6 Applications

La PCR quantitative en temps réel couvre un très large champ d’applications pour la quantification absolue ou relative de molécules d’ADN ou d’ARN ainsi que pour le génotypage. De nombreux exemples peuvent être cités : quantification de la charge virale (Lin et al., 2004), expression génique, titrage de germes et contaminants (agronomie, sang, fluides, tissus), discrimination allélique, analyse SNP, amplification ou délétion génique, diagnostic tumeurs (Rambaldi et al., 2005), quantification du nombre de copies d’un transgène... Elle est en outre devenue la technique de choix pour la validation des résultats obtenus avec les puces à ADN.

1.3.5 Les puces à ADN

1.3.5.1 Principe

Cette technique permet la mesure simultanée du niveau d'expression de plusieurs milliers de gènes voire d'un génome entier (figure 6). A l’inverse des techniques habituelles d’hybridation (e.g. northern blotting), les sondes (correspondant aux différents gènes testés) sont immobilisées sur le support tandis que les cibles (ensemble des ARNm de l’échantillon analysé) sont marquées (Schena et al., 1995). L’évolution et la miniaturisation des technologies de fabrication permettent le dépôt de plusieurs dizaines de milliers de sondes différentes sur un même support (filtre de nylon ou lame de verre). Le terme de filtre est réservé à l’usage de supports tels que le nylon, alors que le terme de puce correspond aux supports imperméables comme le verre ou la silice. Plusieurs types de sondes peuvent être

36 Introduction utilisées : ADN génomique, plasmides, produits de PCR, BACs, oligonucléotides courts (20 à 25 paires de bases), oligonucléotides longs (70 paires de bases). Ces molécules sont soit déposées sur le support (robots à aiguilles, technologie jet d’encre), soit synthétisées in situ sur lame par photolithographie pour les oligonucléotides courts (puces à haute densité). Le marquage des cibles s’effectue classiquement lors de la transcription inverse des ARNm en ADNc, directement ou par amplification et synthèse d’ARNc, par incorporation de nucléotides radioactifs, biotinylés ou encore couplés à une molécule fluorescente telle que les cyanines Cy3 ou Cy5. Le marquage Cy3/Cy5 de 2 échantillons différents cohybridés sur lame de verre permet une analyse comparative du niveau d’expression de chaque gène. Lorsque la quantité d’ARN total disponible est trop faible (10 µg environ sont nécessaires pour un marquage fluorescent), l’ajout de séquences pour la polymérase T7 permet une amplification des ARN par transcription in vitro (ARNc).

Figure 6 : principe des puces à ADN (Lockhart and Winzeler, 2000). a : puce à oligonucléotides synthétisés in situ (type Affymetrix) ; b : puce à produits de PCR c : méthodes de marquage, par synthèse d’ADNc, après amplification ou directement à partir d’ARN ; d : stratégie de cohybridation avec des ADNc marqués à la cyanine 3 ou à la cyanine 5

37 Introduction

1.3.5.2 Analyse des données

L’étape limitante dans l’utilisation des puces à ADN est aujourd’hui l’analyse et l’interprétation des données générées. Un numéro hors série de la revue traite en grande partie de ces questions (Nature Genetics, December 2002, Volume 32 No 4s). L’objectif premier est la comparaison du niveau d’expression génique entre échantillons. Les intensités mesurées pour un gène donné entre différentes conditions permettent de générer un ratio d’expression. Une première étape consiste à vérifier « visuellement » l’image acquise par le capteur à l’aide de logiciels tels que GenePix afin d’éliminer de l’analyse des dépôts défectueux ou des anomalies localisées (particule de poussière par exemple). Le fichier graphique est alors converti en valeurs d’intensités. Les données sont nettoyées (intensités de fluorescence saturées et écart vis-à-vis du bruit de fond trop faible) et transformées en valeurs logarithmiques (le plus souvent logarithme base 2). Après soustraction du bruit de fond, l’étape de normalisation permet de moduler le ratio par rapport à la quantité de matériel de départ et à l’efficacité de marquage. Plusieurs méthodes de normalisation sont envisageables. La première possibilité est de normaliser par rapport à l’intensité moyenne de fluorescence de chaque canal (vert ou rouge) pour une même lame (facteur de normalisation). Cette méthode suppose que les cellules comparées ont un contenu en ARNm comparable en terme de quantité. La seconde méthode est basée sur le choix d’un ensemble de gènes de ménage (contrôle interne), en faisant l’hypothèse que leur expression ne varie pas entre les différents échantillons. Enfin, la normalisation selon la méthode de Lowess (LOcally WEighted Scatterplot Smoothing) utilise une courbe de régression locale pour normaliser les ratios en corrigeant certains biais liés au niveau d’intensité des signaux, mais requiert d’avoir une majorité de gènes non régulés présents sur la puce. La normalisation des données terminée, l’analyse statistique devra déterminer quels sont les gènes significativement exprimés de manière différentielle entre les conditions expérimentales par un test d’hypothèse. Plusieurs répétitions pour chaque condition expérimentale permettent de calculer un ratio moyen et une variance (dispersion des valeurs). Les données sont comparées avec celles attendues pour un gène non régulé, et une p-value est calculée, qui décrit la probabilité d’obtenir par hasard les valeurs mesurées. Une p-value inférieure à 0,05 indique qu’il y a moins de 5 chances sur 100 d’obtenir ces valeurs si en réalité l’expression du gène ne variait pas entre les échantillons comparés (ratio = 1).

38 Introduction

Enfin, une série d’expériences de puces à ADN permet l’analyse de profils d’expression communs à plusieurs gènes. Ils constituent alors de potentiels candidats pour une régulation par les mêmes facteurs ou pour intervenir dans les mêmes processus biologiques. Tous les gènes sont alors triés en fonction de leur profil d’expression. La méthode courante est le regroupement hiérarchique avec une représentation graphique mise au point par Mike Eisen (« Eisengramme ») (Eisen et al., 1998). On parle dans ce cas d’analyse non supervisée. Réciproquement, une série d’échantillons différents peut être classée en fonction de phénotypes distincts et parfaitement définis (classification de tumeurs par exemple) dans le but de définir une signature commune à chaque groupe. Il s’agit alors d’une analyse supervisée.

1.3.5.3 Avantages et inconvénients

La méthode des puces à ADN constitue une méthode à haut débit pour l’analyse simultanée de plusieurs milliers de gènes dans plusieurs échantillons tout en ne nécessitant pas de séquençage à grande échelle. La standardisation des protocoles et la mise en place de plateformes dédiées ont amélioré la reproductibilité technique de ce type d’expériences. Enfin, la miniaturisation et l’amplification des ARNm permettent l’utilisation de très faibles quantités de matériel, de l’ordre de quelques nanogrammes. Ainsi, une amplification à l’échelle de quelques cellules isolées a été utilisée pour l’étude du transcriptome dans des cellules de blastocyste de souris à 3,5 jours par comparaison de l’expression génique dans l’endoderme primaire et dans l’épiblaste (Kurimoto et al., 2006). Plusieurs études se sont attachées à définir le seuil de sensibilité de la technique des puces à ADN. Par exemple, des puces à oligonucléotides (50 bases) et des puces à produits de PCR (300-400 pb) ont été comparées en utilisant pour cible des transcrits synthétisés in vitro et de l’ARN extrait de foie de rat (Kane et al., 2000). Les résultats montrent qu’avec les deux types

39 Introduction de puces, la sensibilité est de l’ordre d’une dizaine de copies par cellule. Cette limite est à comparer à celle de la PCR quantitative, où moins de 10 copies du transcrit peuvent être détectées à partir d’une cellule isolée (Peixoto et al., 2004). Enfin, les ratios obtenus avec cette technique sont sous-estimés lorsqu’on les compare à ceux obtenus en PCR quantitative en temps réel (Yuen et al., 2002). Cependant, les données générées par les différents types de puces et de plateformes d’analyse sont très hétérogènes et difficilement comparables entre elles. La mise à disposition des données du transcriptome dans les banques de données publiques est devenu un prérequis à toute publication des résultats qui en sont issus. Plusieurs banques de données dédiées aux résultats de puces à ADN ont été mises en place : le NCBI (National Center for Biotechnology Information) a créé la plateforme GEO (Gene Expression Omnibus), dédiée à la collecte des données d’expression générées à partir de techniques à haut débit comme les puces à ADN mais aussi les étiquettes SAGE ou les analyses en spectrométrie de masse.

1.3.5.4 Applications

Les études de transcriptome par la technique des puces à ADN ont connu un réel essor ces dernières années. Elles peuvent concerner l’identification de gènes dont l’expression varie en réponse à une modification de l’environnement, après inactivation d’une voie de régulation, au cours du développement ou au contraire cibler la recherche de profils d’expression communs aux même circuits de régulation, ou associés à un type de tumeur et à son pronostic, ou encore établir des liens phylogéniques entre espèces. A titre d’exemple, la compagnie Affymetrix propose des dizaines de puces différentes, ciblant les extrémités 3’ des transcrits, chacun des exons ou la totalité du génome, et concernant les espèces d’intérêt scientifique, agronomique ou médical, homme, souris, rat, nématode, xénope, porc, bœuf, arabette, riz, maïs, canne à sucre, levure, plasmodium, bactéries pathogènes… Une requête pubmed avec le mot clé « microarrays » pour l’année 2000 donne 219 résultats ; pour les 6 premiers mois de 2006 il y a déjà 970 articles parus avec cette technique. Une des premières études chez l’homme réalisée à l’aide de puces à ADN sur lames de verre concerne la classification de leucémies aiguës (Golub et al., 1999). Dans ces travaux, des puces haute densité Affymetrix à oligonucléotides capables de sonder 6817 gènes ont été utilisées. 27 échantillons de moelle osseuse provenant de patients atteints de leucémie aiguë lymphoïde et 11 de leucémie aiguë myéloïde ont été comparés et classifiés selon leur profil d’expression. Un ensemble de 50 gènes les plus fortement corrélés avec le type de leucémie

40 Introduction ont été identifiés et utilisés pour classer 34 nouveaux échantillons. Parmi eux, 29 ont pu être caractérisés grâce à leur profil d’expression avec une exactitude de 100%. Ce type d’analyse pourrait permettre d’améliorer le pronostic et l’adéquation du traitement des tumeurs. Des puces à haute densité Affymetrix ont été utilisées pour analyser l’expression de 23 000 gènes dans des biopsies cutanées de 17 patients atteints de dermatite atopique et 10 individus sains (Sugiura et al., 2005). Cette étude montre une diminution de l’expression de gènes de la différenciation épidermique, en particulier situés dans l’EDC (cf. chapitre 2.2.2.6) en 1q21, un des loci de susceptibilité à la dermatite atopique.

1.4 Techniques spécifiques

1.4.1 Hybridation in situ à haut débit (HT-ISH)

1.4.1.1 Principe

L’hybridation in situ à haut débit permet de visualiser la localisation spatio-temporelle de l’expression d’un ensemble de gènes. Les sondes peuvent être issues par exemple d’une banque normalisée d’EST ou d’ADNc puis identifiées a posteriori.

1.4.1.2 Avantages et inconvénients

L’automatisation des différentes étapes (préhybridation, hybridation, lavages, révélation) permet l’analyse de plusieurs centaines de gènes par semaine. L’avantage principal de la méthode est qu’elle permet de visualiser directement leur patron d’expression. Néanmoins, le nombre de coupes tissulaires nécessaires à une analyse à grande échelle, ainsi que le manque de sensibilité de la méthode, expliquent que relativement peu d’études de ce type ont été menées.

1.4.1.3 Applications

Cette méthode a été utilisée pour analyser le patron d’expression, dans l’embryon de souris, des gènes orthologues à ceux présents sur le chromosome 21 humain (Reymond et al., 2002). Les auteurs ont ainsi mis en évidence plusieurs gènes impliqués dans le développement embryonnaire du système nerveux, du cœur ou encore du tractus digestif. Ces gènes sont des candidats pour expliquer les différents phénotypes liés au syndrome de Down (trisomie 21). L’étude systématique de coupes d’épiderme murin avec des sondes issues d’une banque d’ADNc de peau a permis l’identification d’un nouveau gène spécifique des kératinocytes suprabasaux, la dermokine (Matsui et al., 2004).

41 Introduction

1.4.2 « Signal Sequence trap » (SST)

1.4.2.1 Principe

Cette méthode a été développée afin de cloner spécifiquement des ADNc contenant une séquence codant pour un peptide signal amino-terminal, caractéristique des protéines sécrétées ou transmembranaires (Tashiro et al., 1993). Des fragments 5’ d’ADNc sont clonés dans un vecteur d’expression en fusion avec la séquence d’un gène rapporteur codant pour une protéine transmembranaire, délété de sa séquence 5’ (Suzuki et al., 1997). Après transfection, les clones obtenus sont criblés par immunofluorescence avec un anticorps dirigé contre la protéine rapporteuse. Seuls les ADNc qui comportent une séquence signal permettent l’adressage de la protéine de fusion à la voie de sécrétion du système endomembranaire. Plusieurs évolutions successives ont été apportées à la méthode jusqu’au développement d’un système de sélection basé sur l’expression de particules virales (Moffatt et al., 2002). Une protéine d’enveloppe, essentielle à la production de virus, est mutée dans sa partie amino-terminale afin d’inactiver sa séquence signal, et mise en fusion avec des fragments 5’ d’ADNc (figure 7). Dans ce cas, seule la production d’une protéine présentant une séquence signal est capable de restaurer la localisation à la membrane de cette protéine d’enveloppe, et donc la production de particules virales. Celles-ci jouent dans ce cas un double rôle de vecteur d’expression et de sélection.

Figure 7 : principe du SST.

42 Introduction

1.4.2.2 Avantages et inconvénients

Cette méthode permet un criblage rapide et direct. Elle nécessite néanmoins l’utilisation de fragments d’ADNc complets en 5’ mais interrompus avant leur codon stop. Ceux-ci doivent en outre être clonés en phase avec la séquence codant pour la région de la protéine de fusion (statistiquement 1 clone sur 3). Enfin, par définition, ces ADNc sont incomplets en 3’ et devront être reclonés pour obtenir une séquence pleine taille.

1.4.2.3 Applications

Une étude dans l’ovocyte de souris (Taft et al., 2002) a montré que parmi une centaine de colonies de la banque sélectionnées au hasard, 13% correspondent à un gène codant pour une protéine sécrétée ou liée à la membrane, contre 66% avec la méthode de SST, confirmant l’intérêt de cette méthode pour la découverte de gènes codant pour des protéines sécrétées ou transmembranaires. De nouveaux gènes exprimés dans l’épiderme humain et codant pour des protéines sécrétées ou liées à la membrane ont été recherchés par SST avec une banque d’ADNc de kératinocytes primaires enrichie en séquences 5’ (Bonkobara et al., 2003). Parmi les 37 gènes différents positifs (22 protéines transmembranaires et 15 protéines sécrétées), 7 nouveaux gènes (4 codant pour une protéine potentiellement transmembranaire et 3 pour une protéine potentiellement sécrétée d’après leur séquence déduite) ont été identifiés. Un autre de ces gènes code pour une protéine hypothétique transmembranaire avec 4 domaines immunoglobuline. La protéine Kdap (keratinocyte differenciation-associated protein), spécifique des couches granuleuse et cornée de l’épiderme, a été identifiée chez l’homme par cette méthode et caractérisée par la même équipe (Tsuchida et al., 2004). Elle a été mise en évidence d’autre part au sein d’un locus de 3 gènes codant pour des protéines sécrétées par la même méthode (cf. chapitre 2.2.2.7) (Moffatt et al., 2004).

1.5 Bioanalyse et gestion informatiques des données

1.5.1 Les différentes banques de données

Les 3 banques de données nucléotidiques principales, GenBank au NCBI, l’EMBL-Bank (European Molecular Biology Laboratory) et la DDBJ (DNA Database of Japan) sont regroupées depuis 1987 sous la forme d’un comité collaboratif, l’INSDC (International Nucleotide Sequence Database Collaboration, http://www.insdc.org/). Chaque séquence soumise à l’une de ces plateformes est convertie en un format standard et des mises à jour

43 Introduction quotidiennes la rendent disponible sur chacun des 3 sites. Plusieurs centaines de bases de données plus ou moins spécialisées existent par ailleurs (espèces, motifs nucléiques ou protéiques, structure, voies métaboliques, maladies génétiques, familles de protéines, données d’expression…) et l’objet de cette introduction n’est pas d’en faire la liste exhaustive. Chaque année, un numéro spécial de Nucleic Acids Research en accès libre est consacré à l’évolution des bases de données. L’utilisation de la masse considérable de données disponibles nécessité homogénéité et fiabilité. Le consortium GO (Gene Ontology, http://www.geneontology.org) a été créé avec l’objectif de développer une hiérarchie et un vocabulaire communs pour la description des produits des gènes. Ces termes se décomposent en 3 axes, le processus biologique, la localisation subcellulaire et les fonctions moléculaires. Cette classification fait de plus en plus référence, même si le nombre de termes différents et parfois contradictoires compliquent les analyses. Le projet Vega (http://vega.sanger.ac.uk), en marge d’Ensembl, vise à fournir une annotation vérifiée manuellement, clone par clone pour chaque chromosome. Plusieurs groupes participent à cette initiative, dont le Welcome Trust Center Institute, l’université de Washington ou encore le Genoscope. Mi-2006, environ 50% de la séquence génomique, correspondant à 14 , a été annotée, pour un total de 12 000 gènes. La banques de données protéique UniProt (http://www.expasy.uniprot.org/) fait quant à elle appel à ses utilisateurs pour améliorer l’annotation des séquences. Une autre tendance est la mise en évidence des variations interindividuelles. Celles-ci sont en effet d’un intérêt primordial pour comprendre les bases génétiques de certaines pathologies. Par exemple, le site de l’EBI héberge une base de données pour l’immunogénétique de près de 2500 séquences d’allèles HLA (Human Leukocyte Antigen) (Robinson et al., 2003). Plusieurs bases de données de polymorphismes nucléotidiques (SNP, Single Nucleotide Polymorphism) humains sont progressivement mises en place. L’initiative HapMap (http://www.hapmap.org/) vise par exemple à regrouper des dizaines de séquences génomiques recueillies auprès de populations africaines, asiatiques et européennes et à recenser les variations et leur proportion dans chaque groupe. De telles comparaisons devraient permettre de mettre en évidence des polymorphismes impliqués dans des pathologies ou dans la réponse aux traitements pharmacologiques.

44 Introduction

1.5.2 Les systèmes de visualisation du génome humain (« genome browsers ») Les systèmes de visualisation du génome humain intègrent de multiples annotations et utilisent une interface graphique facile d’utilisation (figure 8). Les 3 principaux sont le UCSC genome browser (University of California Santa Cruz, http://genome.ucsc.edu/) (Kent et al., 2002), le NCBI MapViewer (http://www.ncbi.nih.gov/mapview) (Wheeler et al., 2006) et l’Ensembl Genome Browser (http://www.ensembl.org) (Birney et al., 2006). Ces différents portails donnent accès au génome de plusieurs espèces, dont l’homme, et associent à la séquence nucléotidique de chaque chromosome (la même pour les 3 sites), les informations relatives à la position des gènes (ARNm, EST, et prédictions).

Figure 8 : représentation graphique des 3 systèmes de visualisation, à gauche Ensembl, à droite MapViewer et en bas le genome browser de l’UCSC.

45 Introduction

Tous ne présentent toutefois pas exactement les mêmes caractéristiques (Furey, 2006). Les « genome browser » de l’UCSC et d’Ensembl présentent les données de façon horizontale. Ils proposent de très nombreuses annotations et liens, et permettent la création de fenêtres personnalisées avec les données de l’utilisateur. Ensembl est le seul à permettre l’affichage simultané de régions synténiques entre 2 génomes d’espèces différentes, et à proposer des séquences de plusieurs haplotypes différents issus du projet HapMap. Le browser de l’UCSC est très complet et particulièrement facile d’utilisation étant donné que toutes les informations sont disponibles sur une même page, sous la forme de pistes (« tracks ») qu’il est possible de ne pas afficher ou d’afficher de façon complète ou résumée. Ces 2 browsers diffèrent aussi par le mode d’interrogation, seul le système « BLAT » de l’UCSC, basé sur un alignement de type BLAST, permet une interrogation directe à partir d’une séquence nucléotidique ou protéique (Kent, 2002). Le MapViewer du NCBI présente les données de façon verticale et propose pour chaque gène des liens vers les sections de ses propres divisions (UniGene, Gene, OMIM, dbSNP, SequenceViewer). Ensembl est le seul système permettant de passer directement vers un des deux autres browsers.

1.5.3 Data mining

L’accumulation exponentielle des données d’expression, EST, étiquettes SAGE et données de puces, constitue une formidable ressource. Certaines études de transcriptome, basées uniquement sur les données publiques, sont parues. L’analyse de 3 banques d’EST non normalisées de muscle squelettique humain normal a ainsi permis de reconstituer le transcriptome de ce tissu (Bortoluzzi et al., 2000). Les auteurs de ce travail ont détecté 4080 clusters UniGene contenant au moins un EST provenant de ces banques. Parmi eux sont représentés des gènes spécifiques du muscle squelettique, ainsi que des gènes exprimés aussi dans d’autres tissus. Cette spécificité a été estimée par le rapport du nombre d’EST de muscle sur le nombre total d’EST du cluster UniGene correspondant. Leur niveau d’expression dans le muscle a quant à lui été quantifié par le nombre absolu d’EST provenant de ce tissu. Les gènes fortement exprimés (au moins 9 EST de muscle), modérément exprimés (3 à 9 EST) et faiblement exprimés (1 ou 2 EST) représentent respectivement 9,1%, 27,4% et 63,5% du total. Seulement 47 gènes (1,2%) ont des EST provenant exclusivement de muscle squelettique, alors que 89% ont des EST d’au moins 4 autres tissus. Les résultats ont finalement été confrontés à ceux obtenus par la méthode du SAGE à partir de muscle squelettique. Les 2 lots de données présentent une bonne corrélation, ce qui étaye la pertinence de ce type d’étude transcriptomique in silico.

46 Introduction

2 La différenciation épidermique

2.1 Présentation générale

2.1.1 La peau

La peau assure principalement des fonctions de protection, de perception et de thermorégulation. Elle agit comme interface entre le milieu extérieur et l’organisme. Le système tégumentaire se compose de deux tissus conjonctifs, l’hypoderme et le derme, recouverts en surface d’un tissu épithélial de revêtement, l’épiderme. C’est un organe complexe, d’origine ectodermique pour ce qui concerne l’épiderme et ses annexes, follicules pilo-sébacés et glandes sudoripares, et mésodermique pour le derme et l’hypoderme (figure 9).

Figure 9 : représentation schématique de l’épiderme.

47 Introduction

2.1.1.1 L’hypoderme

Tissu adipeux sous-cutané constitué de lobules graisseux, richement vascularisé, il sépare le derme des plans aponévrotiques et périostés sous-jacents. Il joue à la fois un rôle énergétique et de protection mécanique et thermique.

2.1.1.2 Le derme

Tissu conjonctif dense composé principalement de fibroblastes, entourés de fibres et de substance fondamentale, son épaisseur varie selon le territoire anatomique de 0,5 à 5 mm. Les fibres dermiques sont constituées à 90% de collagène qui procure la résistance mécanique et l’extensibilité au tissu. Il assure un rôle de protection et de soutien des follicules pilo-sébacés et des glandes sudoripares.

2.1.1.3 La jonction dermo-épidermique

Lame basale de composition biochimique complexe, synthétisée à la fois par les fibroblastes du derme et les kératinocytes de l’épiderme, elle joue le rôle d’interface entre ces deux tissus. Elle sert en outre de support mécanique pour l’adhérence de l’épiderme au derme et permet les échanges entre ces deux compartiments. On distingue en microscopie électronique deux zones de densité différente, la lamina lucida (ou lamina rara) immédiatement sous-jacente aux kératinocytes basaux, puis la lamina densa en profondeur. La jonction entre le derme et l'épiderme n'est pas plane mais forme des crêtes, les papilles.

2.1.1.4 L’épiderme

Epithélium pavimenteux, pluristratifié et cornifié, il est constitué à 90% de kératinocytes. Ces cellules épithéliales vont subir un processus de mort cellulaire programmée particulier, la cornification. L’épiderme contient également environ 10% de cellules dendritiques résidentes non épithéliales : les cellules de Langerhans, cellules présentatrices d’antigène constituant autant de sentinelles immunitaires, les mélanocytes qui synthétisent la mélanine, impliquée dans la photoprotection, et les cellules de Merkel qui ont un rôle neurosensoriel.

2.1.1.5 Les annexes épidermiques

Ces structures spécialisées dérivent embryologiquement de l’ectoderme mais sont logées dans le derme et l’hypoderme. Elles comprennent les glandes sudoripares eccrines et apocrines, les glandes sébacées exocrines, les follicules pileux et les ongles. A noter que l’épiderme des territoires palmoplantaires est dépourvu de follicules pilo-sébacés.

48 Introduction

2.2 La différenciation kératinocytaire

2.2.1 Aspects morphologiques

L’épiderme se renouvelle entièrement dans un délai de 28 jours qui correspond à l’achèvement du programme de différenciation terminale du kératinocyte. On distingue en microscopie optique quatre couches correspondant à différentes étapes de ce programme de différenciation (figure 10).

2.2.1.1 Couche basale ou stratum basale

Les kératinocytes basaux forment une rangée unique de cellules cubiques ou prismatiques, ancrées à la lame basale par des hémidesmosomes et aux cellules voisines par des desmosomes. Ils présentent un rapport nucléocytoplasmique élevé avec un noyau très basophile. Ils contiennent de nombreux mélanosomes produits par les mélanocytes puis transférés aux kératinocytes par cytophagocytose. Cette couche constitue le compartiment germinatif. Les cellules souches donneront naissance à des cellules d’amplification transitoire qui effectueront un nombre limité de divisions pour donner naissance à une population de kératinocytes différenciés. Ces derniers vont irrémédiablement sortir du cycle cellulaire et « enclencher » le processus de différenciation terminale en quittant la couche basale pour migrer vers la surface de l’épiderme.

2.2.1.2 Couche épineuse ou stratum spinosum

Anciennement dénommée corps muqueux de Malpighi du nom du fondateur italien de l’histologie qui fit les premières observations microscopiques de l’épiderme, cette couche est constituée de 5 à 10 assises de kératinocytes épineux qui doivent leur nom à l’aspect de leurs très nombreux desmosomes. On observe effectivement en microscopie optique un aspect d’épines après rétractation des membranes au cours des préparations histologiques. Plus volumineux que les kératinocytes basaux, polyédriques, les kératinocytes épineux subissent des changements morphologiques pour s’élargir progressivement vers les couches les plus superficielles. En microscopie électronique, on observe de très nombreux faisceaux de filaments intermédiaires qui entourent le noyau et convergent vers les desmosomes. Dans les dernières assises cellulaires apparaissent des organites spécialisés dérivés du Golgi, les kératinosomes ou corps lamellaires, anciennement dénommés corps de Odland. Ce sont des vésicules arrondies de 0,2 à 0,3µm de diamètre qui contiennent de nombreux lipides organisés en bicouches. Une étude récente suggère toutefois qu’en microscopie électronique sur

49 Introduction ultracryocoupes (sans inclusion préalable), les kératinosomes apparaissent non pas comme des vésicules isolées, mais comme un réseau tubulo-vésiculaire (Ishida-Yamamoto et al., 2004).

2.2.1.3 Couche granuleuse ou stratum granulosum

Elle est formée des derniers kératinocytes vivants de l’épiderme, avant la lyse nucléaire qui accompagne la cornification. Les kératinocytes granuleux constituent 2 à 5 assisses de cellules aplaties. Ils doivent leur nom à la présence dans leur cytoplasme de grains sombres, les granules de kératohyaline, agrégats protéiques insolubles. On distingue en microscopie électronique des granules irréguliers, les granules F formés principalement par la profilaggrine, et de plus petits granules arrondis, les granules L contenant la loricrine. Le nombre de kératinosomes augmente ; ils seront sécrétés au pôle apical des derniers kératinocytes granuleux dans l’espace intercornéocytaire et sont responsables de la formation des lamellae lipidiques, nécessaires à la fonction barrière de l’épiderme.

2.2.1.4 Couche cornée ou stratum corneum

Elle est formée de l’empilement de 15 à 20 assises cellulaires en moyenne. Le kératinocyte prend à ce stade le nom de cornéocyte, il représente le stade terminal de la différenciation kératinocytaire. Très aplati, il a perdu son noyau et tous ses organites, c’est une cellule morte qui ne présente plus aucune activité de synthèse. Les cornéocytes sont très cohésifs et hydrophobes. La membrane plasmique est remplacée par une coque protéique insoluble, l’enveloppe cornée, et le cytoplasme est réduit à une matrice fibreuse dense amorphe. En microscopie électronique, on constate la transformation des desmosomes en cornéodesmosomes, caractérisée par la disparition des plaques intracytoplasmiques et la densification du cœur intercellulaire. L’espace intercornéocytaire est rempli de lipides organisés en bicouches, les lamellae lipidiques, qui proviennent des kératinosomes. Le cytosquelette de cytokératines subit un réarrangement pour former des macrofibrilles, constituants de la matrice fibreuse dense. Les cornéocytes sont éliminés en surface selon un processus ordonné, la desquamation. On distingue selon le degré de cohésion et de densité le stratum compactum en profondeur et le stratum disjunctum en surface. L’épaisseur de la couche cornée est très variable en fonction des territoires anatomiques, de quelques dizaines de µm sur les paupières à plusieurs millimètres au niveau des régions palmoplantaires. On observe au niveau des régions palmoplantaires une couche intermédiaire en profondeur de la couche cornée, la couche claire

50 Introduction ou stratum lucidum. Elle contient des cellules transitionnelles, en cours de cornification. Dans les autres territoires anatomiques, on retrouve des cellules transitionnelles dispersées.

Cornéocyte

Cellule transitionnelle Différenciation

Kératinocyte granuleux

Kératinocyte épineux

Kératinocyte basal

Figure 10 : coupe de peau humaine colorée à l’hématoxyline-éosine et représentation schématique de l’ultrastructure de l’épiderme (d’après un schéma original de Christian Vincent). Le processus de différenciation terminale est enclenché dès lors que le kératinocyte basal post-mitotique perd son adhérence à la lame basale. Dans les conditions physiologiques, il devient alors incapable de se diviser. La différenciation du kératinocyte de la couche basale vers la couche granuleuse dure environ 14 jours, puis le cornéocyte transitera pendant environ 14 jours dans la couche cornée avant de desquamer. Au cours de cette différenciation, le kératinocyte granuleux est la dernière cellule vivante de l’épiderme à présenter une activité de transcription et de traduction. C’est dans cette cellule qu’est synthétisée la grande majorité des molécules impliquées dans la cornification et la desquamation telles que les précurseurs protéiques de l’enveloppe cornée, les lipides de l’espace intercornéocytaire et les hydrolases qui les accompagnent, les protéases et inhibiteurs de protéases, et les différents peptides antimicrobiens.

51 Introduction

2.2.2 Aspects biochimiques

2.2.2.1 Couche basale

Les kératinocytes basaux expriment de façon spécifique le couple de cytokératines KRT5 et KRT14 ainsi que les constituants transmembranaires des hémidesmosomes, BPAG2 (Bullous Pemphigoïd Antigen 2, aussi nommée BP180 ou COL17A1, Collagen Type XVII Alpha 1) et les intégrines α6β4. Ils sécrètent en outre la laminine-5, ligand des intégrines. La compréhension des mécanismes moléculaires qui interviennent dans la régénération épidermique est d’un intérêt capital dans le traitement des grands brûlés. Malgré leur apparente homogénéité morphologique, les kératinocytes de la couche basale constituent une population hétérogène. On y trouve les cellules souches adultes, multipotentes, capables de donner naissance à l’épiderme interfolliculaire ou à ses annexes. Elles donneront naissance à des cellules d’amplification transitoire qui se diviseront un nombre limité de fois avant d’entamer le processus de différenciation terminale (Potten and Morris, 1988). Les cellules souches de l’épiderme ont un cycle cellulaire particulièrement long. De ce fait, elles ont été détectées chez la souris grâce à leur capacité de rétention de marquage nucléaire de l’ADN à la bromodésoxyuridine (BrdU) ou à la thymidine tritiée (LRC, label-retaining cells) (Cotsarelis et al., 1990). Chez l’homme, où de telles analyses in vivo sont impossibles, les kératinocytes sont mis en culture puis leur potentiel clonogénique est analysé in vitro. Des cellules à fort potentiel clonogénique ont été identifiées chez l’homme dans une région située en périphérie du follicule pileux, le bulge (Rochat et al., 1994). Chez la souris, la capacité pour les LRC de former des follicules pileux et d’intervenir au cours de la cicatrisation (Taylor et al., 2000) a été mise en évidence avec un double marquage au BrdU et à la thymidine tritiée. Une cellule unique isolée dans le bulge, puis greffée chez la souris nude, est capable de former des follicules pileux (Blanpain et al., 2004). Les cellules du bulge marquées au BrdU participent à la régénération de l’épiderme adulte après une blessure. L’implication supposée de ces cellules dans la formation de l’épiderme interfolliculaire a été spéculée en raison de l’absence de LRC ailleurs que dans le bulge. Elle semble cependant définitivement réfutée par une étude récente chez la souris (Levy et al., 2005). Ce travail s’appuie sur la propriété des cellules embryonnaires de la placode, à l’origine des futurs follicules pileux, d’exprimer le morphogène Sonic Hedgehog (Shh). Des souris exprimant la recombinase Cre sous contrôle

52 Introduction du promoteur Shh sont croisées avec des souris R26R dont l’excision d’une cassette de terminaison de transcription induit la production de la β-galactosidase. Ainsi, les futurs kératinocytes provenant de la placode expriment chez l’adulte cette enzyme. Les résultats montrent que le marquage à la β-galactosidase ne concerne que le follicule pilo-sébacé (figure 11). L’épiderme interfolliculaire dérive donc d’une autre population de cellules souches, qui n’est pas localisée au niveau de la placode dermique. Il en est de toutes façons de même dans l’épiderme palmoplantaire qui ne contient pas de follicules.

Figure 11 : activité β-galactosidase dans la peau de souris ShhCre;R26R (Levy et al., 2005). Seuls les follicules pilo-sébacés sont marqués (cellules bleues). Les couches suprabasales sont marquées en brun avec un anticorps anti- kératine 1. A : fort grossissement B : faible grossissement

Des biopsies de peau de prépuce humain ont été greffées chez des souris nude puis transfectées in vivo par des lentivirus contenant la séquence codant pour la GFP (Ghazizadeh and Taichman, 2005). L’observation au bout de 28 jours de coupes de peau en immunofluorescence montre que les kératinocytes s’organisent en unités de prolifération et de différenciation verticales qui semblent dispersées au hasard dans ces échantillons (figure 12).

Figure 12 : distribution de la fluorescence dans des unités de prolifération de l’épiderme humain greffé chez la souris nude et transfecté par un lentivirus exprimant la GFP (Ghazizadeh and Taichman, 2005).

53 Introduction

Ces travaux confirment une observation déjà faite par la même équipe dans l’épiderme de souris transgéniques exprimant le gène lacZ et transfectées in situ par un vecteur rétroviral exprimant la β-galactosidase (Ghazizadeh and Taichman, 2001). Il apparaît ainsi que le maintien de l’épiderme interfolliculaire, en l’absence de blessure, est indépendant des cellules souche du follicule pileux. Des marqueurs biochimiques spécifiques des cellules souches ont été depuis longtemps recherchés. A ce jour, aucune molécule strictement spécifique des cellules souches épidermiques n’a été identifiée. Toutefois, certaines protéines sont plus fortement exprimées dans les LRC. C’est la combinaison de plusieurs d’entre elles qui permet actuellement d’isoler une population enrichie en cellules souches. On peut citer par exemple l’intégrine β1, les kératines 15 et 19, p63, l’intégrine α6 associée au récepteur à la transferrine, ou encore CD34. L’expression de l’intégrine β1 joue un rôle dans le maintien d’un état indifférencié, les intégrines inoccupées transduisant un signal de différenciation (Levy et al., 2000). Une inactivation conditionnelle de ce gène dans l’épiderme sous contrôle du promoteur KRT14 conduit à un défaut de prolifération des kératinocytes et de formation de la lame basale. Des études en immunohistochimie et immunofluorescence montrent que les LRC localisées dans le bulge expriment les cytokératines 15 et 19, et sont aussi celles qui expriment le plus fortement le couple d’intégrines α3β1 (Lyle et al., 1998). p63 est un facteur de transcription de la famille de p53, transcrit à partir de 2 promoteurs différents sous une forme transactivatrice (TAp63) ou tronquée (ΔNp63). Il a été montré que les kératinocytes humains à fort potentiel clonogénique in vitro expriment plus fortement p63 (forme longue) que les cellules d’amplification transitoire (Pellegrini et al., 2001). CD34 est un antigène de surface initialement identifié dans les cellules souches de la lignée hématopoïétique (Sutherland et al., 1988). Des kératinocytes, purifiés à partir d’épiderme humain, exprimant fortement l’intégrine α6 et faiblement le récepteur à la transferrine (TFRC, anciennement CD71) présentent un fort potentiel prolifératif (Li et al., 1998), alors que les cellules d’amplification transitoire, qui se divisent activement, expriment fortement à la fois l’intégrine α6 et TFRC (Tani et al., 2000). Enfin, des kératinocytes humains exprimant fortement l’intégrine α6 et n’exprimant pas TFRC sont capables de reconstituer un épithélium pluristratifié cornifié in vitro (Li et al., 2004). Dans l’épiderme de souris, CD34 est exprimé par les LRC positifs à la kératine 15 et qui présentent un fort potentiel clonogénique in vitro (Trempus et al., 2003). Ces résultats sont toutefois en contradiction avec une étude précédente qui montre par des expériences de cytométrie de flux que les LRC murins n’expriment pas CD34 (Albert et al., 2001).

54 Introduction

2.2.2.2 Couche épineuse

Le kératinocyte épineux exprime les marqueurs précoces de la différenciation tels que le couple de cytokératines 1 et 10 et l’involucrine, précurseur de l’enveloppe cornée. Les protéines de liaison au calcium Scarf et Scarf2 sont détectées en immunofluorescence dans les couches épineuses et granuleuses chez la souris (Hwang et al., 2005). Dans les couches épineuses les plus superficielles apparaissent certaines protéines caractéristiques du stade granuleux.

2.2.2.3 Couche granuleuse et couche cornée

Le kératinocyte granuleux représente le point culminant de la différenciation kératinocytaire en termes d’activité de transcription et de traduction. La production de la quasi-totalité des protéines et des lipides spécifiques de la couche cornée se fait au niveau de cette cellule. En effet, le kératinocyte granuleux subit un processus particulier de mort cellulaire programmée, la cornification, qui va empêcher toute activité de synthèse. La liste des protéines spécifiques des kératinocytes ne cesse de s’allonger, et c’est aussi le but de ce travail. Plutôt qu’une présentation chronologique, les dernières étapes de la différenciation cellulaire sont classées par aspects fonctionnels.

2.2.2.4 Mise en place de la fonction barrière Au début des années 80, Peter Elias propose le modèle du mur de briques pour illustrer le rôle de la couche cornée dans la fonction barrière. Dans cette comparaison, les briques sont constituées par les cornéocytes et les lipides représentent le ciment qui les entoure. Un trouble de la barrière peut alors être causé soit par des briques anormales, c'est-à-dire un défaut des protéines de structure ou des transglutaminases qui les lient solidement entre elles, soit par un mortier déficient, c'est-à-dire une anomalie de métabolisme des lipides intercornéocytaires. Si la cornification, orage biochimique permettant la transformation du kératinocyte granuleux en cornéocyte, et les lamellae lipidiques jouent un rôle essentiel dans la mise en place de la fonction barrière épidermique, la fonction primordiale des jonctions intercellulaires a été démontrée ces dernières années.

2.2.2.5 La cornification

La formation du cornéocyte se caractérise par la disparition des organites cellulaires, la formation d’une matrice fibreuse dense intracytoplasmique, et la disparition de la membrane plasmique, remplacée par une enveloppe lipoprotéique, l’enveloppe cornée.

55 Introduction

2.2.2.5.1 Disparition des organites, un point commun avec l’apoptose ?

L’homéostasie tissulaire implique une balance entre prolifération et mort cellulaire. Dans l’épiderme, on assiste à une forme particulière d’apoptose, qui partage des points communs avec elle, mais en diffère principalement par la persistance des cellules mortes, les cornéocytes, qui remplissent une fonction essentielle à la barrière épidermique. L’apoptose « classique » peut toutefois être observée au sein de l’épiderme, en particulier lors d’une exposition aux rayonnements UV ou dans des pathologies cutanées comme le psoriasis. Elle concerne alors principalement les kératinocytes de la couche basale (Qin et al., 2002) et mène à la disparition des cellules au bout de quelques heures après phagocytose par les cellules de Langerhans voisines. Lors de la cornification, le noyau est complètement détruit. Le mécanisme conduisant à la dégradation de l’ADN nucléaire est resté longtemps controversé. Des analyses en électrophorèse sur gel de l’ADN génomique ont montré une fragmentation de l’ADN en échelles nucléosomales dans des extraits épidermiques, et la méthode TUNEL (Terminal deoxynucleodityl Transferase-mediated dUTP-biotin Nick End Labelling) permet de marquer quelques cellules transitionnelles isolées, cette étape de dégradation de l’ADN étant très rapide (Gavrieli et al., 1992; McCall and Cohen, 1991). Dans des études plus récentes, la fragmentation de l’ADN lors de la cornification a été comparée à celle observée au cours de l’apoptose induite aux UV dans des kératinocytes primaires en culture (Takahashi et al., 2000) ou dans l’épiderme humain (Mass et al., 2003). Ces études concluent sur un mécanisme de dégradation de l’ADN dans la cornification différent de celui observé dans l’apoptose induite aux UV et ne passant pas par la fragmentation nucléosomale. Toutefois, contrairement à la conclusion des auteurs, certains marquages TUNEL sont observés dans la couche granuleuse de l’épiderme. La DNase responsable de la dégradation de l’ADN nucléaire, DNase1L2, a en fait été identifiée récemment (Fischer et al., 2006). Cette protéine est détectée par immunohistochimie dans les kératinocytes granuleux. L’inactivation du gène par interférence à l’ARN dans des kératinocytes différenciés in vitro induit la persistance des noyaux dans la couche cornée (parakératose). Enfin, DNase1L2 est sous-exprimée au cours de pathologies associées à une parakératose telles que le psoriasis et la maladie de Bowen. Il est intéressant de noter que les kératinocytes suprabasaux développent une forme de résistance à l’apoptose qui dépendrait largement du facteur antiapoptotique BCL-XL et de la voie PI3K/Akt1 (Umeda et al., 2003). Dans les couches suprabasales de l’épiderme, on détecte, outre BCL-XL , les facteurs proapoptotiques BAX (BCL2-Associated X protein)

56 Introduction

(Krajewski et al., 1994) et BAK (BCL2 Antagonist Killer) (Krajewski et al., 1996). L’inactivation de ces gènes chez la souris n’induit pas de phénotype cutané évident (Droin and Green, 2004) et la surexpression de BCL-XL dans l’épiderme de souris sous contrôle d’un promoteur KRT14 entraîne une résistance à l’apoptose induite aux UV sans perturber la cornification (Pena et al., 1997). Ces résultats vont dans le sens d’une indépendance du processus de cornification vis-à-vis de la voie d’apoptose mitochondriale classique. Des protéases à cystéine intracellulaires, les caspases, sont des effecteurs essentiels de l’apoptose. Toutefois, l’utilisation d’inhibiteurs de la caspase 3 (z-DEV1-FMK), de la caspase 8 (zIETD-FNIK) ou de la caspase 9 (z-LEHD-FMK), ou un inhibiteur de caspases à large spectre (z-VAD-17MK), n’a pas d’effet sur la formation d’enveloppes cornées dans un modèle de kératinocytes primaires différenciés in vitro à l’aide de l’ionophore A23187 (Takahashi et al., 2000). Au contraire, une autre étude montre que la caspase 3 est activée par protéolyse de la proforme au cours de la différenciation dans un modèle d’épiderme reconstruit, et que l’utilisation d’un inhibiteur à large spectre empêche la formation de la couche cornée (Allombert-Blaise et al., 2003). D’autre part, la surexpression de BCL2 ou l’utilisation d’antioxydants inhibent l’expression de KRT10 (Tamiji et al., 2005). Ainsi, il semble d’après ces travaux que la voie apoptotique mitochondriale joue un rôle dans les étapes précoces de la différenciation épidermique. Toutefois, l’ensemble de ces résultats ont été obtenus dans des modèles in vitro. In vivo, les proformes des caspases effectrices 3, 6 et 7 sont détectées mais ne semblent pas activées au cours de la différenciation de l’épiderme humain normal (Lippens et al., 2000). La caspase 14, seule isoforme exclusivement exprimée dans ce tissu, est spécifique de la couche granuleuse (Eckhart et al., 2000). C’est la seule caspase dont la protéolyse complète de la proforme en forme potentiellement active a été mise en évidence par western blotting sur extraits de couche cornée. Elle pourrait jouer un rôle dans la différenciation, mais aucun argument ne permet de spéculer sur ses cibles potentielles. Ces résultats étayent l’hypothèse d’un rôle mineur des caspases dans la cornification. Au total, même si la cornification partage des caractéristiques biochimiques avec l’apoptose, il semble qu’elle correspond plutôt à une mort cellulaire spécifique (figure 13).

57 Introduction

Figure 13 : changements morphologiques et biochimiques au cours de la cornification et de l’apoptose (Lippens et al., 2005).

2.2.2.5.2 Formation de la matrice fibreuse

La compaction des filaments intermédiaires de cytokératines dans les cornéocytes par la filaggrine est vraisemblablement responsable de l’aplatissement de ces cellules. Le cytoplasme est remplacé par une matrice fibreuse essentiellement formée de cytokératines agrégées.

2.2.2.5.2.1 Filaments intermédiaires Les filaments intermédiaires (FI) de cytokératines sont une composante essentielle du cytosquelette épidermique, permettant la cohésion de ce tissu grâce notamment à leur connexion intercellulaire par l’intermédiaire des desmosomes, et à la lame basale par l’intermédiaire des hémidesmosomes. Une nouvelle nomenclature a été proposée par plusieurs scientifiques faisant référence dans ce domaine (Schweizer et al., 2006). Les gènes codant pour les cytokératines classiques sont désignés KRT1-24 et les protéines correspondantes K1-24. Elles sont classées en deux groupes, I (acide, K9 à K23) ou II (basique, K1 à K8). Les cytokératines acides sont codées par des gènes situés dans un même locus en 17q12, alors que les gènes codant pour les kératines basiques sont situés en 12q13 (Lessin et al., 1988). Toutes les kératines partagent une même organisation structurale avec une partie centrale, constituée d’hélices α reliées par des domaines de liaison, entourée de deux domaines globulaires terminaux. Les cytokératines s’assemblent en hétérodimères constitués d’une kératine basique et d’une kératine acide puis en tétramères qui forment l’unité de base des protofilaments de 3 nm (figure 14). Huit protofilaments forment finalement le filament intermédiaire de 10 nm de diamètre (Fuchs and Weber, 1994).

58 Introduction

Figure 14: mécanisme d’assemblage des filaments intermédiaires (http://www.ulysse.u- bordeaux.fr/atelier/ikramer/biocell_diffusion/). Les cytokératines de type I et II sont généralement exprimées en proportions équivalentes sous la forme d’une paire préférentielle, spécifique d’un type cellulaire ou d’un état de différenciation. Par exemple, les épithéliums simples expriment spécifiquement le couple K8- K18. Dès la première assise de la couche épineuse, les kératinocytes expriment le couple de cytokératines K1 et K10 qui remplacent le réseau préexistant K5 - K14, spécifique des kératinocytes basaux. K2 (anciennement KRT2A ou KRT2e) est détectée dans les couches suprabasales de l’épiderme, à partir de la troisième ou quatrième assise cellulaire. Il est à noter qu’elle est présente en plus faibles proportions au niveau de certains territoires anatomiques (seins, aisselles, verge) (Collin et al., 1992). K9, une cytokératine très homologue à K10, est exprimée de façon spécifique dans les couches suprabasales de l’épiderme palmoplantaire (Langbein et al., 1993). De nombreuses génodermatoses sont causées par des mutations des kératines épidermiques, qui ont pour la plupart un effet dominant négatif. Les phénotypes sont plus ou moins sévères selon la couche épidermique au niveau de laquelle sont exprimées les kératines touchées, et selon la position de la mutation sur la protéine (Cheng et al., 1992). Par exemple, une anomalie au niveau des régions globulaires de K5 ou K14 entraîne un grave défaut de cohésion entre les kératinocytes basaux conduisant à la rupture de ces cellules et à la formation de bulles profondes (épidermolyse bulleuse simple (EBS) de type Dowling-Meara, MIM #131760) ; c’est l’EBS la plus sévère. Des mutations équivalentes dans les gènes codant pour les kératines suprabasales K1 ou K10 sont responsables d’une hyperkératose épidermolytique avec rupture au niveau des kératinocytes épineux, dermatose moins sévère (Cheng et al., 1992). D’autres mutations dans les portions hélicoïdales du domaine central des kératines suprabasales sont responsables de kératodermies palmoplantaires ou d’ichthyose hystrix de Curth-Macklin (Kelsell et al., 2005).

59 Introduction

Des mutations de KRT2 sont responsables de l’ichthyose bulleuse de Siemens, transmise sur le mode dominant, et caractérisée par une hyperkératose et la formation spontanée de bulles superficielles (MIM #146800). L’épiderme présente une désorganisation des filaments intermédiaires dans les couches suprabasales et une acantholyse.

2.2.2.5.2.2 Agrégation des FI

Figure 15 : métabolisme de la profilaggrine (Simon et al., 2001b). La profilaggrine, contenue dans les granules de kératohyaline (granules F) du kératinocyte granuleux, appartient à la famille des IFAP (Intermediate Filament Associated Protein). Son gène est localisé chez l’homme dans le complexe de différenciation épidermique en 1q21 (cf. chapitre 2.2.2.6). Elle est d’abord produite par le kératinocyte sous la forme d’un précurseur insoluble de 400 kDa environ, phosphorylé, formé d’un domaine amino-terminal de 293 aa,

60 Introduction d’une sous-unité tronquée de 173 aa suivie de 10 à 12 sous-unités homologues de 324 aa et enfin d’un domaine carboxy-terminal de 157 aa (Presland et al., 1992) (figure 15). Lors de la transition kératinocyte granuleux / cornéocyte, la profilaggrine est déphosphorylée puis clivée en unités de filaggrine (Gan et al., 1990). La ou les protéases impliquées dans cette maturation protéolytique n’ont à ce jour pas été formellement identifiées. Les monomères de filaggrine libérés agrègent les filaments intermédiaires en macrofibrilles qui formeront la matrice fibreuse dense intracornéocytaire après établissement de liaisons covalentes par les transglutaminases (Steinert et al., 1981). Finalement, la filaggrine est désiminée dans la couche cornée par des peptidyl-arginine désiminases (PADI) qui catalysent la conversion des résidus arginyl en résidus citrullyl ; la protéine perd son affinité pour les filaments intermédiaires de cytokératines et est dégradée en acides aminés libres qui participent à la formation du facteur naturel d’hydratation (Scott et al., 1982). L’implication de la profilaggrine dans la physiopathologie de l’ichthyose vulgaire a été longtemps soupçonnée, en particulier en raison de l’absence de granules de kératohyaline dans cette pathologie (Sybert et al., 1985), mais ce n’est que très récemment que des mutations du gène ont été identifiées dans 15 familles de patients (Smith et al., 2006). La longueur de la séquence codante (presque 12 kb) ainsi que la présence de répétitions ont sans doute été responsables du retard pris dans le séquençage de ce gène chez les malades, il n’existe d’ailleurs aucun ARNm complet dans les banques de données. Les deux principales mutations, R501X ou 2282del4, sont retrouvées chez 9% de la population européenne, et sont en outre responsables à l’état hétérozygote de dermatite atopique (mutations semidominantes) (Palmer et al., 2006). Des molécules de kératines suprabasales K1, K10 et K2, ainsi que de filaggrine (Simon et al., 1996), sont incorporées à l’enveloppe cornée sous l’action des transglutaminases, enzymes qui catalysent la formation de liaisons covalentes, comme le montre la digestion protéolytique d’enveloppes cornées purifiées à partir d’épiderme humain et le séquençage des peptides obtenus (Steinert and Marekov, 1995).

2.2.2.5.3 Formation de l’enveloppe cornée

Cette structure, sorte de coque protéique tout à fait spécifique, est insoluble en présence de détergents et / ou d’agents réducteurs, dans la mesure où les protéines qui la constituent sont liées entre elles par des liaisons covalentes, autres que des ponts disulfure (Rice and Green, 1977). L’assemblage de l’enveloppe cornée, qui remplace la membrane plasmique, se déroule de façon séquentielle par incorporation successive des précurseurs, liés entre eux par des

61 Introduction liaisons covalentes sous l’action des transglutaminases. Il semble que les protéines soient prépositionnées en périphérie au fur et à mesure de leur synthèse. Un premier échafaudage comprend les protéines d’assemblage, périplakine, envoplakine et involucrine. Plus tardivement, cette enveloppe protéique est renforcée par des protéines de structure telles que la loricrine, les SPRR (Small Proline Rich Proteins) et les LEP (Late Envelope Proteins) (cf. chapitre 2.2.2.6 concernant le complexe de différenciation épidermique ou EDC). L’augmentation du calcium intracellulaire est vraisemblablement responsable de l’activation des transglutaminases. Ces enzymes catalysent la formation de liaisons covalentes entre le groupement gamma-carboxamide de la chaîne latérale d'un résidu glutamine et le groupement epsilon-amino de la chaîne latérale d'un résidu lysine (EC 2.3.2.13). Les kératinocytes granuleux expriment les transglutaminases 1, 3 et 5. Les isoformes 1 et 3 sont produites sous forme de proenzyme activée secondairement par protéolyse. La transglutaminase 1 Transglutaminase + Ca2+ (TGM1) est liée à la face cytosolique de la membrane plasmique par un acide gras (N-myristoylation cotraductionnelle C:14 et palmitoylation post- traductionnelle C:16) (Steinert et al., 1996). Elle intervient dans la réticulation précoce des protéines d’assemblage. TGM3 et TGM5 sont cytosoliques et interviendraient plus tardivement dans la liaison des protéines de structure entre elles et à l’enveloppe cornée. Dans le même temps, les kératinosomes sont extrudés au pôle apical des derniers kératinocytes granuleux, déversant leur contenu lipidique dans l’espace intercornéocytaire. Parmi eux se trouvent des céramides à très longues chaînes d’acides gras, les ω-hydoxycéramides, qui sont suffisamment longs pour traverser les deux hémicouches de la membrane plasmique et vont finalement la remplacer. Ils seront ainsi incorporés à l’enveloppe cornée sous l’action de la TGM1, liés principalement à l’involucrine, et dans une moindre mesure à l’envoplakine et la périplakine (Marekov and Steinert, 1998). Malgré une apparente redondance grâce à l’intervention de 3 transglutaminases, TGM1 joue un rôle essentiel dans la formation de l’enveloppe cornée. En effet, chez l’homme, des mutations de ce gène sont responsables d’une génodermatose récessive grave, l’ichthyose lamellaire de type 1 (MIM #242300). Le phénotype de bébé collodion à la naissance peut conduire à une mort néonatale ou évoluer vers une ichthyose caractérisée par de larges squames brunes généralisées. Cette ichthyose est parfois associée à un ectropion et/ou eclabium. L’épiderme est hyperkératosique, le profil de céramides altéré, et

62 Introduction l’augmentation des pertes hydriques transcutanées témoigne d’un trouble de la barrière. La transglutaminase 1 joue donc bien un rôle particulier dans la formation de l’enveloppe cornée qui n’est pas compensé par les autres isoformes. Des souris invalidées pour ce gène présentent un trouble majeur de la barrière épidermique et meurent quelques heures après la naissance (Matsuki et al., 1998). Les granules de kératohyaline s’accumulent dans le cytoplasme des kératinocytes granuleux, et on observe en microscopie électronique un défaut de formation de l’enveloppe cornée et une anomalie ultrastructurale des lipides intercornéocytaires (Kuramoto et al., 2002). Ces arguments convergent vers un rôle indispensable de TGM1 dans l’attachement des céramides servant d’échafaudage à l’organisation extracellulaire des lipides en lamellae. L’inactivation de la TGM3 chez la souris provoque une létalité embryonnaire très précoce (Leonard M. Milstone, résultats non publiés), ce qui pourrait expliquer qu’il n’existe chez l’homme aucune pathologie associée à des mutations de ce gène. Enfin, la TGM5 a été récemment associée à un syndrome de peau déciduale acrale (extrémité des membres) (noninflammatory acral peeling skin syndrome, MIM #609796) (Cassidy et al., 2005). Cette pathologie est caractérisée par un détachement indolore de lambeaux de couche cornée successif à la formation de bulles à la transition couche granuleuse / couche cornée au niveau des extrémités. Une protéase à cystéine, identifiée chez les mammifères il y a presque 10 ans, legumain, a vu son rôle dans la maturation de TGM3 mis en lumière dans un modèle de souris présentant un phénotype proche de l’ichthyose harlequin, avec un défaut de la cornification associé à un trouble de la barrière (Zeeuwen et al., 2004). Ce phénotype est causé par une mutation inactivant le gène codant pour la cystatine M/E, un inhibiteur de protéase intracellulaire. Chez ces souris, on note une activité accrue de la protéase à cystéine legumain, ainsi qu’une activation protéolytique très augmentée de la transglutaminase 3 et une augmentation de la formation de liaisons entre molécules de loricrine. Ces travaux montrent d’autre part que la TGM3 est protéolysée in vitro par des extraits de rein contenant legumain, et l’utilisation d’un inhibiteur spécifique empêche cette protéolyse. Toutefois, les auteurs suspectent que legumain pourrait avoir un effet indirect sur la protéolyse de TGM3 en activant des cathepsines. Ils montrent en effet que les cathepsines CTSL, CTSB, CTSS mais pas CTSH ni CTSC, sont capables de cliver TGM3 in vitro. Une étude plus récente montre in vitro à l’aide d’un substrat fluorogénique une inhibition des cathepsines L (CTSL) et V (CTSV), protéases à cystéine lysosomiales exprimées dans la couche granuleuse, par la cystatine M/E (Cheng et al., 2006). La cystatine M/E joue donc un rôle dans la régulation des protéases responsables

63 Introduction de l’activation de TGM3. Des souris inactivées pour la cathepsine D meurent de maladie neurodégénérative. L’analyse du phénotype de l’épiderme, où cette protéase est impliquée dans la desquamation (cf. chapitre 2.2.3), montre un défaut de barrière, une hyperkératose et une réduction de la détection de l’involucrine, la loricrine, et la filaggrine dans la couche cornée (Egberts et al., 2004). Des analyses immunochimiques en western blotting sur extrait d’épiderme montrent une diminution très importante de la protéolyse de la transglutaminase 1 dans les souris mutées par rapport aux animaux sauvages. D’autre part, l’inhibition de CTSD par la pepstatine A supprime l’activité de la TGM1. L’ensemble de ces résultats suggère un nouveau rôle pour les protéases à cystéine dans l’activation des transglutaminases. Toutefois, ces résultats sont incohérents avec la localisation de ces enzymes, lysosomiales ou sécrétées. Patrick Zeeuwen suggère que les lysosomes de la couche granuleuse, ne pouvant fusionner avec la membrane plasmique disparue et remplacée par l’enveloppe cornée, pourraient se déverser dans le cytosol (Zeeuwen, 2004). Un rôle indirect de ces protéases dans l’activation des transglutaminases ne peut néanmoins pas être exclu.

Figure 16 : étapes de l’assemblage de l’enveloppe cornée (Candi et al., 2005). Il est intéressant de noter qu’à l’exception des protéines desmosomales, la grande majorité des protéines de l’enveloppe cornée sont produites par les gènes situés dans le complexe de différenciation épidermique, l’EDC détaillé dans le chapitre suivant.

64 Introduction

2.2.2.6 Le complexe de différenciation épidermique ou EDC (« Epidermal Differenciation Complex »)

2.2.2.6.1 Historique et description générale En 1956, les 46 chromosomes humains ont été formellement identifiés, décrits comme constitués d'un bras court (petit) p et d'un bras long (queue) q, et classés du plus grand au plus petit. Quelques années plus tard, la coloration au Giemsa après traitement à la trypsine permit la coloration des chromosomes en bandes (ou « G-banding ») et la définition de bandes cytogénétiques. A la fin des années 80, les premières données concernant la localisation cytogénétique en 1q21 de gènes impliqués dans les étapes tardives de la différenciation épidermique sont publiées. Il s’agit des gènes codant pour l’involucrine (Simon et al., 1989), la filaggrine (McKinley-Grant et al., 1989), puis la loricrine (Yoneda et al., 1992) et la trichohyaline (Fietz et al., 1992). Dès 1992, apparaît l’idée que des précurseurs de l’enveloppe cornée comme la loricrine, l’involucrine et la famille des petites protéines riches en proline (SPRR ou SPR, small proline rich) pourraient dériver d’une origine commune (Backendorf and Hohl, 1992). Le terme de « groupe fonctionnel de gènes impliqués dans la différenciation épidermique » apparaît alors (Volz et al., 1993) pour prendre en 1996 pour la première fois le nom de « complexe de différenciation épidermique » (EDC) (Mischke et al., 1996). Le criblage sur membrane de 184 000 clones d’ADNc provenant de plusieurs banques de kératinocytes primaires non différenciés et différenciés, avec pour sonde génomique un YAC contenant les gènes de l’EDC a conduit à l’identification de 5 nouveaux gènes, NICE-1, -2, -3, -4, -5 (Newly Identified Component of EDC) (Marenholz et al., 2001). NICE-1, situé entre les gènes LCE5A (Late Cornified Envelope 5A) et LCE3E, est homologue à cette famille, en possède les caractéristiques et pourrait en constituer un nouveau membre (cf. ci-après). NICE-2, nouveau membre de la famille S100, petites protéines liant le calcium, est situé entre S100A7 et S100A8 et est aujourd’hui connu sous la dénomination internationale HUGO S100A7L. Les autres gènes identifiés, NICE-3, -4, et -5, sont en réalité à l’extérieur de l’EDC. NICE-3 code pour une protéine membranaire hypothétique, NICE-4 et NICE-5 pour des protéines impliquées dans l’ubiquitinylation (respectivement UBAP2L et UBE2Q1, ubiquitin associated protein 2L et ubiquitin-conjugating enzyme 2Q1). Tous les trois sont représentés par un nombre important d’EST dans les banques de données.

65 Introduction

L’année 2001 est aussi celle de la publication de la première séquence assemblée du génome humain (Lander et al., 2001; Venter et al., 2001). Il est devenu aisé d’identifier in silico par simple alignement la localisation d’un gène, et de parcourir une région génomique pour visualiser les ADNc et les EST correspondants (Kent, 2002). La plus récente version de l’assemblage du génome humain (mars 2006) permet ainsi de visualiser au niveau d’un locus en 1q21.3 la famille des gènes codant pour les protéines S100A, la filaggrine et la trichohyaline formant les premiers membres identifiés de la « fused gene family », le groupe LCE (Late Cornified Envelope, anciennement SPRL Small Proline Rich Like ou LEP, Late Envelope Proteins), le groupe SPR ou SPRR (Small Proline Rich proteins), la loricrine et l’involucrine (figure 17).

Figure 17 : représentation schématique de l’EDC.

D’autres gènes spécifiques de la différenciation épidermique ont été récemment identifiés et assignés à l’EDC. C’est le cas de l’hornerine (Makino et al., 2001), la cornuline (Contzler et al., 2005), la répétine (Huber et al., 2005), hKPRP (human Keratinocyte Proline Rich Protein) (Lee et al., 2005), et de deux récepteurs au peptidoglycane, PGlyrp3 et PGlyrp4 (PGRP3 et 4, Peptidoglycan Recognition Protein) (Sun et al., 2005). La synthèse de l’ensemble de ces données permet aujourd’hui une vision précise et probablement exhaustive de l’ensemble des gènes formant l’EDC, regroupés en familles multigéniques.

66 Introduction

2.2.2.6.2 La famille des gènes de fusion: « fused gene family »

Les protéines de cette famille sont formées de deux domaines de liaison au calcium de type « EF hand » dans leur partie amino-terminale, suivis de régions répétées. Les premiers membres identifiés furent la filaggrine (Steinert et al., 1981), et la trichohyaline (Rothnagel and Rogers, 1986). Ces protéines appartiennent par ailleurs à la famille des IFAP (Intermediate Filament Associated Proteins) pour leur rôle dans l’agrégation des filaments intermédiaires de cytokératines. La trichohyaline est une grosse protéine (220 kDa environ), formée de répétitions en tandem de 23 acides aminés. Aucun ADNc complet n’étant disponible, le nombre précis de répétitions reste inconnu. Présente seulement au niveau de rares kératinocytes granuleux isolés (Hamilton et al., 1991), la trichohyaline est détectée principalement dans la gaine épithéliale interne (GEI) et la medulla du follicule pileux (Rogers et al., 1977). Comme la profilaggrine, la trichohyaline est dans un premier temps stockée dans des granules denses aux électrons. Elle est ensuite solubilisée par désimination des résidus arginyl. Contrairement à la filaggrine, il n’a jamais été décrit de maturation protéolytique pour la trichohyaline. Elle agrège les filaments intermédiaires au cours de la différenciation du follicule pileux et est liée aux cytokératines par les transglutaminases. Elle participe en outre au renforcement de l’enveloppe cornée de la GEI à laquelle elle est aussi incorporée (Steinert et al., 2003). L’hornerine, tout d’abord identifiée chez la souris, comprend deux domaines EF-hand, un domaine espaceur intermédiaire et 12 répétitions de 170 acides aminés environ (Makino et al., 2001). Sa composition est très proche de celle de la filaggrine avec laquelle elle colocalise dans les granules de kératohyaline. Synthétisée sous la forme d’un précurseur de 250 kDa environ, elle est détectée en western blotting sous une forme protéolysée en sous unités. La séquence de l’hornerine est fortement conservée entre l’homme et la souris au niveau du domaine EF-Hand et du domaine espaceur S (Takaishi et al., 2005). Comme c’est le cas pour la profilaggrine, les régions répétées sont beaucoup plus divergentes. La structure de cette région présente des répétitions de 39 acides aminés, organisées en 12 domaines de type A ou B :

67 Introduction

De façon étonnante, le gène humain n’est exprimé que dans l’épiderme hyperprolifératif (psoriasis ou cicatrisation) alors que l’orthologue murin est détecté dans tous les épithéliums cornifiés. L’expression de l’hornerine chez l’homme au cours de la cicatrisation est localisée dans les couches les plus différenciées de l’épiderme hyperprolifératif, au niveau de la région proximale de la blessure. La fonction de l’hornerine n’a pas été clairement établie, mais son patron d’expression chez l’homme, restreint aux conditions d’hyperprolifération kératinocytaire, suggère qu’elle pourrait agréger les FI des kératinocytes hyperprolifératifs qui expriment K5 et K15 ou K16. D’autre part, l’épiderme psoriasisique présente une importante réduction de l’expression de la profilaggrine, qui pourrait ainsi être partiellement compensée par une induction de celle de l’hornerine. Il serait intéressant d’étudier l’expression de cette dernière dans d’autres pathologies caractérisées par l’absence de couche granuleuse comme l’ichthyose vulgaire. La cornuline humaine est une protéine de 495 acides aminés qui présente malgré sa taille restreinte les caractéristiques de la « fused gene family » : deux domaines de liaison au calcium de type EF-Hand et 2 répétitions de 60 acides aminés (Contzler et al., 2005). Son poids moléculaire apparent de 70 kDa, comparé au poids moléculaire théorique de 53 kDa, suggère une migration aberrante ou des modifications post-traductionnelles non caractérisées. Aucune protéolyse de cette protéine n’a été mise en évidence. En immunofluorescence, la cornuline est détectée chez l’homme à la périphérie des kératinocytes dans la couche granuleuse de l’épiderme et de l’œsophage, ainsi que dans la GEI du follicule pileux. Toutefois, la cotransfection dans des cellules HeLa de la cornuline avec la transglutaminase 1 (TGM1) n’a pas permis de mettre en évidence de colocalisation, la cornuline étant détectée dans le cytoplasme des cellules et TGM1 à leur périphérie. Sa fonction potentielle de précurseur de l’enveloppe cornée demande donc à être confirmée. La répétine humaine est une protéine de 784 aa présentant un poids moléculaire apparent de 100 kDa. Elle contient deux domaines EF-Hand suivis de 28 répétitions de 12 acides aminés (Huber et al., 2005). Elle est détectée dans la GEI du follicule pileux, les papilles filiformes de la langue, et est faiblement exprimée au niveau de la couche granuleuse de l’épiderme interfolliculaire. Son expression tardive, et sa forte surexpression dans l’épiderme de souris invalidées pour le gène de la loricrine (Koch et al., 2000), ou pour le facteur de transcription klf4 (Segre et al., 1999), suggèrent qu’elle pourrait participer à la formation de l’enveloppe cornée. La répétine semble, comme la trichohyaline, ne pas subir de protéolyse. L’examen des ADNc inclus dans cette région permet le repérage de la « trichohyalin-like 1 » (THHL1) et de l’ ifapsoriasine (IFPS, Intermediate Filament Associated Protein). D’après

68 Introduction l’analyse de leur cadre de lecture prédit, comportant deux domaines EF-Hand amino-terminal suivis de régions répétées, ces séquences pourraient correspondre à de nouveaux membres de la « fused gene family ». La composition et les caractéristiques de chacun des membres identifiés ou présumés de cette famille sont résumées dans le tableau 1.

Tableau 1 : caractéristiques des membres de la famille « fused ». Il est en outre intéressant de noter que seules les protéines comportant de larges domaines répétés sont susceptibles d’être protéolysées : filaggrine et hornerine. Dans ce contexte, IFPS, formée de répétitions de 22 acides aminés, et THHL1, comportant plusieurs répétitions relativement dégénérées d’environ 60 acides aminés, pourraient ne pas subir de protéolyse.

2.2.2.6.3 Famille SPRR (Small Proline Rich proteins)

Trois classes ont été initialement définies en fonction de leur homologie de séquence : SPRR1 (deux membres, SPRR1A et SPRR1B), SPRR2 (six membres chez l’homme, SPRR2A-2G, SPRR2C étant un pseudogène) et SPRR3 (un seul membre) (Gibbs et al., 1993). Une dernière classe de protéines SPRR, comportant un seul membre, SPRR4, a été dernièrement décrite (Cabral et al., 2001a). Ces petites protéines (6 à 25 kDa) composées de courtes répétitions sont classées en 2 types selon l’homologie de leurs domaines terminaux et le nombre d’acides aminés de leurs répétitions (figure 18). Les SPRR de type I comprennent des répétitions de

69 Introduction

8 aa : 6 pour SPRR1, 16 pour SPRR2 et 4 pour SPRR4, et les SPRR de type II comprennent 3 répétitions de 9 aa (SPRR2A-G) (Cabral et al., 2001b).

Figure 18 : organisation des protéines SPRR (Cabral et al., 2001b). Cette étude s’est intéressée aux spécificités d’expression des différents membres de la famille SPRR. SPRR2G et SPRR4 sont préférentiellement exprimés dans le kératinocyte granuleux, alors que les autres membres sont aussi détectés dans d’autres épithéliums stratifiés. SPRR3 n’est pas détecté dans l’épiderme sain mais seulement dans l’œsophage et le col utérin. Dans des kératinocytes primaires en culture, tous les membres, hormis SPRR2F, voient leur expression induite par le calcium. Ces gènes présentent en outre des réponses différentes à l’irradiation aux UV : SPRR4 et SPRR2G, les plus spécifiques de l’épiderme, sont aussi les seuls à être fortement induits après irradiation aux UVC in vitro. Ainsi on constate que le patron d’expression des membres du groupe n’est pas corrélé avec leur type ou leur classe. La diversification de la régulation semble dans ce cas plus importante que la diversification de l’organisation structurale.

2.2.2.6.4 LELP1 (Late cornified Envelope-Like Proline-rich 1) Le gène LELP1, situé entre SPRR2G côté centromérique, et la loricrine côté télomérique, a été nommé ainsi par annotation automatique mais aucune publication le concernant n’est encore parue. La séquence protéique prédite présente deux répétitions relativement dégénérées apparentées à celles du groupe SPRR, toutefois sa composition en acides aminés est plus proche de celle des membres de la famille LCE.

70 Introduction

2.2.2.6.5 Famille LCE (Late Cornified Envelope) Les gènes de cette famille, au nombre de 17, sont localisés entre MSCP et la « fused gene family ». Cette nouvelle terminologie homogénéise les anciennes dénominations (SPRL, Small Proline Rich-like ; LEP, Late Envelope Protein ; xp, skin specific protein). D’expression très tardive dans les kératinocytes granuleux, ils sont parmi les derniers constituants à être incorporés à l’enveloppe cornée. Les transcrits correspondants sont généralement constitués de 2 exons, et codent pour des protéines de 100 acides aminés en moyenne. On distingue 17 gènes LCE (LCE1A-F, LCE2A-D, LCE3A-E, LCE4A, LCE5A), et dispersés parmi eux, NICE-1, xp32 (LEP7) nommé sur le schéma LCEP2, xp33 (C1orf46) et C1orf45 (hKPRP, voir plus loin). A l’origine, xp32 (aujourd’hui LEP7) a été identifié, avec xp5 (aujourd’hui LCE2B) et xp33 par criblage d’une banque d’ADNc de kératinocytes avec un YAC de 1200 kb recouvrant les clusters SPRR et S100 (Zhao and Elder, 1997). En réalité, dans cette étude, xp33 est faiblement détecté en northern blotting sur épiderme humain normal ou Figure 19 : organisation génomique des psoriasique. Le seul ADNc présent dans les gènes de la famille LCE. banques de données ne comporte d’ailleurs pas de cadre de lecture. Concernant xp32, il est intéressant de noter que ce gène a d’abord été attribué à la famille LEP même si très peu de données bibliographiques et expérimentales sont disponibles le concernant (Marshall et al., 2001). L’analyse des EST et ADNc présents dans GenBank (3 au total) indique que ce gène pourrait être composé d’un seul exon avec un cadre de lecture codant pour une protéine putative de 250 acides aminés. Cette séquence protéique

71 Introduction comporte une dizaine de motifs d’environ 9 acides aminés. Elle est peu homologue avec d’autres membres de la famille LCE. Les noms de ces gènes et leurs alias sont indiqués dans le tableau ci-après ainsi que la taille de la protéine prédite. Les membres de la famille LCE sont représentés en noir alors que les autres gènes inclus dans le locus sont représentés en gris. LCE5A LEP18, SPRL5A 118 aa Contrairement aux protéines SPRR, avec C1orf42 NICE-1 99 aa LCE3E LEP17 92 aa lesquelles elles sont parfois confondues, LCE3D LEP16; SPRL6A; SPRL6B 92 aa les 17 protéines LCE ne comprennent pas LCE3C LEP15; SPRL3A 94 aa LCE3B LEP14 95 aa de répétitions en tandem identifiables. LCE3A LEP13 89 aa Elles s’en distinguent aussi par leur C1orf46 xp33 - LCE2D LEP12; SPRL1A 110 aa contenu élevé en serine, glycine et LCE2C LEP11 110 aa LCE2B xp5; LEP10; SPRL1B 110 aa cystéine. Leur nombre pose la question LCE2A LEP9 106 aa de la redondance de leur fonction. La LCE4A LEP8; SPRL4A 99 aa C1orf68 xp32; LEP7 250 aa comparaison de leur séquence en acides C1orf45 hKPRP 579 aa LCE1F LEP6 118 aa aminés et leur localisation génomique a LCE1E LEP5 118 aa permis d’établir une classification en 3 LCE1D LEP4 114 aa LCE1C LEP3 118 aa groupes (LCE1, LCE2, LCE3) et 2 gènes LCE1B LEP2; SPRL2A 118 aa isolés (LCE4A et LCE5A) (Jackson et LCE1A LEP1 110 aa al., 2005). L’expression de ces gènes chez l’homme a été étudiée par PCR quantitative en temps réel dans différents épithéliums pluristratifiés par comparaison au niveau d’expression de la kératine 5, exprimée dans la couche basale de tous ces tissus. Cette analyse a permis de faire émerger des caractéristiques communes aux groupes qu’ils constituent. Les groupes 1 et 2 sont les LCE que l’épiderme exprime majoritairement, en particulier LCE1C et dans une moindre mesure LCE2A et LCE2B. Les gènes du groupe 3 sont exprimés dans les épithéliums stratifiés non cornifiés tels que l’œsophage et la langue. Les gènes LCE4A et LCE5A sont très faiblement exprimés dans les tissus et conditions testés dans l’étude. Il serait intéressant d’analyser leur expression dans d’autres territoires cutanés, au cours de la cicatrisation ou dans le psoriasis. D’autre part, seule l’expression des gènes du groupe 2 est inductible par le calcium. Enfin, les gènes du groupe 1 sont surexprimés lors de l’exposition des kératinocytes aux UVB. Il est intéressant de noter qu’au milieu du locus rassemblant les gènes LCE, entre LCE4A et LCE1F se trouve un gène récemment caractérisé, hKPRP (human Keratinocyte Proline Rich Protein, anciennement C1orf45) (Lee et al., 2005). Contrairement aux LCE, hKPRP code pour une protéine de plus grande taille (579 acides aminés) dont la séquence, riche en proline,

72 Introduction ne montre pas de relation avec les membres de la famille LCE, suggérant une origine différente. In vitro, son expression est induite dans les kératinocytes différenciés en présence de calcium. In vivo, l’ARNm et la protéine sont détectés dans les kératinocytes granuleux les plus superficiels ; elle est surexprimée dans l’épiderme psoriasique. L’expression de hKPRP apparaît chez l’homme vers la 16ème semaine de gestation, de façon concomitante à la stratification de l’épiderme. La présence de régions riches en glutamine en fait un substrat potentiel pour la transglutaminase. Tous ces arguments vont dans le sens d’un rôle de hKPRP dans la formation de l’enveloppe cornée.

2.2.2.6.6 L’involucrine Ce gène, identifié en 1986 (Eckert and Green, 1986), est situé à proximité de la famille SPRR, en position centromérique par rapport à SPRR4. Il code chez l’homme pour une protéine de 585 acides aminés composée de courtes répétitions en tandem (39 répétitions de 10 acides aminés). Son caractère très polymorphe (Djian et al., 1995; Simon et al., 1991) a permis une analyse phylogénétique entre plusieurs souches murines (Djian and Delhomme, 2005). Exprimée précocement, dès la couche épineuse, l’involucrine est incorporée à l’enveloppe cornée comme le montrent des marquages en immunomicroscopie électronique d’enveloppes cornées et le séquençage de peptides obtenus après protéolyse de ces enveloppes (Steinert and Marekov, 1997). Elle pourrait servir ainsi d’échafaudage pour l’assemblage des autres protéines. Sa localisation sous-membranaire lui permet d’être attachée de façon covalente aux hydroxycéramides qui vont progressivement remplacer la membrane plasmique (Nemes et al., 1999). De manière surprenante, des souris invalidées pour le gène de l’involucrine ne développent aucun phénotype particulier, l’épiderme et les follicules pileux étant histologiquement normaux (Djian et al., 2000). Elles ne présentent pas non plus de différences avec des souris sauvages au cours de la cicatrisation. Enfin, les enveloppes cornées sont morphologiquement identiques à celles de souris sauvages. Cette étude n’a pas montré de mécanisme de compensation par surexpression d’autres protéines de l’enveloppe cornée, néanmoins, seules la loricrine et SPRR1 ont été analysées à cet égard. L’expression de l’involucrine a été étudiée depuis de nombreuses années comme modèle de régulation génique lors de la différenciation kératinocytaire (pour une revue voir (Eckert et al., 2004b)). Deux séquences promotrices ont été identifiées : un promoteur distal (-2500) et un promoteur proximal. Le promoteur distal est capable de lier les facteurs de transcription AP1 et Sp1, le promoteur proximal lie C/EBP et AP1. Des facteurs supplémentaires encore

73 Introduction non identifiés pourraient être aussi recrutés et permettre la formation d’un plus large complexe protéique capable d’activer la transcription du gène. Cette activation est sous la dépendance de la voie des MAPK (Mitogen-Activated Protein Kinases) et de PKC (Protein Kinase C).

2.2.2.6.7 La loricrine Le gène codant pour la loricrine est lui aussi situé à proximité de la famille SPRR, en position télomérique par rapport à SPRR2G et LELP1. Involucrine et loricine encadrent donc le locus SPRR. La loricrine est spécifiquement détectée dans la couche granuleuse de l’épiderme et à la périphérie des cornéocytes (Mehrel et al., 1990). Sa composition en acides aminés est similaire à celle d’enveloppes cornées purifiées, dont elle constituerait au moins 70% de la masse protéique (Hohl et al., 1991; Steinert and Marekov, 1997). La loricrine est exprimée tardivement dans les kératinocytes granuleux au sein de « L-granules », plus petits et de forme plus régulière que les « F-granules » de filaggrine (Steven et al., 1990). Très riche en glycine (47% chez l’homme, et plus de 55% chez la souris), la protéine bien qu’insoluble est supposée extrêmement flexible. Selon le modèle de Peter Steinert (Steinert et al., 1991), les acides aminés aromatiques ou aliphatiques dispersés parmi des régions riches en glycine et serine pourraient interagir entre eux et permettre la formation de « boucles glycine » (figure 20), l’ensemble étant éventuellement stabilisé par des ponts disulfures.

Figure 20 : Modèle des « boucles glycine » pour la loricrine.

Deux génodermatoses autosomiques dominantes ont été associées à des mutations de la loricrine, une forme mutilante du syndrome de Vohwinkel (Maestrini et al., 1996) (MIM #604117) et l’érythrokératodermie progressive symétrique (PSEK, MIM #602036) (Ishida- Yamamoto et al., 1997). Ces pathologies sont caractérisées par une kératodermie

74 Introduction palmoplantaire assortie d’un pseudo-aïnhum (constriction circonférentielle des phalanges pouvant aboutir à leur amputation). Des souris invalidées pour le gène de la loricrine présentent un retard dans la formation de la barrière épidermique à la fin de la vie embryonnaire avec une mise en place à E17,5 au lieu de E16,5 pour des souris sauvages, une érythrodermie congénitale et une couche cornée fragilisée (Koch et al., 2000). Néanmoins, ce phénotype disparaît au bout de 4 à 5 jours. La surexpression d’autres protéines de l’enveloppe cornée, telles que SPRR2D, SPRR2H et la répétine pourrait témoigner de la mise en place d’un mécanisme de compensation. Des souris transgéniques exprimant une forme mutée de la loricrine proche de celle associée au variant mutilant du syndrome de Vohwinkel et la PSEK ont été produites par la même équipe (Suga et al., 2000). Les animaux présentent un phénotype proche de celui des patients, avec une ichthyose, un défaut de barrière et des constrictions au niveau de la queue. La sévérité du phénotype est directement corrélée au taux d’expression du transgène. Néanmoins, la loricrine mutée n’interagit pas avec la protéine sauvage et n’est pas incorporée à l’enveloppe cornée mais accumulée dans les noyaux parakératosiques. L’analyse de la séquence protéique prédite montre bien l’apparition d’un signal de localisation nucléaire, dont la fonctionnalité est confirmée par transfection in vitro de la protéine mutée en fusion avec la GFP. Il semble donc que la forme mutée n’agisse pas selon un effet dominant négatif, mais par un gain de fonction. Une autre étude montre que les mutations caractéristiques de ces pathologies (insertion d’un nucléotide en position 662, 709 ou 730) entraînent aussi chez l’homme un décalage du cadre de lecture et l’apparition d’un signal de localisation nucléaire (Ishida-Yamamoto, 2003). Il est proposé que la forme de loricrine mutée interfère indirectement dans la cornification en empêchant la lyse nucléaire, et/ou en perturbant les fonctions nucléaires requises lors de la différenciation. Cette même étude propose de regrouper la forme variante mutilante du syndrome de Vohwinkel et l’érythrokératodermie progressive symétrique sous le terme de kératodermie impliquant la loricrine (LK, « Loricrin Keratoderma »). Le mécanisme par lequel se forment les constrictions conduisant à des mutilations reste encore totalement incompris.

2.2.2.6.8 SMCP, l’intrus ! Situé entre le locus de la famille LCE et l’involucrine, SMCP (Sperm Mitochondria- associated Cysteine-rich Protein, ou MCSP, Mitochondrial Capsule SelenoProtein) se distingue des autres gènes du locus par son patron d’expression. Il est en effet a priori le seul gène situé dans l’EDC très spécifiquement exprimé par un autre type cellulaire autre que le kératinocyte. La protéine correspondante est un constituant tardif de la capsule

75 Introduction mitochondriale, structure spécifique des spermatozoïdes, qui entoure et rigidifie les mitochondries enroulées autour du flagelle, particulièrement actives dans ce type cellulaire, grand consommateur d’ATP (Aho et al., 1996). Des souris invalidées pour ce gène présentent une stérilité associée à un défaut de mobilité des spermatozoïdes (Nayernia et al., 2002). D’après sa localisation au cœur de l’EDC, conservée chez les rongeurs, sa composition en acides aminés et la présence de courtes répétitions en tandem, il a été proposé que SMCP est un paralogue de gènes de l’EDC (Hawthorne et al., 2005). Sa fonction, ainsi que son patron d’expression ont néanmoins considérablement divergé par rapport à ceux des gènes de l’EDC, et il est intéressant de noter que contrairement à la plupart d’entre eux, son promoteur ne comporte pas de boîte TATA.

2.2.2.6.9 Les récepteurs au peptidoglycane PGLYRP3 et PGLYRP4 (ou PGRP, Peptidoglycan Recognition Protein) De nouveaux récepteurs potentiels au peptidoglycane (PGN) bactérien ont été repérés in silico par recherche d’homologues de PGLYRP1, un récepteur au PGN exprimé par les cellules de la moelle osseuse (aussi appelé PGRP-S, Peptidoglycan Recognition Protein, Short) (Liu et al., 2001a). PGLYRP3 (ou α) et PGLYRP4 (ou β) possèdent les domaines PGRP caractéristiques, et sont capables de lier le peptidoglycane de la paroi bactérienne. Ces deux gènes sont situés dans l’EDC, entre la loricrine et S100A9, et sont fortement exprimés dans les kératinocytes granuleux de l’épiderme humain, le follicule pileux, les glandes sébacées et sudoripares, la langue et l’œsophage, plus faiblement dans la cornée et les entérocytes (Lu et al., 2005), ainsi que dans les amygdales et le thymus (Liu et al., 2001a; Sun et al., 2005). Leur expression dans le kératinocyte est augmentée en présence de bactéries. In vitro, ces protéines sont cosécrétées sous forme d’un hétérodimère lié par des ponts disulfure. Elles doivent être N-glycosylées pour jouer leur rôle bactéricide, comme montré par production de protéines recombinantes déglycosylées. Leur activité bactéricide est dépendante du calcium. Contrairement aux peptides antimicrobiens, les PGRP n’agissent pas en perméabilisant la membrane bactérienne mais en se liant au peptidoglycane de surface. Elles sont plus actives que la plupart des peptides antimicrobiens, tuant 99% des bactéries avec des concentrations de 0.1 à 1 µM, et pourraient agir en synergie avec eux pour augmenter leur efficacité. PGLYRP3 et PGYRP4 contiennent chacune deux domaines de liaison au peptidoglycane relativement divergents entre eux (37-42% d’identité) qui pourraient assurer une spécificité de liaison. Le psoriasis est une affection au cours de laquelle les infections microbiennes jouent vraisemblablement un rôle important. De par leur interaction avec les microorganismes au

76 Introduction sein de l’épiderme, et leur localisation au sein de l’EDC, particulièrement du locus de susceptibilité au psoriasis PSORS4 (situé entre les marqueurs D1S2346 près de LELP1 et 140J1D près de S100A16 (Capon et al., 2001)), PGLYRP3 et 4 pourraient jouer un rôle dans cette pathologie multifactorielle. Des tests de déséquilibre de transmission (TDT) ont été effectués sur 849 individus dont 375 individus provenant de 101 familles (parents et au moins un enfant atteint), 282 individus atteints de psoriasis et 192 individus contrôle (Liu et al., 2001a; Sun et al., 2005). Ces analyses génétiques montrent une association entre certains SNP (polymorphismes simples) codants des deux gènes et la susceptibilité au psoriasis. Néanmoins, aucune de ces études ne permet de conclure quant à un lien direct avec la maladie.

2.2.2.6.10 Les gènes S100A

Seize gènes de la famille S100A sont situés en 1q21 et encadrent l’EDC : S100A11 et A10 en position centromérique, et S100A9, A12, A8, A7L1 (A15), A7, A6, A5, A4, A3, A2, A16, A14, A13 et A1 en position télomérique. Les protéines de la famille S100, de faible poids moléculaire (100 acides aminés en moyenne), sont capables de lier le calcium grâce à deux motifs EF-hand, un motif amino- terminal non canonique de faible affinité et un second motif canonique de forte affinité au calcium. Les protéines S100 sont retrouvées dans la cellule sous forme d’homodimères antiparallèles, quelquefois d’hétérodimères. Après liaison au calcium, le dimère change de conformation et devient capable d’interagir avec sa cible (Donato, 2001). Contrairement à la calmoduline, récepteur intracellulaire universel au calcium, les protéines S100 présentent des patrons d’expression et des activités spécifiques. Elles sont impliquées dans une grande variété de processus intracellulaires et extracellulaires (Donato, 2003). Une synthèse concernant l’expression des gènes S100A1 à A15 (S100A7L1) dans l’épiderme humain, étudiée ponctuellement au cours de divers travaux, a été réalisée (Eckert et al., 2004a). Parmi les 16 gènes de la famille, 11 sont exprimés dans l’épiderme. Malgré leur localisation chromosomique, une partie des gènes de cette famille ne s’exprime donc pas dans l’épiderme : S100A1 par exemple est spécifiquement impliquée dans la régulation de la contraction du myocarde (Most et al., 2001). D’autre part, parmi les gènes S100A exprimés dans l’épiderme, seul un petit nombre semble jouer un rôle spécifique dans ce tissu. S100A2 est présente dans le noyau des cellules de la couche basale de l’épiderme où elle s’assemble en homodimères. En présence d’agents

77 Introduction

oxydants tels que H2O2, ces homodimères sont stabilisés par des liaisons disulfure et sont exportés dans le cytoplasme. Cette relocalisation constitue un marqueur précoce de stress oxydatif. S100A7, ou psoriasine, faiblement détectée dans l’épiderme sain, est fortement surexprimée dans l’épiderme psoriasique, où elle pourrait jouer un rôle proinflammatoire d’attraction chimiotactique des lymphocytes CD4+ et neutrophiles comme montré dans un modèle de migration in vitro de ces cellules isolées à partir de sang humain (Jinquan et al., 1996). Elle présente en outre une activité antimicrobienne contre E. coli qui pourrait passer par la séquestration d’ions Zn2+ (Glaser et al., 2005). S100A8 et A9 sont elles aussi très faiblement exprimées dans l’épiderme humain normal et sont surexprimées au cours du psoriasis et de la cicatrisation. Elles sont souvent coexprimées et forment préférentiellement des hétérodimères. Comme S100A7, elles semblent sécrétées de façon indépendante du système endomembranaire (pas de peptide signal). S100A15 (S100A7L1) présente une très forte homologie avec S100A7 (93% d’identité). Surexprimée elle aussi au cours du psoriasis, elle pourrait jouer un rôle très similaire. S100A12 est aussi une protéine proinflammatoire, ligand de RAGE (Receptor for Advanced Glycation Endproducts), récepteur de surface de la superfamille des immunoglobulines. S100A12 est surexprimée dans un grand nombre de pathologies inflammatoires comme la polyarthrite rhumatoïde, la maladie de Crohn ou le psoriasis. Le gène S100A16, caractérisé après la parution de cette revue (Marenholz and Heizmann, 2004), est exprimé dans tous les tissus testés, y compris dans la peau et dans l’oesophage, et est fréquemment surexprimé dans divers types de tumeurs. S100A10 et S100A11 sont capables, en se liant respectivement à l’annexine II et I, de participer au remodelage de la membrane et de former des canaux calciques, facilitant ainsi l’entrée de calcium dans le kératinocyte lors de sa différenciation. S100A11 est aussi capable d’atteindre le noyau, et après phosphorylation, de lier la nucléoline, une phosphoprotéine nucléolaire abondante impliquée dans la régulation de la transcription des ARN ribosomiques et dans la biogenèse et le transport des ribosomes. Cette association libère les facteurs de transcription Sp1 et Sp3 du complexe nucléoline-Sp1/3. L’augmentation de Sp1 et Sp3 libres entraîne l’expression de p21 qui participe à l’arrêt de la prolifération comme démontré par des expériences d’incorporation de thymidine tritiée dans des modèles de kératinocytes primaires et de cellules HaCat en culture (Sakaguchi et al., 2003). S100A10 et S100A11 sont finalement retrouvées incorporées à l’enveloppe cornée et constituent donc des substrats pour les transglutaminases. S100A12, elle aussi incorporée à l’enveloppe cornée, pourrait jour un rôle antimicrobien.

78 Introduction

En conclusion, les protéines S100A ont des fonctions très diverses même s’il est intéressant de noter que certaines d’entre elles, S100A2, S100A7, S100A8, S100A9, S100A12 et S100A15, sont impliquées dans la réponse à l’inflammation dans l’épiderme et sont surexprimées dans divers types de tumeurs (El-Rifai et al., 2002; Ribe and McNutt, 2003).

2.2.2.6.11 Conservation de l’EDC Il est intéressant de noter que le groupe SPRR2 comporte 4 membres supplémentaires chez la souris : sppr2h, sprr2i, sprr2j qui contient une mutation non-sens, et sprr2k. A l’inverse, l’orthologue murin de S100A12 n’existe pas. Des recherches bioinformatiques sur la séquence génomique synthénique chez la souris et le rat ont montré la présence de l’exon 1 immédiatement suivi de la séquence de l’orthologue du gène S100A9 (Fuellen et al., 2004). S100A12 a donc été perdue chez les rongeurs au cours de l’évolution, très probablement par délétion. Chez l’homme, il a été montré que RAGE (Receptor for AGE) est le récepteur de S100A12 (ou ENRAGE, Extracellular Newly identified RAGE binding protein). Cette interaction joue un rôle clé dans la réponse inflammatoire. Le blocage de RAGE chez la souris diminue l’inflammation. Dans ce contexte, le rôle de S100A12 dans ces modèles murins devrait être reconsidéré. L’orthologue murin du gène S100A15 ne semble pas non plus être présent. Dans les banques de données telles que GenBank, des séquences d’ADNc de souris annotées indifféremment s100a7 ou s100a15 correspondent en réalité au même gène, situé comme attendu entre s100a6 et s100a8. Alors que dans la région synthénique chez l’homme deux gènes différents ont été caractérisés, S100A7 et S100A15 (ou S100A7L1), un seul gène semble être présent chez la souris (il en est de même chez le rat) ce qui est probablement à l’origine de cette confusion. En outre S100A7 et S100A15 (S100A7L1) sont très fortement homologues (93% d’identité sur la séquence protéique) et pourraient donc résulter d’une duplication récente.

2.2.2.6.12 Conclusion sur l’EDC Au total, 59 gènes sont présents dans le complexe de différenciation épidermique entre S100A10 et S100A1. Mais la question de savoir ce qu’il convient d’appeler EDC reste posée. Des gènes assignés à la bande cytogénétique 1q21, bien qu’éloignés de la région décrite dans ce chapitre, ont été décrits comme faisant partie de l’EDC : c’est le cas par exemple de NICE- 3, 4 et 5 (cf. historique), ECM1 (Extracellular Matrix protein 1) (Smits et al., 1997), JTB (Jumping Translocation Breakpoint) (Hatakeyama et al., 1999), ou encore ZIRTL (zinc-iron regulated transporter-like) (Lioumi et al., 1999). Les gènes de la « fused family », des familles LCE et SPRR, ainsi que la loricrine et l’involucrine constituent de façon évidente le cœur de

79 Introduction l’EDC de par leur fonction dans la différenciation de l’épiderme et du follicule pileux et leur origine commune. A l’exception de SMCP, spécifiquement exprimé dans le spermatozoïde mais qui dérive néanmoins de la duplication d’un gène de l’enveloppe cornée, tous les gènes de cette région sont très fortement impliqués dans la cornification. PGLYRP3 et 4 jouent quant à elles un rôle bactéricide tout à fait particulier au sein de l’épiderme mais aussi plus généralement des épithéliums de revêtement. Enfin, les gènes de la famille S100A qui encadrent le locus ont des sites d’expression et des fonctions très variées. Un rôle spécifique dans la différenciation épidermique n’est pas clairement établi pour la grande majorité de ces protéines. Certaines d’entre elles ne sont d’ailleurs même pas exprimées dans l’épiderme. On peut alors se demander s’il reste pertinent de citer ces gènes comme faisant partie du complexe de différenciation épidermique. Le nombre d’EST présents dans les banques de données en est l’illustration (figure 21). Une région plus restreinte, comprenant les familles de gènes « fused », LCE, SPRR, l’involucrine, la loricrine et PGLYRP3 et 4, se détache par un nombre d’EST beaucoup plus restreint témoignant de leur expression restreinte.

Figure 21 : nombre d’EST pour les gènes situés dans l’EDC et à proximité.

2.2.2.7 SSC (Stratified epithelium Secreted peptides Complex), un locus contenant les gènes codant pour 3 nouvelles protéines sécrétées Deux articles, publiés en 2004 par une équipe canadienne (Moffatt et al., 2004) et une équipe japonaise (Matsui et al., 2004), font état d’un locus sur la bande cytogénétique 19q13.1 contenant 3 gènes contigus codant pour des protéines sécrétées spécifiques des épithéliums pluristratifiés, KDAP (Keratinocyte Differentiation Associated Protein), SBSN (Suprabasin) et la dermokine (DMKN), sur laquelle nous reviendrons plus en détails.

80 Introduction

KDAP fut identifiée chez le rat par hybridation soustractive suppressive entre de l’épiderme embryonnaire à 14 (périderme) ou à 17 jours (épiderme stratifié) (Oomizu et al., 2000). L’étude de l’expression de l’ARNm par PCR quantitative et hybridation in situ sur embryons et peau de nouveaux-nés montre que KDAP est spécifique de la différenciation kératinocytaire. Des travaux chez l’homme ont montré que la protéine, qui présente un peptide signal dans sa séquence prédite, est bien détectée dans les kératinosomes et dans l’espace extracellulaire au niveau de la couche cornée (Tsuchida et al., 2004). La même technique, utilisée chez la souris (hybridation soustractive suppressive entre kératinocytes basaux et suprabasaux d’épiderme de souris) a permis d’identifier la suprabasine (Park et al., 2002). Deux transcrits alternatifs de 0.7 et 2.2 kb sont spécifiquement détectés au niveau des couches supérieures des épithéliums cornifiés. In vitro, la suprabasine est sécrétée, constitue un substrat pour les transglutaminases 2 et 3, et pourrait donc constituer une nouvelle protéine de l’enveloppe cornée. La dermokine a été quant à elle identifiée chez la souris parallèlement par 2 approches : – signal sequence trap (Moffatt et al., 2004) – hybridation in situ à haut débit sur coupes d’épiderme (Matsui et al., 2004). La première approche a conduit à l’identification de 4 séquences d’intérêt, spécifiques de l’épiderme, désignées sk221, sk128, sk89 et sk30. Les 2 premières correspondent respectivement à KDAP et à la suprabasine, tandis que sk89 et sk30 sont deux isoformes du même gène différant dans leur partie amino-terminale. Toutes ont une séquence prédite comportant un peptide signal, et des expériences de production de protéines recombinantes étiquetées in vitro confirment leur sécrétion dans le milieu de culture. L’hybridation in situ sur coupes d’épiderme montre que sk30 et sk89 sont elles aussi spécifiquement exprimées dans les couches suprabasales de l’épiderme. L’organisation génomique des 3 gènes, contigus chez la souris en 7A3, est conservée chez l’homme en 19q13.12. Nous avons pour notre part identifié la dermokine comme un gène transcrit de manière particulièrement abondante dans les kératinocytes granuleux humains. La seconde étude a permis le clonage de 2 isoformes du même gène, nommées par les auteurs dermokine α et dermokine β, correspondant respectivement à sk30 et sk89 et résultant de l’usage d’un premier exon 5’ alternatif. Elle confirme le profil d’expression, la sécrétion in vitro et la localisation chromosomique des gènes SBSN, dermokine et KDAP sur un même locus baptisé par les auteurs SSC (Stratified epithelium Secreted peptides Complex) (figure 22).

81 Introduction

Figure 22 : organisation génomique du locus SSC chez l’homme et la souris (Matsui et al., 2004). Nous avons montré que chez l’homme, la dermokine subit un épissage complexe et est retrouvée dans l’épiderme sous 4 isoformes principales, α, β, γ et δ. L’isoforme δ est intracellulaire alors que les 3 autres sont sécrétées, et seules les isoformes β et γ, dont l’expression est régulée par le même promoteur, sont spécifiques du kératinocyte granuleux (Toulza et al., 2006), cf. chapitre résultats.

2.2.2.8 Rôle des systèmes jonctionnels dans l’établissement de la fonction barrière

Figure 23 : Les divers dispositifs de jonction classiquement retrouvés au sein des tissus épithéliaux participent à des degrés divers à l’établissement de la fonction barrière de l’épiderme (http://www.unifr.ch/histologie/). 1 : jonctions serrées (dites jonctions imperméables) 2 et 3 : jonctions d’ancrage (2 : ceinture d’adhérence ; 3 : desmosome) 4 : jonctions communicantes

82 Introduction

2.2.2.8.1 Jonctions serrées

Les jonctions serrées, ou zonula occludens, forment une ceinture d’adhérence étanche et continue autour du pôle apical des cellules épithéliales, empêchant la diffusion de fluides et de molécules à travers l’espace intercellulaire. Elles sont vraisemblablement aussi responsables du maintien de la polarité des cellules, en délimitant les domaines membranaires apical et baso-latéral, dont la composition en protéines et en lipides est différente. Enfin, diverses protéines impliquées dans la transduction de signaux et le trafic endomembranaire telles que RAB13 sont associées aux jonctions serrées (Kohler and Zahraoui, 2005). Comme les jonctions d’ancrage, les jonctions serrées comprennent des protéines transmembranaires et des protéines adaptatrices qui permettent la jonction au cytosquelette (figure 24). L'occludine et les claudines (dont plus de 20 membres ont été identifiés) sont des protéines à 4 domaines transmembranaires (Furuse and Tsukita, 2006). Au contraire, les protéines JAM1, 2 et 3 (Junction Adhesion Molecule), qui appartiennent à la superfamille des immunoglobulines, n’ont qu’un seul domaine transmembranaire. ZO-1, ZO-2, et ZO-3, protéines à domaines PDZ (interactions protéine-protéine), MUPP1 (Multi-PDZ Domain Protein-1), et la cinguline, jouent un rôle d’adaptateur au cytosquelette d’actine. La composition moléculaire des jonctions serrées et en particulier le type de claudines exprimées varient en fonction du type cellulaire et de sa différenciation.

Figure 24 : représentation schématique d’une jonction serrée (http://www.ulysse.u-bordeaux.fr/atelier/ikramer/biocell_diffusion/). NB : la cinguline n’est pas représentée sur ce schéma.

83 Introduction

Dans les épithéliums simples, le rôle des jonctions serrées consiste en premier lieu à compartimenter les milieux délimités par les cellules, assurant l’imperméabilité du tissu. Dans l’épiderme, il était admis que la cornification associée à la stratification assurait une barrière efficace entre l’organisme et l’environnement. Le rôle des jonctions serrées dans l’étanchéité de ce tissu a été ignoré jusqu’à la découverte que des souris inactivées pour la claudine 1 présentent un trouble sévère de la barrière épidermique et meurent dans les heures suivant la naissance (Furuse et al., 2002). Cependant, l’absence de claudine 1 n’affecte pas l’organisation kératinocytaire ni la structure des jonctions serrées. D’autres claudines, dont la claudine 4, pourraient compenser l’absence de claudine 1 en termes de structure sans toutefois rétablir l’étanchéité (Bazzoni and Dejana, 2002). Une étude récente s’est intéressée à la distribution des différentes protéines des jonctions serrées dans l’épiderme humain (Brandner et al., 2006). Les claudines 1 et 7, JAM1 et MUPP1 sont détectées en immunofluorescence indirecte sur coupes de peau humaine dans toutes les couches vivantes de l’épiderme alors que ZO1 et la claudine 4 sont exprimées spécifiquement dans la couche granuleuse. Enfin, l’occludine et la cinguline sont présentes uniquement au niveau du pôle apical des kératinocytes granuleux les plus superficiels, là où sont effectivement présentes les jonctions serrées (Brandner et al., 2002) (figure 25). Chez l’homme, une mutation du gène codant pour la claudine 1, exprimée dans le foie et dans l’épiderme, est responsable d’une cholangite sclérosante néonatale associée à une ichthyose et à une alopécie (MIM #607626).

Figure 25 : jonctions serrées d’épiderme murin en microscopie électronique (Furuse et al., 2002). a : cryomicroscopie électronique sur épiderme de souris. b : représentation schématique. c : agrandissement SC : stratum corneum ; SG : stratum granulosum ; DS : desmosome ; TJ : jonction serrée ; flèches : kératinosomes

84 Introduction

Lorsque la fonction barrière est perturbée, notamment en cas d’ichthyose, de psoriasis ou lors de la cicatrisation, certaines protéines des jonctions serrées telles que ZO1 et l’occludine, d’ordinaire restreintes à la couche granuleuse, sont détectées aussi dans la couche épineuse (Malminen et al., 2003; Pummi et al., 2001). Ces observations suggèrent que les jonctions serrées jouent non seulement un rôle dans la fonction barrière de l’épiderme normal, mais peuvent aussi représenter un système de secours en cas d’altération de la couche cornée. Dans le but d’identifier de nouvelles protéines des jonctions serrées, des cellules épithéliales mammaires de souris (lignée Eph4) surexprimant le répresseur de transcription Snail, connu pour son rôle dans la disparition des jonctions serrées au cours de l’embryogenèse, ont été utilisées (Ikenouchi et al., 2005). Le niveau d’expression dans ces cellules a été comparé à celui des cellules parentales à l’aide de puces à ADN pangénomiques (24 000 transcrits murins), et a permis l’identification d’une nouvelle protéine à 4 domaines transmembranaires, la tricelluline. De façon intéressante, cette protéine est localisée dans les jonctions serrées spécifiquement au niveau des contacts entre 3 cellules comme démontré par immunofluorescence et immunomicroscopie électronique (figure 26).

Figure 26 : localisation de la tricelluline en immunofluorescence sur coupes d’intestin grêle, d’estomac et de rein de souris (Ikenouchi et al., 2005). L’inactivation in vitro de la tricelluline par interférence à l’ARN (siRNA) entraîne une désorganisation des jonctions serrées et une perturbation de la barrière transépithéliale des cellules Eph4 (pas d’augmentation à confluence de la résistance électrique transépithéliale et

85 Introduction diffusion paracellulaire de molécules de dextran-FITC de faible poids moléculaire). Les auteurs ont montré l’expression chez la souris de la tricelluline dans tous les tissus épithéliaux testés dont ne faisait pas partie l’épiderme. On peut toutefois penser qu’elle y est aussi exprimée.

2.2.2.8.2 jonctions d’ancrage

Ces jonctions assurent la cohésion mécanique de la cellule avec la lame basale ou les cellules adjacentes. Il en existe 3 types : la ceinture d’adhérence ou zonula adherens, le desmosome ou macula adherens et l’hémidesmosome. La ceinture d’adhérence est reliée au cytosquelette d’actine alors que desmosomes et hémidesmosomes sont ancrés aux filaments intermédiaires. Dans l’épiderme, les hémidesmosomes permettent la jonction des kératinocytes basaux à la lame basale (non détaillés) ; les jonctions d’adhérence et les desmosomes sont présents dans tout l’épiderme. Dans la couche cornée, les desmosomes changent d’aspect morphologique ; ils prennent alors le nom de cornéodesmosomes.

2.2.2.8.2.1 Ceinture d’adhérence ou zonula adherens Parfois appelées jonctions intermédiaires, elles sont formées dans l’épiderme d’une protéine transmembranaire, dépendante du calcium, la E-Cadhérine et de protéines adaptatrices, l’α- caténine, la β-caténine et la γ-caténine (ou plakoglobine) (Jamora and Fuchs, 2002). La E- cadhérine relie la cellule à sa voisine par le biais d’une interaction homophile et sa partie intracellulaire est liée à la β-caténine, elle-même reliée à l’α-caténine. L’α-caténine s’associe à la β-caténine en hétérodimères d’une part, et au cytosquelette d’actine d’autre part (figure 27). La plakoglobine (non représentée sur la figure) s’associe quant à elle directement aux domaines intracellulaires des cadhérines et au cytosquelette d’actine. L’inactivation conditionnelle du gène codant pour l’α-caténine dans l’épiderme de souris (promoteur K14-cre) induit une forte diminution du nombre de ceintures d’adhérence ainsi qu’une importante perturbation de la polarité et de la différenciation des kératinocytes (Vasioukhin et al., 2001a). Une activation de la cascade Ras/MAPK est observée. La β- caténine est une protéine de la famille armadillo qui joue un rôle dans la signalisation Wnt/Lef1. Son inactivation dans l’épiderme de souris bloque la formation de la placode embryonnaire à l’origine des follicules pileux (Huelsken et al., 2001). Lorsque l’inactivation est réalisée chez l’adulte, les follicules pileux sont incapables d’entrer en phase anagène au cycle suivant.

86 Introduction

Figure 27 : représentation schématique d’une ceinture d’adhérence (http://www.ulysse.u-bordeaux.fr/atelier/ikramer/biocell_diffusion/). Il est intéressant de noter qu’une souris invalidée pour la desmoplakine présente, outre un défaut de cohésion des desmosomes, une perturbation dans la formation des jonctions d’ancrage (Vasioukhin et al., 2001b). Réciproquement, l’expression d’une forme mutée à effet dominant négatif de la N-cadhérine dans des kératinocytes murins inactive la fonction de la E- cadhérine et retarde l’assemblage des desmosomes (Amagai et al., 1995). Ainsi, il semble que l’assemblage de ces jonctions soit interdépendant avec celui des desmosomes, même si le mécanisme n’a pas été clairement élucidé.

2.2.2.8.2.2 Desmosomes et cornéodesmosomes Le desmosome permet la jonction de deux cellules adjacentes à la manière d’un rivet. Il apparaît en microscopie électronique comme deux plaques discoïdes cytoplasmiques, denses aux électrons, unies par une région intercellulaire élargie, le cœur (figure 28). Figure 28 : représentation schématique d’un desmosome (http://www.unifr.ch/histologie/) 1 : espace intercellulaire 2 : plaque cytoplasmique 3 : cœur extracellulaire 4 : filaments intermédiaires

87 Introduction

2.2.2.8.2.2.1 La plaque desmosomale Les protéines de la plaque desmosomale permettent la liaison indirecte des filaments intermédiaires aux protéines du cœur desmosomal. Elles appartiennent soit à la superfamille des plakines (desmoplakine, périplakine, envoplakine, épiplakine), soit à celle des protéines à domaine armadillo (plakoglobine et plakophilines). Leur expression varie en fonction du type cellulaire (Kazerounian et al., 2002). Il existe quatre isoformes de plakophilines codées par des gènes localisés sur quatre chromosomes différents ; toutes sont exprimées dans l’épiderme et localisées au niveau de la plaque du desmosome (Hatzfeld and Nachtsheim, 1996; Schmidt et al., 1999). La périplakine (PPL) est détectée dans toutes les couches vivantes de l’épiderme, avec un gradient croissant dans les derniers kératinocytes de la couche épineuse et dans la couche granuleuse (Ruhrberg et al., 1997). Elle coimmunoprécipite avec l’envoplakine (EVPL) comme montré dans des extraits de kératinocytes en culture. En fait, la PPL est capable in vitro de former des homodimères mais s’assemble préférentiellement en hétérodimères et en multimères avec l’EVPL en présence de celle-ci (Kalinin et al., 2004). La recherche de partenaires pour la PPL dans un système double-hybride chez la levure à partir d’une banque de kératinocytes humains a permis l’identification de la kazrine (Groot et al., 2004). Cette protéine, qui ne présente aucune homologie avec d’autres proteins connues, est exprimée dans toutes les couches des épithéliums pluristratifiés et colocalise avec la PPL au niveau des desmosomes des couches suprabasales comme montré en immunofluorescence et immunomicroscopie électronique. La desmoplakine existe dans l’épiderme sous la forme de 2 variants d’épissage, DPI et DPII (Green et al., 1990). Seule l’isoforme DPII est spécifique des épithéliums pluristratifiés alors que DPI est exprimée dans un grand nombre de tissus. Le rôle de la desmoplakine dans la cohésion épidermique est tout à fait essentiel : chez la souris, une inactivation conditionnelle de ce gène induit une fragilité épidermique (Vasioukhin et al., 2001b). Le nombre de desmosomes est équivalent à celui observé chez les souris sauvages, mais les filaments intermédiaires n’y sont pas connectés. De façon surprenante, la rupture de l’épiderme intervient au niveau de la couche basale, où les desmosomes sont « arrachés », les deux plaques restant associées à une seule cellule. Les auteurs de l’étude proposent que dans les couches suprabasales, les desmosomes soient renforcés par l’intervention d’une protéine encore non identifiée. Chez l’homme, une mutation de la desmoplakine à l’état hétérozygote faisant apparaître un codon stop responsable de l’élimination de l’ARNm par la voie du NMD (nonsense mediated

88 Introduction decay) est associée à la kératodermie palmoplantaire striée de type II, vraisemblablement par haploinsuffisance (MIM +125647) (Armstrong et al., 1999). L’expression d’une forme tronquée de desmoplakine ayant perdu ses domaines de liaison aux filaments intermédiaires est associée à une épidermolyse bulleuse acantholytique (rupture au niveau des premières couches épineuses) avec mort néonatale causée par une perte transcutanée massive de fluides (MIM #609638) (Jonkman et al., 2005). Très récemment, une mutation de la desmoplakine affectant spécifiquement l’isoforme I a été décrite dans un syndrome récessif associant une cardiomyopathie, une kératodermie palmoplantaire et des cheveux cassants (MIM #605676) (Uzumcu et al., 2006). A contrario, la périplakine, et l’épiplakine, semblent ne pas jouer de rôle significatif dans l’intégrité de l’épiderme, de souris tout du moins, des modèles murins invalidés pour un de ces gènes ne présentant aucun phénotype (Aho et al., 2004; Spazierer et al., 2006). A l’issue d’un criblage par la méthode de double hydride chez la levure d’une banque de kératinocytes d’épiderme humain, la périphiline a été identifiée comme interagissant avec la région carboxy-terminale de la périplakine (Kazerounian and Aho, 2003). Des analyses en immunofluorescence montrent que cette protéine est exprimée dans toutes les couches de l’épiderme, où elle est d’abord détectée dans le noyau puis colocalisée avec la périplakine à la périphérie des cellules de la couche granuleuse. Elle constitue in vitro un substrat pour la transglutaminase. Elle pourrait constituer une nouvelle protéine de l’enveloppe cornée.

2.2.2.8.2.2.2 Le cœur desmosomal Les cadhérines desmosomales, protéines transmembranaires Ca2+-dépendantes assurant la jonction intercellulaire des desmosomes, se divisent en deux familles, les desmocollines (DSC1, DSC2 et DSC3) et les desmogléines (DSG1, DSG2, DSG3 et DSG4) organisées en locus sur le chromosome 18 (cf. figure 29).

Figure 29 : organisation génomique des cadhérines desmosomales chez l’homme sur le locus 18q12.1 (Kljuic et al., 2003). Le niveau d’expression de ces protéines est lié au stade de différenciation kératinocytaire (Kottke et al., 2006) (figure 30). L’expression de DSG2 et DSC2 est restreinte à la couche basale, DSG3 et DSC3 sont présentes dans tout l’épiderme avec un fort gradient vers la couche basale, alors que DSC1 et DSG1 sont au contraire fortement exprimées dans les

89 Introduction couches suprabasales. La desmogléine 4, récemment identifiée (Kljuic et al., 2003), est exprimée dans la couche granuleuse de l’épiderme interfolliculaire et dans le follicule pileux (matrice, cellules corticales et gaine épithéliale interne) (Bazzi et al., 2006). Elle est la seule desmogléine présente dans la cuticule de la tige pilaire. Une délétion dans ce gène a été identifiée chez des patients présentant une hypotrichose transmise sur le mode récessif (MIM #607903).

Couche cornée

Dsc1 Dsg1 Dsg4 Couche granuleuse

Couche épineuse

Couche basale Dsc3 Dsc2 Dsg3 Dsg2

Figure 30 : profil d’expression des composants des desmosomes de l’épiderme. Le mode d’interaction entre les cadhérines desmosomales, homophile ou hétérophile, reste encore incertain. Une étude de l’association entre les domaines extracellulaires de DSC2 et DSG2 par la technique du Biacore (résonance plasmonique de surface) montre qu’en présence de Ca2+, DSC2 et DSG2 interagissent préférentiellement en hétérodimères, et seule DSC2 est capable de former des homodimères (Syed et al., 2002). Les auteurs proposent que desmocolllines et desmogléines pourraient s’associer de façon hétérophile entre 2 cellules adjacentes et formeraient des dimères latéraux. Des souris inactivées pour le gène Dsg3 présentent des lésions orales ainsi qu’une fragilité épidermique avec rupture entre la couche basale et la première couche épineuse dans les régions soumises à un stress mécanique (Koch et al., 1997). D’autre part, des souris inactivées pour Dsc1 présentent un défaut de barrière associé à une acantholyse (Chidgey et al., 2001). Toutefois, la morphologie des desmosomes dans les couches suprabasales est normale comme montré en microscopie électronique, ce qui

90 Introduction suggère que la perte de Dsc1, seule desmocolline exprimée dans ces cellules, est partiellement compensée par la formation de liaisons homophiles entre desmogléines. Les auteurs n’ont pu mettre en évidence la surexpression d’autres cadhérines desmosomales, toutefois la Dsg4 n’avait pas encore été identifiée au moment de cette étude. Chez l’homme, des mutations de la DSG1 sont associées à une kératodermie palmoplantaire (type I, MIM #148700). Cette pathologie peu sévère, transmise sur le mode autosomique dominant, se caractérise par la présence de plaques hyperkératosiques longitudinales au niveau des paumes des mains et de la plante des pieds et plus particulièrement sur les zones fortement soumises aux contraintes mécaniques. Il apparaît ainsi que la DSC1 tout comme la DSG1 sont indispensables au maintien de la cohésion des couches suprabasales.

2.2.2.8.2.2.3 Les cornéodesmosomes Lors de la transition entre couche granuleuse et couche cornée, les desmosomes changent de morphologie : la plaque est incorporée à l’enveloppe cornée jusqu’à devenir invisible en microscopie électronique et le cœur extracellulaire se densifie. La production au laboratoire d’anticorps monoclonaux de souris immunisées avec des extraits de couche cornée a conduit à l’identification de la cornéodesmosine (CDSN) (Guerrin et al., 1998; Serre et al., 1991). La CDSN est détectée dans la couche granuleuse où elle est sécrétée via les kératinosomes, puis se localise au niveau de la partie extracellulaire des desmosomes, au sein desquels elle a vraisemblablement un rôle d’adhérence homophile (Jonca et al., 2002). Sa protéolyse dans la partie supérieure de la couche cornée joue un rôle fondamental lors de la desquamation (Simon et al., 2001a).

Figure 31 : desmosome de l’épiderme en microscopie électronique et représentation schématique correspondante (Kottke et al., 2006). NB : sur ce schéma, l’auteur a représenté à la fois des interactions homophiles et hétérophiles entre les cadhérines desmosomales.

91 Introduction

Une mutation dans le gène codant pour la cornéodesmosine est associée à une hypotrichose simple du cuir chevelu (Levy-Nissenbaum et al., 2003). Le gène de la CDSN est situé dans le locus majeur de susceptibilité au psoriasis familial, PSORS1, en 6p21.3. Au niveau de ce locus, le gène CDSN est l’un des meilleurs candidats, avec HLA-C, à la susceptibilité à cette maladie à l’étiologie complexe.

2.2.2.8.3 Jonctions communicantes

Les jonctions communicantes (gap junctions) sont constituées de protéines à quatre domaines transmembranaires, les connexines, dont 21 membres ont été identifiés à ce jour chez l’homme (Oyamada et al., 2005). Ces protéines s'assemblent en complexes hexamériques (connexons). Les connexons de deux cellules voisines sont localisés en vis-à-vis au niveau de la membrane, formant un pore homotypique ou hétérotypique reliant le cytoplasme des cellules adjacentes et permettant le passage de molécules de taille inférieure à 1200 Da (métabolites, ions, messagers secondaires tels que AMPc ou IP3). Le rôle des jonctions communicantes a été particulièrement étudié au niveau de l’oreille interne. En effet, des mutations de la connexine 26 (Cx26 ou GJB2, Gap Junction Beta-2), seule isoforme présente dans la cochlée, sont associées à la grande majorité des surdités génétiques (Sabag et al., 2005). Certaines de ces pathologies sont toutefois associées à des troubles au niveau de l’épiderme et le rôle des jonctions communicantes dans ce tissu a connu un intérêt croissant. Les kératinocytes de la couche basale de l’épiderme interfolliculaire expriment la connexine 26 de façon faible, alors qu’elle est plus abondante dans l’épiderme palmoplantaire, le follicule pileux et les glandes sudoripares (Salomon et al., 1994). L’analyse de souris inactivées pour le facteur de transcription Klf4, impliqué dans la mise en place de la fonction barrière, montre une forte surexpression de la connexine 26 (Djalilian et al., 2006). Des souris transgéniques exprimant la Cx26 de façon ectopique sous le contrôle du promoteur de l’involucrine présentent un défaut de cicatrisation cutanée avec persistance de l’état hyperprolifératif et infiltration par des cellules inflammatoires. La Cx26 pourrait jouer un rôle dans la physiopathologie du psoriasis, dans la mesure où elle est également surexprimée au niveau des lésions. Dans les couches différenciées, la connexine 43 est la plus fortement exprimée, mais on retrouve aussi les connexines 37 et 31. Certaines mutations de la connexine 26 sont responsables d’une surdité associée soit à une kératodermie palmoplantaire diffuse (Richard et al., 1998b), soit à une kératodermie palmoplantaire mutilante (variant du syndrome de Vohwinkel) (Maestrini et al., 1999), soit enfin à une ichthyose hystrix (Janecke

92 Introduction et al., 2005). Toutes ces pathologies sont causées par des substitutions localisées dans le premier domaine extracellulaire de la connexine, et pourraient induire un défaut d’assemblage des connexons. Des mutations dans le gène codant pour la connexine 31 sont responsables du syndrome Mendes Da Costa (érythrokératodermie variable) caractérisé par la présence de plaques cutanées érythémateuses associées à une hyperkératose et à une surdité (Richard et al., 1998a). Les mécanismes physiopathologiques de ces génodermatoses ne sont pas encore clairement établis, toutefois ces pathologies suggèrent que les jonctions communicantes jouent un rôle, direct ou indirect, dans la physiologie de l’épiderme.

2.2.2.9 Rôle des lipides intercornéocytaires

Il est admis que l’imperméabilité de la couche cornée est assurée par les lipides extracellulaires organisés en feuillets lamellaires ou lamellae (Swartzendruber et al., 1989). En microscopie électronique, les lipides présentent une organisation alternant bandes denses aux électrons et bandes claires, qui correspondent, respectivement, aux groupements polaires et aux chaînes carbonées apolaires. L’espace intercornéocytaire contient une quantité variable de triglycérides, d’esters de cholestérol et de squalènes, provenant des glandes sébacées. Cependant, les lipides de la couche cornée sont principalement synthétisés par les kératinocytes. Une analyse en chromatographie en couche mince montre que la couche cornée contient, selon les sites anatomiques, 20-30% de sphingolipides (majoritairement des céramides), 15-20% de cholestérol, 15-20% d’acides gras libres, 2-6% de sulfate de cholestérol et 3-5% de phospholipides (Lampe et al., 1983). Au niveau palmoplantaire, la couche cornée est plus riche en cholestérol (33%) et en sphingolipides (35%) au détriment des lipides spécifiques des glandes sébacées, absentes dans ce territoire. Les kératinocytes granuleux renferment des organites membranaires dérivés de l’appareil de Golgi, les kératinosomes ou granules lamellaires, qui constituent environ 10% du volume de leur cytoplasme. Les modèles les plus récents indiquent que les kératinosomes correspondent en réalité à un réseau tubulo-vésiculaire continu depuis l’appareil de Golgi jusqu’à la membrane plasmique du pôle apical des kératinocytes granuleux (Norlen, 2001). Ce compartiment représente vraisemblablement un système de stockage des lipides à destinée extracellulaire avant leur sécrétion. Les kératinosomes transportent aussi une partie des enzymes chargées de la transformation des lipides, telles que la stéroïde sulfatase, la beta- glucocérébrosidase et la sphingomyélinase, les phospholipases A2 sécrétées. Enfin, ils contiennent également d’autres protéines sécrétées telles que la CDSN et les protéases et inhibiteurs de protéases impliqués dans la desquamation. A ce jour, aucune voie de sécrétion

93 Introduction alternative n’a été mise en évidence dans cette cellule et on peut supposer que toutes les protéines extracellulaires transitent par le kératinosome. Une étude en immunofluorescence et en immunomicroscopie électronique de plusieurs molécules sécrétées par les kératinosomes comme KLK7 (kallikrein 7, ou SCCE, Stratum Corneum Chymotryptic Enzyme), CDSN, la cathepsine D (CTSD) ou les glucosylcéramides montre que ces molécules sont transportées séparément depuis l’appareil de Golgi vers le pôle apical des kératinocytes granuleux (Ishida-Yamamoto et al., 2004). Toutes les cargaisons testées dans cette étude semblent acheminées indépendamment sous la forme d’agrégats vers la membrane plasmique. Dans le cas de KLK7, dont CDSN constitue un substrat au cours de la desquamation (cf. chapitre 2.2.3), cette séparation pourrait avoir un rôle fonctionnel en empêchant une protéolyse prématurée de la CDSN. Toutefois, certaines enzymes transportées par les kératinosomes, comme les cathepsines ou certaines enzymes du métabolisme des lipides, ont dans d’autres tissus une localisation lysosomiale (Madison et al., 1998). Le mécanisme exact de biogenèse des kératinosomes reste donc partiellement incompris. Les transporteurs de la famille ABC (ATP-Binding Cassette) constituent une superfamille de protéines à plusieurs domaines transmembranaires, évolutivement très conservées, formant un canal qui permet le transport ATP-dépendant de biomolécules à travers les membranes. Les membres de la sous-famille ABCA participent au transfert de lipides à travers les membranes d’un compartiment à l’autre de la cellule (Kaminski et al., 2006). L’ichthyose harlequin (MIM #242500), génodermatose transmise sur le mode autosomique récessif, généralement létale, est caractérisée par une hyperkératose, une compaction de la couche cornée, des fissures cutanées profondes, un ectropion et un eclabium. Récemment, des mutations inactivant l’expression du transporteur ABCA12 (mutations non-sens et délétions) ont été identifiées chez ces patients (Kelsell et al., 2005; Lefevre et al., 2003). Des substitutions d’acides aminés dans la protéine sont quant à elles associées à l’ichthyose lamellaire de type II (MIM #601277), pathologie hétérogène transmise sur le mode

94 Introduction autosomique récessif. Des analyses en immunomicroscopie électronique montrent que ABCA12 est exclusivement localisé à la membrane des kératinosomes (Akiyama et al., 2005). L’épiderme des individus atteints d’ichthyose harlequin présente un défaut d’organisation des lipides en lamellae. Leurs kératinocytes, établis en culture et différenciés in vitro, présentent un défaut de sécrétion des glucosylcéramides, ce phénotype étant réversible par transfert du gène sauvage dans ces cellules. Des analyses en microscopie électronique montrent une accumulation des kératinosomes dans le cytosol près de la membrane plasmique et des structures lamellaires perturbées. Ces travaux confirment ainsi un rôle direct pour ABCA12 dans la sécrétion des lipides. – Le cholestérol Le cholestérol sécrété par les kératinosomes provient de la synthèse de novo dans les couches vivantes de l’épiderme. Une petite proportion est transformée dans les couches suprabasales en sulfate de cholestérol par la cholestérol-sulfotransférase. Ce sulfate de cholestérol stimule la différenciation kératinocytaire par activation de la PKC et par régulation transcriptionnelle de l’involucrine et de la transglutaminase 1 via l’induction de complexes AP-1 contenant Fra1, Fra2 et JunD (Hanley et al., 2001). Le sulfate de cholestérol est également un inhibiteur de serine protéases et retarde la desquamation chez la souris (Sato et al., 1998). Dans la couche cornée, le sulfate de cholestérol est progressivement converti en cholestérol par la stéroïde sulfatase (STS) (figure 32).

Figure 32 : cycle du sulfate de cholestérol dans l’épiderme normal (Elias et al., 2004). Une déficience de cette enzyme est responsable d’une ichthyose récessive liée à l’X (MIM +308100) par accumulation de son substrat, le sulfate de cholestérol, dans la couche cornée de

95 Introduction l’épiderme, retardant la desquamation. Les malades présentent une activité réduite des serine protéases, et un retard dans la protéolyse des cornéodesmosomes (Elias et al., 2004). – Les céramides Les céramides sont des sphingolipides formés d’un groupement sphingosine lié à un acide gras par une liaison amide. Dans la couche cornée, 9 espèces de céramides sont présentes et diffèrent entre elles par leur groupement sphingosine et par la longueur de leur chaîne carbonée. Parmi eux se distinguent 2 espèces d’ω-hydroxycéramides à très longue chaîne (30- 32 C) qui traversent les deux hémicouches de la membrane plasmique et sont liées aux protéines de l’enveloppe cornée au moment de sa formation, en particulier l’involucrine, sous l’action de la transglutaminase 1 (Nemes et al., 1999). Cette couche de céramides fixés de façon covalente autour de l’enveloppe cornée pourrait servir de matrice pour l’orientation des lamellae lipidiques (Swartzendruber et al., 1989). Il existe 2 voies principales de synthèse des céramides, par dégradation du glucosylcéramide par la beta-glucocérébrosidase ou de la sphingomyéline par la sphingomyélinase, et par synthèse de novo par la condensation de serine et de palmitoyl-CoA par la serinepalmitoyltransférase et la céramidesynthase (Choi and Maibach, 2005). Les enzymes impliquées dans la voie de dégradation des glucosylcéramides et de la sphingomyéline agissent en synergie avec des cofacteurs, les saposines ou SAP (sphingolipid activator proteins). Les saposines A, B, C et D sont de petites glycoprotéines de 80 acides aminés environ provenant de la protéolyse d’un précurseur commun, la prosaposine ou pSAP. Toutes interviennent dans l’activation des hydrolases des glycosphingolipides mais diffèrent par leur mode d’action et leur spécificité (Kolter and Sandhoff, 2005). Des souris inactivées pour le gène de la prosaposine meurent d’une neuropathie associée à une dégénérescence de la myéline (Fujita et al., 1996). L’analyse phénotypique montre que malgré l’accumulation de glucosylcéramides, la quantité de céramides de la couche cornée n’est que modérément réduite (Doering et al., 1999). Les kératinosomes sont désorganisés et l’épaisseur de la couche cornée est réduite. Toutefois, ce phénotype cutané est peu sévère comparé au phénotype neuronal, et d’autres protéines encore non identifiées, spécifiques de l’épiderme, pourraient compenser la perte de la prosaposine. De façon semblable, des mutations chez l’homme dans le gène de la prosaposine (MIM +176801) sont responsables d’une leucodystrophie métachromatique sans qu’aucun phénotype épidermique n’ait été décrit. – Les acides gras libres Ils proviennent quasi-exclusivement du catabolisme des glycérophospholipides, constituants principaux de la membrane plasmique des cellules, par des phospholipases A2. Ces enzymes

96 Introduction hydrolysent les liaisons ester des glycérophospholipides, libérant un lysophospholipide et deux acides gras. Ainsi, les glycérophospholipides disparaissent progressivement et ne sont plus détectés qu’à l’état de traces au niveau de la couche cornée. L’application topique d’inhibiteurs des phospholipases A2 entraîne chez la souris une perturbation de la fonction barrière, restaurée par l’application d’acides gras libres (Mao-Qiang et al., 1995). Plusieurs phospholipases A2 sécrétées ont été identifiées récemment dans l’épiderme mais seules sPLA2-IB, -IIF, et –X sont spécifiques des kératinocytes granuleux. Leur fonction précise n’a pas encore été clairement établie (Haas et al., 2005).

2.2.3 La desquamation

L’homéostasie épidermique est assurée par le détachement et l’exfoliation des cornéocytes les plus superficiels, processus désigné la desquamation (du latin desquamare, écailler). C’est l’étape ultime du programme de différenciation ; dans des conditions normales, elle conduit à la perte insensible d’environ 1000 cellules / cm2 / h (Roberts and Marks, 1980). C’est un processus actif qui passe par la protéolyse progressive des cornéodesmosomes (cf. chapitre 2.2.8.2.2.3). Cette protéolyse concerne en premier lieu les cadhérines desmosomales DSC1 et DSG1, et la CDSN. Parmi la dizaine de protéases à serine sécrétées identifiées dans la couche cornée, la SCTE (Stratum Corneum Tryptic Enzyme ou KLK5, kallikréine 5) (Ekholm and Egelrud, 2000) et la SCCE (Hansson et al., 1994) semblent jouer un rôle majeur. In vitro, dans des conditions de pH acide proches de celles de la couche cornée, les composants du cornéodesmosome sont des substrats pour la SCTE. SCCE est quant à elle capable de cliver efficacement CDSN et DSC1 (Caubet et al., 2004). S’appuyant sur ces données et celles de la littérature, une représentation schématique des acteurs principaux intervenant dans la régulation de la desquamation a été proposée (figure 33). Les cathepsines sont des protéases lysosomiales. Chez l’homme, une mutation de la cathepsine C (CTSC) est responsable du syndrome de Papillon-Lefèvre, une kératodermie palmoplantaire associée à une périodontopathie (MIM #245000). Peu d’études quant au rôle de cette protéase dans l’épiderme en général et dans la desquamation en particulier sont disponibles. Sa fonction dans les lymphocytes T est toutefois bien documentée. Elle y active les granzymes A et B par protéolyse des proformes. Le granzyme B, sécrété par les kératinocytes, intervient dans la défense antimicrobienne (Berthou et al., 1997). On peut spéculer sur un rôle de CTSC dans l’activation du granzyme B ou celle d’autres protéases jouant un rôle dans la différenciation épidermique (Meade et al., 2006).

97 Introduction

Figure 33 : modèle de régulation de la desquamation (Caubet et al., 2004). L’inhibition de la cathepsine D diminue d’un tiers le détachement des cornéocytes à pH acide dans un modèle de desquamation de couche cornée plantaire in vitro (Horikoshi et al., 1999). Cette protéase à acide aspartique est détectée en immunomicroscopie électronique dans l’espace intercornéocytaire où elle colocalise avec les cornéodesmosomes (Igarashi et al., 2004). Ces arguments sont en faveur de l’implication de la CTSD dans la desquamation. L’activité protéolytique responsable de la desquamation est régulée par la présence d’un grand nombre d’inhibiteurs de protéases. On peut citer SLPI (Secretory Leukocyte Protease Inhibitor) et SKALP (Skin derived AntiLeukoProteinase, également désigné élafine), deux protéines de petite taille dont les spectres d’inhibition sont complémentaires (Heinzel et al., 1986; Wiedow et al., 1990). SLPI présente une meilleure inhibition vis-à-vis des protéases de la famille de la chymotrypsine telles que SCCE. SKALP est au contraire plus efficace comme inhibiteur de protéases de la famille de la trypsine telles que SCTE. Alors que ces deux inhibiteurs sont très faiblement détectés dans l’épiderme sain, ils sont fortement surexprimés dans les couches différenciées de l’épiderme psoriasique et lors de la cicatrisation (Ashcroft et al., 2000; Schalkwijk et al., 1990). Un autre inhibiteur de protéases, LEKTI (LymphoEpithelial Kazal-Type-related Inhibitor), produit du gène SPINK5 (Serine Protease INhibitor, Kazal-type 5), a été plus récemment caractérisé (Bensch et al., 1995). Des

98 Introduction mutations du gène codant pour cet anti-trypsine sont responsables du syndrome de Netherton (Chavanas et al., 2000), génodermatose caractérisée par une ichthyose érythrodermique, une anomalie spécifique des cheveux (cheveux bambous) et une atopie sévère avec un taux d’IgE élevé (MIM #256500). L’inactivation de ce gène par mutagenèse insertionnelle reproduit le phénotype de la maladie chez la souris (Yang et al., 2004). Les animaux présentent une fragilité desmosomale associée à une protéolyse prématurée de la cornéodesmosine. Dans un autre modèle animal, reproduisant la mutation présente chez les patients (R820X), une protéolyse augmentée de la profilaggrine en filaggrine a été mise en évidence (Hewett et al., 2005). Enfin, une 3ème étude fait état d’une hyperactivité des protéases SCCE et SCTE et d’une protéolyse anormale de la desmoplakine et de la desmogléine 1 (Descargues et al., 2005). Ces résultats divergent dans la mise en évidence des cibles de LEKTI. Il apparaît tout de même comme un des régulateurs clé du processus de desquamation.

2.2.4 Rôle antimicrobien des kératinocytes

Les kératinocytes sécrètent un grand nombre de molécules antimicrobiennes, lipides, peptides, récepteurs toll-like et chimiokines. Les défensines, les cathélicidines, certains membres de la famille S100A et PGRP (cf. chapitre 2.2.2.6), la RNase7 ou l’adrénomédulline font partie des peptides antimicrobiens. Outre ces molécules spécialisées, certaines protéases ou inhibiteurs de protéases intervenant dans la desquamation pourraient jouer un rôle dans la défense antimicrobienne comme SKALP ou SLPI. Les peptides antimicrobiens de l’épiderme sont synthétisés par les cellules immunitaires qu’il contient, les glandes sudoripares ou les kératinocytes. Nous détaillerons plus particulièrement ceux qui sont synthétisés par le kératinocyte granuleux.

2.2.4.1 Les défensines

Chez l’homme, 2 grandes familles de défensines sont produites, les défensines α et β, actives sur un large spectre de bactéries gram +, telles que Staphylococcus aureus ou Propionibacterium acnes, et gram -, telles que Pseudomonas aeruginosa ou Escherichia coli, ainsi que sur la levure Candida albicans. Ces peptides hydrosolubles d’une trentaine d’acides aminés sont riches en cystéines et forment des ponts disulfure qui les rendent résistants aux protéases. Chargés positivement, ils déstabilisent la paroi très négative des bactéries. Dans l’épiderme, 3 défensines β (hBD, human Beta Defensin) sont exprimées par les kératinocytes, hBD1, hBD2 et hBD3. Les gènes, formés de 2 exons, sont situés sur un même locus en 8p23.1. La stimulation de kératinocytes par les défensines β (ou par la cathélicidine) provoque

99 Introduction la synthèse de nombreuses cytokines, en particulier IL18, cytokine proinflammatoire surexprimée dans le psoriasis et la dermatite atopique (Niyonsaba et al., 2005). Une étude du locus 8p23.1 par MAPH (Multiplex Amplifiable Probe Hybridization), une technique quantitative de détection du nombre de copies d’une séquence, a montré que cette région chromosomique était présente chez l’homme en 2 à 12 copies par génome haploïde (Hollox et al., 2003). Un tel polymorphisme pourrait influer sur le taux d’ARNm des défensines β et avoir ainsi des conséquences dans l’immunité adaptative. A ce jour un tel lien n’a toutefois pas pu être mis en évidence.

2.2.4.1.1 hBD1 La défensine hBD1, identifiée initialement dans le plasma (Bensch et al., 1995), est fortement exprimée dans de nombreux tissus épithéliaux. Elle est synthétisée de façon constitutive par les kératinocytes (Fulton et al., 1997). Les ARNm de hBD1 sont détectés par hybridation in situ dans les couches suprabasales (Ali et al., 2001) et des analyses en immunohistochimie confirment cette localisation (Sorensen et al., 2005). hBD1 présente une activité bactéricide contre E. coli, P. aeruginosa, S. aureus et C. albicans. In vitro, elle présente des propriétés chimioattractives envers les cellules dendritiques et les lymphocytes T, qui passeraient par le récepteur CCR6 (Chemokine CC motif Receptor 6) (Yang et al., 1999).

2.2.4.1.2 hBD2 Le microséquençage en spectrométrie de masse de peptides à activité antibactérienne issus de squames d’épiderme psoriasique a permis l’identification de hBD2 (Harder et al., 1997). Dans l’épiderme normal, l’immunoréactivité contre hBD2 est localisée dans la couche granuleuse et la couche cornée. Des analyses en immunomicroscopie électronique montrent que hBD2 est sécrétée dans l’espace intercornéocytaire (Oren et al., 2003). hBD2 présente une activité antimicrobienne contre E. coli, P. aeruginosa et C. albicans. Son pouvoir bactéricide contre S. aureus n’a pas été clairement établi. Dans un modèle d’épiderme reconstitué, son expression est très fortement inductible par des surnageants de monocytes traités au LPS (LipoPolySaccharide, composant de la paroi des bactéries à Gram négatif), cette activation étant IL1 dépendante (Liu et al., 2003).

2.2.4.1.3 hBD3 Deux groupes ont identifié simultanément hBD3 : par étude biochimique de squames d’épiderme psoriasique (Harder et al., 2001) et par analyse de la séquence d’une région génomique contenant le gène de hBD2 (Jia et al., 2001). Elle est exprimée dans les

100 Introduction kératinocytes suprabasaux de l’épiderme. hBD3 a la même activité antimicrobienne que hBD1. Son expression est inductible par le LPS ou le PGN. Comme hBD2, hBD3 est induite en présence d’IL1.

2.2.4.2 Les cathélicidines

La cathélicidine LL-37 (ou CAMP, Cathelicidin AntiMicrobial Peptide) est le seul membre de cette famille présent chez l’homme. Le gène codant pour LL-37 contient 4 exons, et la protéine produite comporte en plus du peptide actif, un peptide signal et une région cathéline de fonction inconnue qui sera séparée de la région active carboxy-terminale par clivage. Son activité antibactérienne à large spectre passe par la perforation de la paroi grâce à une conformation en hélice α. Originellement découverte dans les granulocytes, la cathélicidine LL-37 a été détectée dans les kératinocytes de l’épiderme où elle est exprimée lors de l’inflammation (Frohm et al., 1997) et de la cicatrisation (Dorschner et al., 2001). Dans l’épiderme normal, LL-37 est exprimée par les kératinocytes granuleux et son orthologue murin, produit du gène Cnlp, a été localisé en immunomicroscopie électronique dans les kératinosomes (Braff et al., 2005). Elle joue aussi un rôle chimioattractif pour les cellules immunitaires et est capable d’induire la dégranulation des mastocytes (pour une revue récente, voir (Durr et al., 2006)). Des souris invalidées pour Cnlp présentent une sensibilité accrue aux infections cutanées à streptocoques (Nizet et al., 2001). Comme les défensines β, la cathélicidine est capable d’induire la synthèse de cytokines (Niyonsaba et al., 2005).

2.2.4.3 Autres protéines

2.2.4.3.1 L’adrénomédulline Ce peptide de 52 aa a été décrit initialement dans la médullosurrénale pour ses effets vasodilatateur et hypotenseur (Kitamura et al., 1993). L’adrénomédulline (AM) est synthétisée sous la forme d’un précurseur de 185 aa, la préproadrénomédulline (Allaker et al., 1999). Elle est détectée en immunohistochimie dans les couches suprabasales de l’épiderme, les mélanocytes, les glandes sudoripares, sébacées, et le follicule pileux (Muller et al., 2003). In vitro, l’AM présente une activité bactéricide contre E. coli, S. aureus et P. acnes. La colocalisation dans l’épiderme avec ses récepteurs (L1 et CRLR, calcitonin receptor-like

101 Introduction receptor) suggère qu’elle pourrait intervenir dans des mécanismes de régulation autocrine ou paracrine dans ce tissu.

2.2.4.3.2 SKALP et SLPI SKALP et SLPI sont deux inhibiteurs de protéases de faible poids moléculaire spécifiques de la couche granuleuse (cf. chapitre 2.2.3). SKALP présente in vitro une activité bactéricide envers P. aeruginosa et dans une moindre mesure S. aureus (Simpson et al., 1999) et SLPI présente une activité bactéricide envers E. coli et S. aureus (Hiemstra et al., 1996). Leur rôle antimicrobien potentiel in vivo dans l’épiderme et leur mode d’action sont toutefois inconnus.

2.3 Régulation de l’expression génique au cours de la différenciation

2.3.1 Rôle du calcium L’épiderme présente un gradient de calcium de la profondeur vers la surface des couches vivantes, puis sa concentration diminue dans la couche cornée, comme démontré par une analyse ionique de ce tissu aux rayons X (Forslind, 1986). In vitro, l’augmentation de la concentration de calcium dans le milieu de culture est devenue une méthode très classique pour induire la stratification et la différenciation des kératinocytes (Pillai et al., 1990). La perturbation de la barrière épidermique chez la souris par application topique d’acétone ou par délaminage au ruban adhésif entraîne une disparition du gradient calcique qui réapparaît 6h plus tard, parallèlement à la restauration de la fonction de barrière et à la sécrétion de kératinosomes (Menon et al., 1992). Malgré un lien évident entre la présence d’un gradient calcique épidermique et la différenciation des kératinocytes, les mécanismes de mise en place de ce gradient sont encore inconnus. Une étude de la distribution du calcium dans l’épiderme de souris montre que la présence d’un gradient calcique est toujours lié à une barrière fonctionnelle, quel que soit le moyen utilisé pour la perturber (délaminage, température, occlusion, inhibiteur de synthèse du cholestérol) (Elias et al., 2002). Les auteurs proposent donc que la formation du gradient calcique soit un processus passif qui ne dépend que de l’état de la barrière épidermique. De nombreuses protéines impliquées dans la différenciation épidermique sont directement régulées par la concentration calcique. Citons les transglutaminases, les cadhérines, les peptidyl-arginine désiminases, la glucosylcéramide synthase, les protéines S100... Les pompes à calcium ATP2A2 (ATPase, Ca2+-transporting, type 2A, member 2) et ATP2C1 (type 2C, member 1) sont responsables du maintien d’une concentration calcique très basse

102 Introduction dans le cytosol. Des mutations de ces gènes sont associées respectivement à la maladie de Darier (MIM #124200) et à la maladie de Hailey-Hailey (MIM #169600). La maladie de Darier, transmise sur le mode autosomique dominant (haploinsuffisance), se caractérise par la présence de bulles, une ichthyose et une dystrophie unguéale. L’analyse histologique montre une hyperkératose, un détachement des kératinocytes au niveau de la couche épineuse, accompagné d’une acantholyse. En microscopie électronique, une perte de cohésion au niveau des desmosomes et une désorganisation du réseau de filaments intermédiaires qui s’agrègent à la périphérie du noyau sont mises en évidence. Ces observations suggèrent que la maladie résulte d’un défaut de formation des complexes desmosomes - filaments intermédiaires de cytokératines. La maladie de Hailey-Hailey est une affection très voisine, mais où les ongles ne sont pas atteints. Le mécanisme physiopathologique de ces deux affections n’a pas été clairement établi. Des modèles animaux de souris inactivées sur un allèle pour ATP2A2, produits par des équipes différentes, ne reproduisent pas le phénotype humain. Des souris inactivées sur les 2 allèles n’ont pu être produites. La première étude publiée montre un défaut modéré de contractilité des cardiomyocytes, où la protéine est normalement fortement exprimée (Ji et al., 2000). La même équipe a ensuite décrit une augmentation du nombre de carcinomes épidermoïdes chez les souris adultes (Liu et al., 2001b). Les mêmes souris ont été analysées par une autre équipe, qui s’est intéressée à la signalisation calcique au niveau moléculaire, et en particulier à l’exocytose Ca2+-dépendante, et a montré une faible perturbation de cette fonction (Zhao et al., 2001). L’ensemble de ces résultats est toutefois largement discordant avec le phénotype observé dans les pathologies humaines sans que ceci ne soit discuté par les auteurs de ces travaux. Enfin, aucune inactivation d’ATP2C1 n’a été décrite à ce jour chez la souris.

2.3.2 Facteurs de transcription On peut distinguer plusieurs étapes clés dans la régulation génique de la différenciation épidermique (pour une revue, voir (Dai and Segre, 2004)). Au cours de l’embryogenèse, le périderme, épithélium monocouche dérivé du feuillet ectodermique, exprime la cytokératine K18, spécifique des épithéliums simples. C’est la perte de l’expression de cette protéine au profit du couple de cytokératines K5-K14 sous l’impulsion de TAp63 (isoforme longue

103 Introduction transactivatrice) qui témoigne de l’initiation du programme de stratification (Koster et al., 2004). Dans l’épiderme adulte cohabitent ensuite 2 types de régulations, celle qui conduit au maintien du potentiel prolifératif des cellules souches, impliquant c-Myc et la balance TAp63 / ∆Np63 (isoforme sans domaine transactivateur amino-terminal), et celle qui aboutit à la différenciation terminale. C’est celle-ci que nous allons détailler plus avant.

2.3.2.1 Initiation de la différenciation terminale

2.3.2.1.1 Protéines de la famille Rb Les facteurs de transcription de la famille Rb (retinoblastoma), RB1 (pRb), RBL1 (p107) et RBL2 (p130) sont des inhibiteurs de la transition G1/S du cycle cellulaire (Weinberg, 1995). La délétion de pRb chez la souris conduit à la mort des animaux entre E13 et E15 (Lee et al., 1992). Dans l’épiderme, l’inactivation conditionnelle de pRb sous contrôle du promoteur K14 induit une réduction du pelage (Ruiz et al., 2004). L’épiderme est hyperprolifératif avec persistance de mitoses ectopiques au niveau des couches supérieures. De manière surprenante, l’hyperprolifération est associée à une diminution du nombre de cellules souches, mise en évidence par une technique de rétention de marquage. Un défaut de différenciation est également observé avec coexpression des cytokératines K5 et K10 ou K6 et K10 dans les couches suprabasales. Aucun trouble de la barrière n’est toutefois observé (test de pénétration de colorant). Dans l’épiderme de ces souris, p107 est surexprimé, ce qui pourrait compenser la perte de pRb. Le croisement de ces animaux avec des souris présentant une délétion de p107 induit une aggravation « dose-dépendante » des anomalies histologiques ce qui suggère un recouvrement fonctionnel des rôles des protéines pRb et p107. Les souris déficientes en pRb et/ou p107 ne présentent cependant pas de trouble majeur de la barrière. L’inactivation simultanée de p107 et p130 entraîne une hyperprolifération des kératinocytes, une altération de la différenciation avec hypogranulose et une diminution du nombre de follicules pileux (Ruiz et al., 2003). L’ensemble de ces résultats montre que pRb, p107 et p130 ont des fonctions partiellement redondantes, dans la régulation de la prolifération et de la différenciation épidermique ainsi que dans la morphogenèse des follicules pileux.

2.3.2.1.2 Protéines AP-1 et AP-2

Des sites fonctionnels de liaison aux facteurs de transcription AP-1 et/ou AP-2 ont été identifiés dans les séquences promotrices d’un grand nombre de gènes de la différenciation épidermique : la loricrine (Jang and Steinert, 2002), les desmogléines (Adams et al., 1998),

104 Introduction l’involucrine (LaPres and Hudson, 1996), la transglutaminase 1 (Lu et al., 1995), la kératine 10 (Maytin et al., 1999). Les facteurs de transcription de type AP-1 (Activator Protein 1) se composent d’homodimères ou d’hétérodimères des protéines de type Jun (c-Jun, JunB, JunD) et Fos (c-Fos, FosB, Fra-1, Fra-2) principalement, mais également Maf et ATF. L’expression des principales protéines AP-1 a été analysée dans l’épiderme humain (Mehic et al., 2005; Welter and Eckert, 1995) ainsi que dans des modèles de kératinocytes différenciés in vitro (Mehic et al., 2005). Dans l’épiderme humain normal, les résultats obtenus par les 2 équipes sont parfois contradictoires, probablement du fait d’un manque de spécificité des anticorps utilisés lors de la première étude. Tous les outils immunologiques utilisés dans la deuxième étude ont été vérifiés sur protéines recombinantes. Un résumé des résultats obtenus est présenté dans la figure 34.

Figure 34 : expression des protéines AP-1 dans l’épiderme humain (Mehic et al., 2005). Ainsi, ces résultats montrent que les constituants des complexes AP-1 sont exprimés de façons diverses dans les différentes couches épidermiques. Certaines protéines ne présentent pas le même patron d’expression dans les kératinocytes différenciés in vitro et dans l’épiderme humain normal. De façon intéressante, la protéine c-Jun est détectée dans les premières couches épineuses puis réapparaît dans la couche granuleuse la plus superficielle. Cette observation associée à l’augmentation de l’expression de Jun B dans les couches suprabasales, ainsi que la diminution c-Fos, suggère selon les auteurs que la formation d’homodimères Jun pourrait intervenir dans les étapes les plus tardives de la différenciation épidermique. Les facteurs de transcription AP-2 forment une famille multigénique composée de 5 membres, AP-2α, AP-2β, AP-2γ, AP-2δ, et AP-2ε, dernière isoforme découverte par analyse informatique, et seule spécifique de l’épiderme (Tummala et al., 2003).

105 Introduction

Des inactivations de membres des familles AP-1 et AP-2, pour la plupart ubiquistes, n’ont pas permis d’élucider leur rôle spécifique dans la différenciation épidermique, à cause soit d’une létalité embryonnaire, soit d’une redondance fonctionnelle de ces facteurs (Dai and Segre, 2004).

2.3.2.1.3 Facteurs à domaines POU

Trois membres de la famille des facteurs de transcription OCT (OCtamer binding Transcription factor) à domaine POU (Palindromic Octamer Unit) sont exprimés dans l’épiderme, OCT1, OCT6 (Tst-1) et OCT11 (SKN1A ou POU2F3) (Andersen et al., 1997). Alors que OCT1 est détecté dans toutes les couches vivantes, OCT6 et OCT11 sont spécifiques des kératinocytes suprabasaux. La surexpression de OCT11 dans des kératinocytes humains en culture induit une surexpression de KRT10. D’autre part, l’épiderme de souris inactivées pour Oct-6 ou pour Oct-11 ne présente pas d’anomalies morphologiques et expriment K14, la loricrine et K1 de la même façon que les souris sauvages. La délétion à la fois de Oct-6 et Oct-11 conduit par contre à un trouble de la différenciation avec hyperplasie et expression ectopique de K14 dans les couches suprabasales et à l’inverse de la loricrine dans les premières couches épineuses. Ces résultats suggèrent un rôle, largement recouvrant, des gènes Oct-6 et Oct-11 dans la régulation précoce de la différenciation de l’épiderme normal et cicatriciel.

2.3.2.1.4 FOXN1 FOXN1 (Forkheadbox N1 ou WHN, Winged Helix Nude), facteur de transcription de la famille winged-helix, est responsable du phénotype nude (absence de lymphocytes T et de follicules pileux) chez la souris (Segre et al., 1995). Chez l’homme, un cas d’immunodéficience T associé à une alopécie et une dystrophie des ongles (MIM #601705) causé par une mutation dans ce gène a été décrit (Schmidt et al., 1999). L’expression d’une forme de FOXN1 inductible au tamoxifène dans des kératinocytes humains en culture primaire stimule le processus de différenciation et induit une baisse du potentiel clonogénique avec augmentation du nombre de colonies exprimant la loricrine et la cornifine (Janes et al., 2004). L’analyse du transcriptome de ces cellules en présence ou en absence de tamoxifène par puces à ADN (6000 gènes) a permis d’identifier 32 cibles directes ou indirectes de FOXN1, notamment la kinase Akt1 qui pourrait constituer un effecteur clé dans la différenciation de l’épiderme interfolliculaire (Thrash et al., 2006). Foxn1 n’est donc pas

106 Introduction seulement impliqué dans la différenciation du follicule pileux, mais intervient également dans les stades précoces de la différenciation de l’épiderme.

2.3.2.2 Etapes tardives de la différenciation

Deux facteurs de transcription exprimés spécifiquement dans la couche granuleuse de l’épiderme ont été identifiés à ce jour, KLF4 (Kruppel-Like Factor 4), et DLX3 (Distal-less homeobox 3).

2.3.2.2.1 DLX3 L’inactivation du gène Dlx3 chez la souris est létale au cours de l’embryogenèse par défaut de développement du placenta (Morasso et al., 1999). Des souris transgéniques exprimant Dlx3 de façon ectopique dans la couche basale meurent en période périnatale. L’épiderme présente une importante désorganisation cellulaire, et une hypokératose avec parakératose (Morasso et al., 1996). L’analyse par hybridation in situ montre une expression de la filaggrine et de la loricrine dans la couche basale ainsi qu’une diminution des granules de kératohyaline. Une étude par footprinting à la DNAse1 montre que Dlx3, produit sous forme recombinante bactérienne, se lie à la région promotrice proximale du gène FLG, suggérant une activation directe. Chez l’homme, des mutations de DLX3 sont responsables d’un syndrome tricho- dento-osseux caractérisé par des cheveux cassants, une amélogenèse imparfaite avec des malformations radiculaires, et une condensation des os du crâne (MIM #190320). De façon étonnante, ces patients ne présentent pas de phénotype cutané.

2.3.2.2.2 KLF4 KLF4 est à ce jour le seul facteur de transcription identifié qui joue un rôle essentiel dans la mise en place de la fonction barrière (Segre et al., 1999). Initialement identifié dans le colon, il est aussi fortement détecté dans le noyau des kératinocytes des couches suprabasales. Des souris inactivées pour ce gène présentent un défaut de barrière. Le nombre de granules de kératohyaline est diminué, la morphologie des enveloppes cornées est altérée, et l’organisation des lamellae lipidiques perturbée. Malgré ces troubles morphologiques, des analyses en immunohistochimie n’ont pas mis en évidence d’anomalie d’expression des marqueurs principaux de la différenciation comme la filaggrine, la loricrine, et K10. L’activité transglutaminase ainsi que la composition des lipides intercornéocytaires ne sont pas non plus affectées. Une hybridation soustractive suppressive des ARNm d’épiderme de ces souris et de souris sauvages montre que SPRR2A, PAI2 (Plaminogen Activator Inhibitor type 2, aussi désigné SERPINB2, SERine Protease Inhibitor B2) et la répétine sont surexprimées dans

107 Introduction l’épiderme des souris mutées. Selon les auteurs, Klf4 aurait plutôt un rôle d’inhibiteur transcriptionnel dans l’épiderme normal. L’expression précoce de Klf4, sous contrôle d’un promoteur KRT5 inductible, provoque chez la souris l’instauration prématurée de la barrière épidermique (à E15,5) mise en évidence par un test d’exclusion de colorant (Jaubert et al., 2003). La morphologie de l’épiderme est normale bien que l’expression des marqueurs de la différenciation soit également prématurée. Dans le but d’explorer le rôle du défaut de barrière observé dans le psoriasis, les gènes surexprimés dans les souris Klf4-/- ont été détectés par la techniques des puces à ADN, puis comparés au profil d’expression génique des lésions psoriasiques (Djalilian et al., 2006). Comme attendu, les gènes codant pour les protéines SPRR sont mis en évidence. Parmi les autres gènes surexprimés dans les deux situations, l’étude s’est focalisée sur la connexine 26. Elle constitue une cible directe de Klf4 qui se lie sur son promoteur proximal comme démontré par immunoprécipitation de chromatine suivie de PCR quantitative en temps réel. L’expression ectopique de Cx26 dans les couches différenciées sous contrôle du promoteur de l’involucrine entraîne un défaut de barrière, une hyperacanthose avec hyperkératose et une hypogranulose associées à une augmentation du nombre de jonctions communicantes. Ces résultats étayent l’hypothèse d’un rôle de répresseur transcriptionnel pour KLF4 au cours de la mise en place de la barrière épidermique. Ainsi, seuls quelques facteurs de transcription ont été à ce jour clairement identifiés pour leur rôle dans la mise en place de la fonction barrière, parmi lesquels seul OCT11 qui intervient dans la stratification, est spécifiquement exprimé dans l’épiderme. La question de la régulation des gènes intervenant dans la différenciation terminale des kératinocytes épidermiques reste posée. Reste-t-il à identifier le ou les facteurs clés de ce processus, ou s’agit-il simplement d’une subtile combinaison de facteurs ubiquistes ? La régulation des gènes de la différenciation épidermique pourrait aussi être liée à leur localisation chromosomique au sein de loci de gènes corégulés comme les protéines de l’enveloppe cornée au sein du complexe de différenciation épidermique (EDC) en 1q31, ou certaines protéines sécrétées spécifiques de la couche granuleuse de l’épiderme en 19q13 (cf. chapitre 2.2.2.7). D’autres loci fonctionnels contenant des gènes spécifiquement exprimés dans les couches différenciées de l’épiderme restent ainsi peut-être encore à découvrir.

108 Introduction

2.3.3 Autres protéines

2.3.3.1 La stratifine

La stratifine (SFN) ou 14-3-3σ, appartient à la famille des protéines de liaison 14-3-3 qui se lient aux protéines phosphorylées sur des résidus serine. Elle bloque le cycle cellulaire en phase G2 en séquestrant le complexe CDK2/cycline B. SFN est fortement exprimée dans les couches suprabasales des épithéliums pluristratifiés, et sa sous-expression a été montrée dans plusieurs types de carcinomes (Lodygin and Hermeking, 2005). Son inactivation immortalise des kératinocytes humains in vitro, qui, de plus, deviennent incapables de se différencier (Dellambra et al., 2000). Une mutation (622insT) de ce gène a été identifiée comme responsable du phénotype Er (repeated-epilation) dans la descendance de souris irradiées aux rayons gamma (Herron et al., 2005; Li et al., 2005). Cette insertion ponctuelle entraîne un décalage du cadre de lecture et la production d’une protéine délétée de son extrémité carboxy- terminale, qui contient un signal d’export nucléaire et le domaine d’interaction avec ses ligands. Les animaux présentent à l’état hétérozygote une chute irrégulière des follicules pileux et développent à l’âge adulte des carcinomes épidermoïdes. La mutation à l’état homozygote est létale en raison d’un stress respiratoire néonatal. L’analyse de l’épiderme montre une hyperprolifération kératinocytaire et une absence de couche granuleuse et de couche cornée. Ces résultats confirment le rôle de la stratifine dans l’arrêt du cycle cellulaire et la différenciation kératinocytaire. De façon intéressante, des souris inactivées pour la kinase IKKα (I-Kappa-B Kinase Alpha) reproduisent le même phénotype que les souris Er. Cette observation suggère que les deux protéines pourraient intervenir au niveau des mêmes voies de signalisation.

2.3.3.2 La kinase AKT1

La kinase AKT1 intervient dans la voie de signalisation des PI3-Kinases. Sa surexpression dans un modèle d’épiderme reconstruit induit une différenciation précoce des kératinocytes se traduisant par une diminution d’épaisseur de la couche épineuse et par une augmentation de l’épaisseur de la couche granuleuse et de la couche cornée (Janes et al., 2004). Des études en western blotting et en immunofluorescence avec un anticorps spécifique de la forme active phosphorylée de AKT montrent que son activation débute dans la couche épineuse et se maintient dans toutes les couches suivantes (Thrash et al., 2006). Son inactivation par interférence à l’ARN provoque des anomalies de la différenciation avec une agranulose, une parakératose et une désorganisation de la couche. L’expression des marqueurs

109 Introduction de différenciation KRT1 et FLG est perturbée, et l’activité tranglutaminase est présente dans toutes les couches suprabasales. Ainsi, il apparaît que AKT1 intervient dans les stades tardifs de la différenciation épidermique.

2.3.3.3 La kinase TAK1 La kinase TAK1 (Transforming growth factor-β-Activated Kinase 1), produit du gène MAP3K7 (Mitogen-Activated Protein Kinase Kinase Kinase 7), intervient en amont de la voie de signalisation NFKB (Nuclear Factor Kappa-B). Dans l’épiderme de souris, TAK1 est exprimée dans toutes les couches vivantes. Des travaux concernant l’inactivation conditionnelle de Map3k7 dans l’épiderme de souris (K5-Cre/Map3k7flox/flox) ont été publiés par deux équipes presque simultanément avec des résultats concordants (Omori et al., 2006; Sayama et al., 2006). Les souris sont viables et morphologiquement normales à la naissance. A J2, la peau commence à devenir rêche et à se craqueler. Les souris meurent à J7. Des analyses à J6 montrent que : la perte hydrique transépidermique (TEWL) est très augmentée, des microabcès sont formés par des kératinocytes apoptotiques (marquage TUNEL), la différenciation épidermique est perturbée (expression de K14 dans les couches suprabasales, diminution de l’expression de K1, K10 et de la loricrine), le tissu est inflammatoire et la prolifération est augmentée (marquage Ki67, un antigène nucléaire spécifique des cellules prolifératives). L’étude de Omori et al. montre en outre que les kératinocytes déficients en TAK1 sont plus sensibles à l’apoptose induite spécifiquement par le TNFα (Tumor Necrosis Factor). Or, des souris inactivées à la fois pour TAK1 et pour le récepteur au TNFα (TNFR1) ne développent pas de phénotype cutané manifeste, et les kératinocytes présentent une importante résistance à l’apoptose induite par le TNFα. Ceci démontre de façon élégante que TAK1 est impliqué dans des voies de signalisation anti-apoptotiques. Le défaut de différenciation kératinocytaire pourrait alors être une conséquence de la sensibilité à l’apoptose induite par le TNFα.

2.4 Pathologies de la différenciation épidermique

2.4.1 Le psoriasis Cette dermatose inflammatoire qui touche environ 2% de la population, est caractérisée par l’apparition de plaques érythémato-squameuses de forme, de taille et de localisation très variables. Au niveau des lésions, l’épiderme est hyperplasique. Cette hyperprolifération kératinocytaire est associée à une disparition des couches granuleuses et une parakératose. L’infiltration de l’épiderme et du derme respectivement par des lymphocytes T CD8+ et

110 Introduction

CD4+ aboutit à la production de nombreuses cytokines proinflammatoires, telles que l’IL1, l’IL8, l’interféron γ et le TNFα. Les papilles dermiques sont plus allongées et des microabcès à polynucléaires sont souvent présents. L’origine de cette pathologie, kératinocytaire ou immunitaire, n’a pas été définitivement tranchée. Des mesures du TEWL montrent que la fonction barrière est défectueuse au niveau des lésions psoriasiques (Serup and Blichmann, 1987). L’épiderme psoriasique présente une agranulose avec une forte diminution de l’expression de la profilaggrine et de la loricrine. Au contraire, de nombreux marqueurs précoces de la différenciation tels que l’involucrine, la cystatine A ou la transglutaminase 1 sont surexprimés dans cette pathologie, comme résumé dans une revue récente (Iizuka et al., 2004) L'amélioration spectaculaire des lésions psoriasiques après traitement par la cyclosporine, une molécule immunosuppressive spécifique des lymphocytes T, suggère un rôle important des lymphocytes T dans la maladie. De plus, l’injection de lymphocytes de patients dans le derme de souris nude porteuses de greffes d’épiderme humain normal induit l’apparition de lésions psoriasiques (Wrone-Smith and Nickoloff, 1996). Maladie multifactorielle, le psoriasis peut présenter un caractère familial. Selon la classification proposée en 1985 et aujourd’hui admise par tous, on distingue le psoriasis familial de type I, d’apparition précoce (habituellement avant l’âge de 40 ans) et qui constitue 30% des cas, et le psoriasis de type II, sporadique et d’apparition plus tardive (Henseler and Christophers, 1985). De nombreuses études de liaison ont défini une vingtaine de loci de susceptibilité, dont le principal, PSORS1, situé en 6p21, contient les gènes codant pour HLA- C et la CDSN. Peu d’études d’association avec les gènes des autres loci de susceptibilité ont été publiées.

2.4.2 Les carcinomes épidermoïdes Les carcinomes épidermoïdes, parfois appelés carcinomes malpighiens, sont des tumeurs malignes qui reproduisent de façon plus ou moins élaborée la structure d’un épithélium pluristratifié cornifié. La différenciation au sein de la tumeur se fait généralement de la périphérie vers le centre pouvant aboutir à la formation de « perles cornées ». On parle de carcinome spinocellulaire pour les carcinomes épidermoïdes d’origine épidermique. Les carcinomes épidermoïdes développés aux dépends d’un épithélium non malpighien prennent le nom de carcinomes épidermoïdes métaplasiques. On peut citer celui de l’épithélium bronchique, épithélium cylindrique simple à l’état normal. Les carcinomes épidermoïdes non cutanés les plus fréquents siègent au niveau des bronches, de la sphère ORL, de l’oesophage

111 Introduction ou du col utérin. Ils disséminent d’abord par voie lymphatique en donnant des métastases dans les ganglions les plus proches. Les carcinomes épidermoïdes de la sphère ORL envahissent par exemple les ganglions cervicaux. D’un point de vue moléculaire, les carcinomes épidermoïdes expriment de nombreux facteurs de la différenciation épidermique, même si à ce jour aucun n’a été identifié comme constituant un facteur pronostique. Ils ont d’autre part fait l’objet de séquençage systématique et sont fortement représentés dans les banques de données. De ce fait, la majorité des EST correspondant à des gènes de la différenciation épidermique proviennent de carcinomes épidermoïdes.

2.4.3 Les génodermatoses De nombreuses maladies monogéniques sont causées par des mutations des gènes impliqués dans la différenciation épidermique. La plupart de ces pathologies ont été citées dans les chapitres précédents. Une grande partie de ces génodermatoses conduisent à un trouble de la cornification associé à une perturbation de la différenciation kératinocytaire, et conduisent à des pathologies ichthyosiformes généralisées (sécheresse cutanée importante et formation de larges squames) ou des kératodermies palmoplantaires. Voici un tableau récapitulatif des principales génodermatoses liées à des mutations de gènes exprimés au niveau des couches suprabasales de l’épiderme.

Pathologie Transmission Gène affecté* Manifestations cliniques ou anatomopathologiques Ichthyose vulgaire Autosomique FLG Peau sèche, hyperkératose modérée, MIM #146700 semidominante déficit de la fonction barrière (TEWL augmenté) Ichthyose lamellaire Autosomique TGM1 Bébé collodion, hyperkératose MIM #242300 récessive massive, légère acanthose, grandes 1 : 200 000 squames brunes, prurit, ectropion / eclabium Ichthyose harlequin Autosomique ABCA12 Généralement létale, hyperkératose, MIM #242500 récessive compaction de la couche cornée, fissures cutanées profondes, eclabium Ichthyose liée à l’X Récessive STS Hyperkératose, opacification +308100 1 : 2000-5000 L’accumulation du asymptomatique de la cornée (mâles) sulfate de cholestérol inhibe des protéases de la desquamation Erythrodermie Autosomique ALOXE3, ALOX12B Kératose hyperproliférative, bébé ichthyosiforme récessive Défaut de sécrétion des collodion, érythème, ectropion / congénitale sèche kératinosomes, eclabium (NCIE) enzymes déficientes MIM #242100 Erythrodermie Autosomique KRT1, KRT10 Hyperkératose, fragilité cutanée, ichthyosiforme dominante bulles intraépidermiques et congénitale bulleuse 1 : 300 000 vacuolisation des couches (BCIE) suprabasales MIM #113800

112 Introduction

Pathologie Transmission Gène affecté* Manifestations cliniques ou anatomopathologiques Maladie de Gaucher Autosomique GBA Déficit de la fonction barrière (TEWL MIM #230800 récessive Défaut d’activité augmenté), ichthyose, mort à l’âge de conduisant à un défaut 18 mois due à des troubles des lipides des lamellae neurologiques Syndrome de Autosomique CGI58 Erythrodermie ichthyosiforme, Chanarin-Dorfman récessive Accumulation de hépatosplénomégalie, accumulation de MIM #275630 vacuoles lipidiques gouttelettes lipidiques (nbx tissus) Syndrome de Autosomique CTSC Hyperkératose palmoplantaire, Papillon-Lefèvre récessive périodontite conduisant à la perte de la MIM #245000 dentition Acral peeling skin Autosomique TGM5 Atteinte acrale, érythème indolore, syndrome récessive détachement de l’épiderme au niveau MIM #609796 de la couche cornée Maladie de Naxos Autosomique JUP Cardiomyopathie, kératodermie MIM #601214 récessive (plakoglobine) palmoplantaire, cheveux laineux Kératodermie Autosomique DSG1 Hyperkératose palmoplantaire palmoplantaire striée dominante de type I MIM #148700 Kératodermie Autosomique DSP Hyperkératose palmoplantaire, palmoplantaire striée dominante cheveux laineux, cardiomyopathie de type II MIM +125647 Syndrome de Autosomique ALDH3A2, Ichthyose, troubles moteurs et retard Sjögren-Larsson récessive Accumulation d’alcools mental, dégénérescence rétinienne MIM #270200 1 : 100 000 gras Syndrome de Autosomique GJB2 (Cx26) Ichthyose, kératodermie Vohwinkel dominante palmoplantaire, pseudoainhum, surdité MIM #124500 Variant du syndrome Autosomique LOR Ichthyose, kératodermie de Vohwinkel dominante palmoplantaire, pseudoainhum MIM #604117 Maladie de Darier Autosomique ATP2A2 Défaut de cohésion kératinocytaire, MIM #124200 dominante acantholyse (haploinsuffisance) 1 : 100 000 Maladie de Hailey- Autosomique ATP2C1 Phénotype proche de celui de la Hailey dominante maladie de Darier, atteinte des ongles MIM #169600 Ichthyose bulleuse Autosomique KRT2A Hyperkératose et érosion superficielle de Siemens dominante de l’épiderme avec acantholyse. MIM #146800 Syndrome de Autosomique SPINK5 Erythrodermie ichthyosiforme, Netherton récessive cheveux bambous, atopie dans ¾ des MIM #256500 cas

Tableau 2 : principales génodermatoses liées à des mutations de gènes exprimés au niveau des couches suprabasales de l’épiderme. * : le mécanisme moléculaire est indiqué seulement pour les gènes non détaillés dans les chapitres précédents.

113 Introduction

3 Transcriptome et différenciation épidermique

Le nombre d’EST présents dans les banques de données, isolés à partir d’épiderme humain et/ou de kératinocytes en culture, est environ 300 fois plus faible que le nombre de ceux isolés à partir d’organes tels que le cerveau (environ 1600 contre 520000 pour un total de 6 millions d’EST humains), ce qui montre le retard pris dans l’étude de ce tissu. Dans les prochaines années, l’annotation du génome et la compréhension de mécanismes cellulaires complexes s’appuieront très largement sur des données obtenues à partir de prélèvements humains plutôt que de cellules en culture et à partir de populations homogènes de cellules plutôt que d'organes entiers. Seul un petit nombre d’études se sont intéressées à l’étude du transcriptome de l’épiderme. Les études concernant la différenciation kératinocytaire ont surtout été réalisées dans le but d’évaluer l’intérêt des équivalents cutanés par une méthode à grande échelle. D’autres études se sont attachées à caractériser des phénomènes particuliers tels que les mécanismes impliqués dans la mélanogenèse, l’inflammation ou la sénescence des kératinocytes ; enfin, quelques travaux concernent la cicatrisation, le psoriasis et la tumorigenèse.

3.1 Transcriptome épidermique et pathologie

3.1.1 Expression génique au cours de l’inflammation Le traitement de kératinocytes en culture par le TNFα est susceptible d’induire une différenciation aberrante qui ressemble à celle observée dans un contexte d’inflammation cutanée. La technique du SAGE a permis d’identifier environ 10 000 gènes exprimés par les kératinocytes différenciés in vitro, parmi lesquels 90 subissent une régulation (surexpression pour 47 d’entre eux, sous-expression pour les 43 autres) en réponse au traitement par le TNFα (Jansen et al., 2001). Néanmoins il est à noter que plusieurs des marqueurs de la différenciation comme la loricrine ou la filaggrine ne sont pas détectés par cette méthode dans les kératinocytes différenciés in vitro non traités. La même équipe a aussi cherché à mettre en évidence par la même technique des gènes spécifiquement surexprimés dans des lésions épidermiques précancéreuses (kératose actinique) par rapport à la peau non lésionnelle du même individu (van Ruissen et al., 2002a). Parmi les 12000 gènes identifiés, un ensemble de gènes spécifiques de l’épiderme précancéreux a été mis en évidence, parmi lesquels pourraient se trouver de nouveaux marqueurs moléculaires du processus de cancérogenèse. La technique utilisée pose cependant un problème de sensibilité, puisque de nombreux gènes

114 Introduction représentés par une seule étiquette SAGE n’ont pas pu être inclus dans une analyse statistique quantitative.

3.1.2 Expression génique au cours de la cicatrisation Dans le but d’étudier les modifications précoces de l’expression génique en réponse à une blessure, Cole et al. ont mis au point un protocole original pour l’étude de la cicatrisation in vivo chez l’homme. Dans le cadre d’une mammoplastie, 4 blessures adjacentes sont réalisées par biopsie « punch » de 8mm dans une région destinée à l’exérèse. Le chirurgien commence par l’autre sein, et organise l’opération de telle sorte que la moitié de la région blessée soit excisée au bout de 30 min, et l’autre 1h après la blessure (Cole et al., 2001). Le transcriptome de ces échantillons de peau est comparé à celui de peau saine du même individu à l’aide de filtres de nylon contenant des sondes pour 4400 gènes. Au bout de 30 min, 124 gènes sont surexprimés au niveau de la blessure et aucun n’est sous-exprimé. Il s’agit principalement d’activateurs de transcription et de gènes impliqués dans la signalisation et l’inflammation. Après 1h, 46 gènes sont surexprimés et 264 sont sous-exprimés. L’ensemble de ces résultats suggère que la première phase de réponse à une blessure est caractérisée uniquement par l’activation transcriptionnelle de certains gènes alors qu’après 1h une importante proportion de gènes sont réprimés. On peut toutefois reprocher à cette étude la trop petite proportion de gènes étudiés (4000), probablement assez peu représentatifs du transcriptome, ainsi que les prélèvements utilisés, composés de nombreux types cellulaires qui pourraient se trouver en proportions variables dans les différents prélèvements. Dans le but de définir les gènes impliqués dans la cicatrisation indépendamment de l’inflammation induite par la blessure, des souris sans macrophages, inactivées pour le gène PU.1, ont été utilisées (Cooper et al., 2005). Ce facteur de transcription est en effet impliqué dans la différenciation de plusieurs lignées hématopoïétiques, et les souris invalidées pour ce gène sont dépourvues de macrophages. Des souris de 2j sont incisées en 8x10 croisillons sur le dos à l’aide d’un scalpel et traitées avec un antibiotique jusqu’au sacrifice. Une réépithélialisation complète est généralement observée au bout de 24h dans les souris sauvages comme dans les souris mutées. Les prélèvements de peau sont effectués 30 min, 6h, 12h et 24h après la blessure. Les échantillons ont été hybridés à des puces Affymetrix MGU74A, ciblant environ 12 000 gènes murins et comparés à la peau saine provenant du même animal. 1001 gènes sont régulés au cours de la cicatrisation avec un ratio supérieur ou égal à 2 par rapport à la peau saine. Ces gènes ont ensuite été regroupés selon leur cinétique

115 Introduction d’expression (taux d’ARNm en unités arbitraires) comme représenté dans la figure ci-après (en bleu les souris sauvages et en rose les souris PU.1-/-) :

Environ 450 gènes, considérés comme des gènes impliqués dans la réparation tissulaire, présentent une régulation au cours de la cicatrisation identique chez les souris sauvages et mutées, et donc indépendante de l’inflammation (groupes a, b, c et d). Au contraire, 200 gènes sont modulés en réponse à l’inflammation (groupes e, f et g). Le groupe a, contenant les gènes de réponse précoce, est principalement constitué de facteurs de transcription. Parmi les « effecteurs » (groupes b et c) sont largement représentés des gènes codant pour des protéines de la matrice extracellulaire, des protéines de structure ou de signalisation. La K6, connue pour être induite au cours de la cicatrisation, fait partie comme attendu des effecteurs d’expression tardive. Enfin, les gènes du groupe d pourraient être impliqués dans l’inhibition de contact qui intervient lors de la fermeture de la blessure comme les ephrines et leurs récepteurs, le récepteur NOTCH ou DSC3.

116 Introduction

3.1.3 Expression génique au cours de la carcinogenèse De nombreuses études concernent l’expression génique des carcinomes épidermoïdes (principalement pulmonaires ou de la sphère ORL). On peut citer par exemple les travaux de Roepman et al. qui ont cherché à mettre en évidence des marqueurs spécifiques exprimés par des tumeurs primaires (Roepman et al., 2005). Des échantillons provenant de 82 patients atteints de tumeurs de la sphère ORL, parmi lesquels 45 présentaient des métastases ganglionnaires, les autres n’ayant pas développé de métastases 3 ans après le traitement chirurgical, ont été utilisés. L’analyse par puces pangénomiques à oligonucléotides (Qiagen, 21 329 gènes humains) montre que 1986 gènes présentent une surexpression dans au moins 30 des 82 échantillons tumoraux. Une classification supervisée des profils d’expression des tumeurs ayant formé des métastases ou non a permis la mise en évidence de 102 gènes prédictifs de leur potentiel invasif. Il est intéressant de noter que 2/3 d’entre eux sont sous- exprimés dans les tumeurs à l’origine de métastases. On retrouve en particulier des gènes intervenant au niveau de l’adhérence cellulaire (plakines, desmogléine 3), la différenciation épidermique (transglutaminase 3, involucrine, loricrine, dermokine, SLPI, SKALP, SPINK5, ALOX12B, ABCA12) et la mort cellulaire. De nombreux gènes codant pour des protéines de la matrice extracellulaire et de son remodelage (métalloprotéases et inhibiteurs) sont présents, certains étant surexprimés et d’autres sous-exprimés. L’analyse de ces 102 gènes prédictifs du potentiel métastatique dans 22 nouveaux échantillons a montré une bonne corrélation pour 19 échantillons, sans aucun faux-négatif. La mise en place de ces nouvelles méthodes d’analyse des tumeurs primaires devrait permettre de mieux adapter les traitements aux patients. Plus récemment, toujours dans le but de mieux comprendre les gènes impliqués dans l’invasivité des cellules tumorales, des carcinomes spinocellulaires ont été comparés à des lésions psoriasiques (Haider et al., 2006). Ces 2 pathologies sont en effet caractérisées par une hyperprolifération des kératinocytes, mais seul le carcinome présente un pouvoir invasif. Des puces Affymetrix U95 contenant des sondes pour environ 12 000 gènes ont été utilisées pour comparer chaque échantillon pathologique (8 carcinomes et 8 lésions psoriasiques) à de la peau saine provenant du même individu. Dans un premier temps, 1048 gènes ont été identifiés comme étant surexprimés et 870 sous-exprimés dans les carcinomes par rapport à la peau saine. Pour faire la part des gènes dérégulés dans le cadre de l’hyperprolifération et celle des gènes réellement impliqués dans la cancérogenèse, cette liste a été confrontée à celle des gènes surexprimés dans les lésions psoriasiques par rapport à la peau non lésionnelle. Les gènes surexprimés dans les deux pathologies sont impliqués dans la protéolyse et sa régulation (ADAM23, KLK6, 10, 13, SERPINB3, 4, 8), l’inflammation (interleukines,

117 Introduction

S100A, CD24), et, de façon étonnante, dans la différenciation kératinocytaire (SPRR, DSG3, TGM1, IVL, ALOX12B, KRT16). Cette observation montre selon les auteurs que la dédifférenciation des cellules n’est pas un prérequis à la transformation. Parmi les gènes spécifiquement surexprimés dans les carcinomes et pas dans le psoriasis, plusieurs membres de la famille des métalloprotéases (MMP1, 10, 13) sont présents, ainsi que des gènes impliqués dans la prolifération, mais aussi la KLK7 (SCCE), la cathepsine L2, les facteurs de transcription STAT3, JUN et FOS, des récepteurs de la voie de signalisation WNT, CD8 et CD83, spécifiques des lymphocytes. Pour une partie de ces gènes, les résultats ont été confirmés par PCR quantitative en temps réel, et en immunohistochimie pour les MMP, CD8 et CD83. La principale limite de cette étude est le très grand nombre de gènes identifiés comme dérégulés dans les tumeurs (582 gènes surexprimés dans les tumeurs et non régulés dans le psoriasis ; 2520 gènes au total sont différentiellement régulés dans les 2 pathologies).

3.1.4 Expression génique au cours du psoriasis Des puces Affymetrix U95A (12 000 gènes humains) ont été utilisées pour analyser des échantillons de peau de 15 patients atteints de psoriasis (peau lésionnelle et non lésionnelle pour 11 d’entre eux) et 6 individus témoins (Bowcock et al., 2001). 7129 transcrits ont été détectés et un « clustering » hiérarchique a permis de mettre en évidence 177 gènes spécifiquement régulés dans la peau lésionnelle. Parmi eux sont retrouvés des gènes de la différenciation épidermique (TGM1 et 3, SKALP, ALOX12B) dont certains sont situés sur l’EDC (IVL, SPRR, S100A), les SERPINB3 et B4, CD24, les facteurs de transcription STAT1 et 3, les KRT6A, 16 et 17, spécifiques des kératinocytes hyperprolifératifs. Ces résultats semblent bien corrélés avec l’étude citée précédemment. De nombreux gènes codant pour des protéines du protéasome sont aussi surexprimés et pourraient intervenir dans la présentation antigénique via le CMH, ce qui est à rapprocher de l’association de la susceptibilité au psoriasis familial avec certains haplotypes du complexe HLA. Le transcrit présentant la plus forte induction (93 fois) code pour la transcobalamine I, une protéine de liaison à la vitamine B12 spécifique des cellules inflammatoires. 5 gènes ont montré une surexpression à la fois dans la peau lésionnelle et non lésionnelle par rapport aux individus contrôle : CD47, l’interleukine 8, SPRR2C, ECGF1 (Endothelial Cell Growth Factor 1) et STAF50 (Stimulated Trans-Acting Factor 50kDa).

118 Introduction

3.2 Transcriptome et physiologie épidermique

3.2.1 Expression génique au cours de la mélanogenèse Des souris mutées pour le récepteur à la mélanocortine (Mc1r) sur les 2 allèles présentent un épiderme peu pigmenté, avec un pelage roux et une plus grande susceptibilité aux mélanomes induits par les UV. Mc1r, un récepteur couplé aux protéines G, est spécifiquement exprimé par les mélanocytes de l’épiderme. Afin d’identifier les cibles de ce récepteur, des puces à ADN pangénomiques de souris ont été utilisées (April and Barsh, 2006).

119 Introduction

Dans un premier temps, les auteurs ont analysé le transcriptome des fibroblastes du derme, des cellules de la couche basale (où sont logés les mélanocytes) ou de l’épiderme suprabasal de souris sauvages. Ces 3 populations cellulaires ont été comparées 2 à 2 constituant 6 groupes de gènes. Au total, 17267 transcrits ont été détectés avec la distribution suivante : Population cellulaire Nombre de transcrits détectés (puces 23k) Couches suprabasales de l’épiderme 883 Couche basale de l’épiderme 2097 Derme 552 Epiderme entier 1186 Couche basale de l’épiderme et derme 820 Couches suprabasales de l’épiderme et derme 245

3.2.2 Expression génique au cours de la sénescence Très récemment, une étude de transcriptome des kératinocytes in vitro s’est plus particulièrement focalisée sur la sénescence (Perera et al., 2006). Des puces pangénomiques à haute densité (Affymetrix HU-95A) ont été utilisées pour comparer l’expression génique de kératinocytes primaires en culture prolifératifs, à celle de kératinocytes à 90% minimum de confluence (« early confluent »), différenciés par 4 jours de culture après confluence (« late confluent ») ou en sénescence réplicative. Le nombre de gènes surexprimés ou sous-exprimés dans les kératinocytes confluents ou sénescents par rapport aux kératinocytes prolifératifs est résumé dans les diagrammes de Venn suivants :

Ces résultats montrent une importante modification de l’expression génique lors de la différenciation par la confluence, ainsi qu’une différence de transcriptome significative entre les kératinocytes différenciés et les kératinocytes sénescents. Les auteurs de ce travail se sont

120 Introduction plus particulièrement intéressés aux gènes de régulation du cycle cellulaire, de la différenciation kératinocytaire et de l’inflammation qui varient entre les kératinocytes différenciés (KD) et les kératinocytes sénescents (KS). Parmi les gènes de régulation du cycle cellulaire, qui majoritairement varient dans le même sens, la cycline D2 et la phosphatase CDC25B (Cell Division Cycle 25B) sont, de façon intéressante, surexprimées dans les KS alors qu’elles sont sous-exprimées dans les KD. Les gènes codant pour des protéines de structure (SPRR, envoplakine, involucrine, profilaggrine, KRT1) et la transglutaminase 1 sont surexprimés dans les KD et pas dans les KS. Enfin, de nombreux gènes de l’inflammation et de la réponse immunitaire, en particulier des gènes liés à la signalisation par l’interféron, sont fortement sous-exprimés dans les KD alors qu’ils varient peu ou sont surexprimés dans les KS. Les auteurs spéculent ainsi sur un lien entre ces données d’expression et l’augmentation des maladies auto-immunes cutanées lors du vieillissement.

3.3 Transcriptome épidermique et différenciation kératinocytaire

3.3.1 Expression génique au cours de la différenciation in vitro Plusieurs équipes ont comparé différents modèles d’épiderme reconstruit in vitro, avec des kératinocytes cultivés en monocouche et de l’épiderme normal (Bernard et al., 2002; Gazel et al., 2003; Mehul et al., 2004). Ces études s’appuient toutes sur la technologie des puces ou filtres à ADN pour la comparaison du transcriptome dans les différents modèles étudiés. L’étude de Bernard et al. a comparé des échantillons d’épiderme humain normal (détachement à froid à partir de peau de sein), d’épiderme reconstitué produit par le laboratoire SkinEthic (kératinocytes pluristratifiés à l’interface air-liquide) et de kératinocytes primaires en culture monocouche. Les ARN radiomarqués ont été hybridés sur filtres de nylon contenants 475 sondes correspondant à 4 groupes de gènes : matrice extracellulaire/différenciation/adhésion, signalisation/cytokines/facteurs de croissance, apoptose et radicaux libres, structure, et enfin, métabolisme. 25 à 30% des gènes du filtre sont détectés. Les ARNm de la cytokératine K6B et des intégrines alpha-3, alpha-6 et beta-1 sont détectés dans les kératinocytes in vitro (épiderme reconstitué et culture monocouche) mais, de manière surprenante, pas dans l’épiderme normal ce qui suggère une faible sensibilité de la méthode utilisée. Au contraire, des marqueurs de la différenciation épidermique tels que K1 et K10, la filaggrine, la loricrine et la cornéodesmosine sont détectés dans l’épiderme normal et reconstitué, et pas dans les cultures monocouche. Les auteurs ont de ce fait choisi l’épiderme reconstitué pour analyser les effets de l’acide rétinoïque sur l’expression génique.

121 Introduction

Même si ce travail a le mérite de poser la question de la différence d’expression génique entre l’épiderme in vivo et les modèles in vitro, le faible nombre de gènes testés et le manque de sensibilité de la méthode en diminuent la portée. L’étude de Gazel et al. utilise des puces Affymetrix capables de détecter 12000 gènes pour comparer le même type d’échantillons (testés en quintuple) que le travail précédemment cité (épiderme humain normal disséqué à partir d’échantillons de peau de sein, de l’épiderme reconstitué « SkinEthic », et des kératinocytes primaires initialement cultivés sur fibroblastes murins irradiés, congelés, puis remis en culture sans matrice et prélevés 24h après confluence). Au total, 3240 gènes présentent une différence d’expression avec un ratio supérieur ou égal à 2 entre au moins deux des échantillons. Ce travail montre là aussi, mais cette fois-ci à grande échelle, que les modèles d’épiderme reconstruit expriment un programme génique plus proche de l’épiderme normal que les kératinocytes en culture monocouche. Ces derniers n’expriment pas les principaux marqueurs de la différenciation comme la loricrine, l’involucrine ou les kératines suprabasales et, au contraire, surexpriment des gènes impliqués dans le remodelage du cytosquelette d’actine et dans la régulation du cycle cellulaire. L’épiderme reconstitué, bien qu’ayant une expression génique plus proche de celle de l’épiderme ex vivo, exprime plus faiblement certains gènes codant pour des protéines de signalisation sécrétées et de leurs récepteurs. Les auteurs proposent que cette différence soit largement due à la présence dans l’épiderme de types cellulaires autres que les kératinocytes. De façon étonnante, plusieurs gènes mitochondriaux sont sous-exprimés dans l’épiderme normal par rapport à l’épiderme reconstitué, ce qui pourrait refléter une activité métabolique moins intense in vivo. Il faut toutefois souligner un biais possible inhérent à l’origine des échantillons : épiderme de sein de femmes adultes, kératinocytes purifiés à partir de prépuce de plusieurs nouveaux nés pour les cultures monocouches, et d’un seul enfant pour l’épiderme reconstitué. L’étude de Mehul et al. est basée sur l’utilisation de puces dédiées, obtenues par dépôt de produits PCR sur membrane de nylon. Les 504 gènes étudiés ont été choisis pour leur rôle connu dans la biologie cutanée. Trois modèles d’épiderme reconstitué à partir de kératinocytes primaires différenciés à l’interface air-liquide, différant par le support utilisé, matrice de derme irradié, mélange de collagène bovin et de fibroblastes humains, ou membrane recouverte de collagène I et IV (« Episkin »), ont été analysés. La grande majorité des gènes (86%) est détectée dans les 3 modèles et leurs profils d’expression sont globalement proches. Chacun des modèles a été comparé à des kératinocytes primaires cultivés en monocouche. Tous les épidermes reconstitués reproduisent l’expression de plusieurs gènes

122 Introduction associés à la différenciation terminale comme la cornéodesmosine, la loricrine, la caspase 14 ou la filaggrine, même si chacun montre quelques spécificités comme illustré ci-après :

3.3.2 Expression génique au cours de la stratification Pour identifier les gènes spécifiquement exprimés au cours de la stratification, des kératinocytes primaires ont été mis en culture sur du derme irradié et maintenus submergés ou ont été différenciés à l’interface air/liquide (Koria and Andreadis, 2006). Les ARNm sont extraits à 3 ou 7 jours à partir de cultures submergées ou à l’interface air/liquide. Leur transcriptome est analysé à l’aide de puces pangénomiques Affymetrix. La plupart des gènes surexprimés dans les cultures à l’interface air/liquide mis en évidence dans cette étude interviennent dans le métabolisme des carbohydrates, la biosynthèse des lipides ou la phosphorylation oxydative. De façon étonnante, très peu de gènes tardifs de la différenciation épidermique apparaissent exprimés de manière différentielle entre des cultures submergées et des cultures différenciées à l’interface air/liquide. D’autre part, l’analyse morphologique des cultures submergées montre un épiderme beaucoup plus fin avec une à deux assises cellulaires, mais qui développe une couche cornée. Les auteurs proposent que le manque de nutriments, en particulier de glycogène, dans le milieu de culture pourrait affecter la stratification. Malgré le manque de couches suprabasales intermédiaires, un programme transcriptionnel conduisant à la cornification des cellules est mis en place.

123 Introduction

3.3.3 Expression génique de l’épiderme humain normal Un point commun aux différentes études concernant les modèles d’épiderme reconstruit se dégage : les kératinocytes différenciés in vitro sont incapables de reproduire l’expression de nombreux gènes associés aux étapes tardives de la différenciation épidermique. Une première étude partielle du transcriptome de l'épiderme entier ex vivo a été publiée (van Ruissen et al., 2002b). Cependant, ce travail s'appuie sur la méthode SAGE qui semble peu adaptée à la caractérisation de nouveaux gènes, par manque de spécificité. L’épiderme entier est obtenu par clivage du derme à la dispase. A partir d’environ 3 millions de cellules, 15 131 étiquettes SAGE, dont 7645 uniques, ont été collectées et comparées aux bases de données. Les transcrits correspondant à 1100 étiquettes n’ont pu être identifiés et pourraient en partie correspondre à de nouveaux gènes. Parmi les 20 étiquettes les plus représentées, 6 n’ont pu être identifiées et 10 correspondent à des protéines ribosomiques. La galectine 7, une lectine épidermique, et le gène hypothétique KIAA0375, identifié depuis comme codant pour RUSC2 (RUN and SH3 domain containing 2, ou Iporine, un partenaire de Rab1 exprimé de façon ubiquiste), font partie des gènes les plus fortement détectés (Bayer et al., 2005). Enfin, seulement 2 étiquettes correspondent à des gènes tardifs de la différenciation épidermique, KRT10 et KDAP (Keratinocyte Differentiation Associated Protein). De très récents travaux ont comparé chez l’homme le profil d’expression de différentes populations cellulaires épidermiques (Radoja et al., 2006). L’épiderme est séparé du derme après incubation d’une nuit à 4°C avec la dispase, puis les cellules sont dissociées par traitement à la trypsine à 37°C. Les kératinocytes basaux sont ensuite isolés à l’aide de billes magnétiques couplées à des anticorps dirigés contre l’intégrine β4, spécifiquement exprimée par ces cellules. Des puces Affymetrix HU95 (10 000 gènes) ont été utilisées pour comparer les cellules β4+ aux cellules β4-, et à l’épiderme entier (à partir de 3 donneurs sains). 875 gènes sont différentiellement exprimés entre les kératinocytes basaux, et les cellules β4- et/ou l’épiderme entier. Les gènes plus fortement exprimés dans la population de kératinocytes basaux β4+ codent pour des protéines de l’hémidesmosome, du cycle cellulaire et de la réplication de l’ADN. Les gènes plus fortement exprimés dans la population de cellules β4- correspondent aux marqueurs de la différenciation épidermique et en particulier aux gènes situés dans l’EDC comme la loricrine, l’involucrine, la filaggrine ou les SPRR. De façon intéressante, les gènes de la famille S100A sont plus fortement exprimés dans les kératinocytes basaux et ne semblent donc pas intervenir dans la différenciation épidermique, comme discuté dans le chapitre 2.2.2.6 concernant l’EDC. Les 2 populations cellulaires expriment aussi de façon différentielle les gènes codant pour des protéines impliquées dans

124 Introduction l’adhésion, la matrice extracellulaire, le métabolisme et la signalisation. D’autre part, 49 gènes surexprimés dans les cellules β4- sont spécifiques des mélanocytes. Pour conclure, ce travail a permis de mettre en évidence des différences d’expression génique entre les kératinocytes basaux et les cellules β4-. Toutefois, cette dernière population est très hétérogène puisque composée de kératinocytes épineux et granuleux ainsi que des autres types cellulaires épidermiques, mélanocytes, cellules de Langerhans et cellules de Merkel.

125

II. RÉSULTATS EXPÉRIMENTAUX

127

Résultats expérimentaux

JOURNAL OF INVESTIGATIVE DERMATOLOGY 126(2):503-6 (2006)

The human dermokine gene: description of novel isoforms with different tissue-specific expression and subcellular location.

Eve Toulza, Marie-Florence Galliano, Nathalie Jonca, Hélène Gallinaro, Akemi Ishida-Yamamoto, Guy Serre and Marina Guerrin.

129

Résultats expérimentaux

Résumé

Parmi les EST produits au laboratoire par la technique des ORESTES, un des plus représentés correspondait à un ARNm codant pour une protéine hypothétique, ZD52F10. De façon concomitante, ce gène a été identifié chez la souris par Moffat et al., et Matsui et al. qui l’ont nommée dermokine. Deux isoformes résultant de l’usage d’un promoteur alternatif et exprimées dans l’épiderme ont été décrites, la dermokine α et la dermokine β. Les protéines correspondantes sont toutes les deux porteuses d’un peptide signal et sécrétées in vitro. L’analyse des séquences présentes dans les banques de données montre que ce gène subit de nombreux épissages alternatifs. Nous avons caractérisé 2 nouveaux groupes d’ARNm, γ, transcrit à partir du même promoteur que l’isoforme β mais différant de celle-ci par l’usage d’un exon terminal 3’ alternatif, et δ, transcrite à partir d’un 3ème promoteur, contenant 5 exons alternatifs, et seule isoforme ne présentant pas de peptide signal dans la séquence protéique prédite. Nous avons recherché l’expression de ces isoformes par PCR à l’aide d’un panel d’ADNc provenant de 16 tissus humains. La dermokine δ est exprimée de façon ubiquiste, la dermokine α est détectée dans l’épiderme et plus faiblement dans le placenta, enfin, les dermokine β et γ sont spécifiques de l’épiderme. Nous avons en outre montré par PCR quantitative en temps réel et northern blotting que l’isoforme α est transcrite dans toutes les couches de l’épiderme alors que les isoformes β et γ sont spécifiques de la couche granuleuse. Nous avons confirmé par production de protéines recombinantes in vitro que la dermokine δ est intracellulaire alors que les isoformes α, β et γ sont sécrétées dans le milieu de culture. Un antisérum anti-peptide a été produit, qui reconnaît spécifiquement les isoformes β et γ comme montré en western blotting sur protéines recombinantes et sur extraits d’épiderme. En immunohistochimie et immunomicroscopie électronique, la dermokine β ou γ est détectée spécifiquement dans la couche granuleuse, au niveau des kératinosomes et dans l’espace extracellulaire. L’analyse de la peau lésionnelle de 4 patients atteints de psoriasis montre que l’expression de l’isoforme β et/ou γ est très fortement augmentée et apparaît dès la couche épineuse. Les isoformes β et γ contiennent une région riche en glycine et sérine ainsi qu’une séquence RGD d’attachement à la matrice extracellulaire. La fonction de cette protéine reste néanmoins inconnue, et l’identification de ses partenaires potentiels ou la production de souris transgéniques pourraient permettre de mieux comprendre son rôle dans la différenciation épidermique.

131

Résultats expérimentaux

133 Résultats expérimentaux

134 Résultats expérimentaux

135 Résultats expérimentaux

136 Résultats expérimentaux

JOURNAL OF BIOLOGICAL CHEMISTRY 281(9):5780-9 (2006)

A novel protease inhibitor of the alpha2-macroglobulin family expressed in the human epidermis.

Marie-Florence Galliano, Eve Toulza, Nathalie Jonca, Akemi Ishida-Yamamoto, Guy Serre and Marina Guerrin.

137

Résultats expérimentaux

Résumé

Parmi les EST produits au laboratoire par la technique des ORESTES, nous avons identifié une séquence correspondant à un ADNc homologue de l’α2-macroglobuline (A2M), un inhibiteur de protéases plasmatique à large spectre, synthétisé par les cellules hépatiques. Nous avons nommé ce nouveau gène A2ML1 (Alpha2-Macroglobulin Like 1) en accord avec la nomenclature du HGNC. A2ML1 est situé en 12p13.31, en position télomérique par rapport aux 2 autres gènes de la famille des α -macroglobulines, A2M et PZP. A2ML1 code pour une protéine prédite de 1454 acides aminés contenant un peptide signal, un domaine appât, et une séquence thiol-ester. En RT-PCR, l’ARNm est détecté dans l’épiderme, le placenta, le testicule et le thymus. Nous avons montré par northern blotting que ce gène est transcrit dans l’épiderme sous la forme d’un messager unique, de 5kb environ. Des expériences de PCR quantitative en temps réel montrent que dans l’épiderme, A2ML1 est spécifique de la couche granuleuse. Un antisérum de lapin a été produit contre un peptide spécifique de la protéine. A2ML1 est sécrétée par des cellules transfectées in vitro. Elle est détectée par western blotting sous la forme d’un monomère dans des extraits d’épiderme humain. Des analyses en immunohistochimie et immunomicroscopie électronique montrent qu’A2ML1 est présente dans les kératinosomes et est sécrétée au pôle apical des derniers kératinocytes granuleux. A2ML1 produite sous forme recombinante inhibe in vitro la protéolyse d’un substrat de haut poids moléculaire par diverses protéases à sérine (chymotrypsine, subtilisine A, et plus faiblement l’élastase pancréatique), une métalloprotéase (thermolysine) et une protéase à cystéine (la papaïne). Elle ne présente pas d’effet inhibiteur sur la trypsine. A2ML1 est d’autre part capable de former des liaisons covalentes avec la chymotrypsine et la kallikréine 7 (SCCE), comme analysé par des tests de zymographie. A2ML1 est donc un nouvel inhibiteur de protéases, spécifique des étapes tardives de la différenciation épidermique, et qui pourrait intervenir dans la régulation des protéases impliquées dans la desquamation. Il pourrait aussi participer à la défense antimicrobienne par la liaison aux protéases bactériennes comme déjà montré pour A2M. Enfin, comme A2M, A2ML1 pourrait lier des facteurs de croissance et jouer un rôle dans leur clairance via un récepteur membranaire. Ce récepteur pourrait être LRP1 qui lie A2M ou un récepteur spécifique de A2ML1, qui reste à identifier.

139

Résultats expérimentaux

141 Résultats expérimentaux

142 Résultats expérimentaux

143 Résultats expérimentaux

144 Résultats expérimentaux

145 Résultats expérimentaux

146 Résultats expérimentaux

147 Résultats expérimentaux

148 Résultats expérimentaux

149 Résultats expérimentaux

150 Résultats expérimentaux

MANUSCRIT EN PRÉPARATION

Large scale identification of genes implicated in epidermal barrier function.

Eve Toulza et al.

151

Résultats expérimentaux

Résumé

Au cours de la différenciation épidermique, les kératinocytes quittent le compartiment basal et cessent de proliférer. Les cellules progressant dans les couches suprabasales subissent des remaniements biochimiques complexes et finement régulés conduisant à la cornification, puis la desquamation. Ce processus de mort cellulaire programmée aboutit à la formation des cornéocytes qui assurent la fonction de barrière protectrice. Les kératinocytes granuleux, dernières cellules vivantes, produisent la quasi-totalité des protéines et lipides requis pour la fonction barrière ; pour cette raison, une meilleure compréhension des processus mis en jeu passe par l’étude à grande échelle de leur transcriptome. Dans cet objectif, des kératinocytes granuleux ont été purifiés à partir d’épiderme humain par incubations successives en présence de trypsine. Le niveau d’enrichissement en kératinocyte granuleux a été contrôlé par RT-PCR quantitative en temps réel (RT-PCR Q). Plus de 22 500 EST ont été produits par la méthode des ORESTES puis séquencés. Parmi eux, 16 591 EST correspondent à 3 387 gènes différents, dont 14 rétrogènes et 5 gènes non-codants. Le niveau de normalisation de la méthode s’avère satisfaisant (4,6 EST par gène), bien que certains transcrits abondants soient plus représentés. Environ 330 gènes exprimés sont représentés par moins de 100 EST dans la banque de données UniGene, et sont donc susceptibles d’être spécifiques des kératinocytes granuleux. Parmi eux, 55 codant pour des protéines potentiellement impliquées dans la fonction barrière ont été testés par RT-PCR Q ; 36 s’avèrent être de nouveaux marqueurs tardifs de la différenciation, parmi lesquels des protéases, des inhibiteurs de protéases et des protéines impliquées dans le métabolisme et le transport des lipides. Deux membres du Complexe de Différenciation Epidermique (EDC), l’Ifapsoriasine et une nouvelle LCE, ainsi qu’un rétrogène de la Prosaposine, sont décrits pour la première fois. Au final, l’emploi couplé d’une base de données de séquençage et de la RT-PCR Q s’avère efficace pour identifier les gènes exprimés tardivement, qui pourraient permettre une meilleure compréhension de la physiologie et des pathologies épidermiques.

153 Résultats expérimentaux

154 Résultats expérimentaux

Large scale identification of genes implicated in epidermal barrier function

ABSTRACT During epidermal differentiation, keratinocytes leave the basal compartment and proliferation ceases. Cells progressing through suprabasal layers undergo complex and tightly regulated biochemical modifications leading to cornification and desquamation. This programmed cell death results in formation of corneocytes responsible for protective barrier function. Granular keratinocytes, last living cells, produce almost all of the proteins and lipids required for this barrier function; thus, large-scale characterization of their transcriptome is necessary for a better understanding of involved processes. Granular keratinocytes were purified from human epidermis by iterative incubations in trypsin. Granular keratinocyte enrichment was checked by quantitative real-time RT-PCR (Q-RT PCR). Using the ORESTES method, 22 585 EST were produced and sequenced. Among them, 16 591 EST matched 3 387 different genes, including 14 retrogenes and 5 non-protein coding genes. Normalization with this method was acceptable (4.6 EST per gene), though some highly transcribed genes were overrepresented. About 330 expressed genes displayed less than 100 EST in UniGene clusters and are most likely to be specific of granular keratinocytes. Among them, 75 coding for proteins potentially involved in barrier function were tested by Q-RT PCR; among the 55 being detected with this method, 36 were identified as new markers of epidermis late differentiation, including proteases, protease inhibitors and proteins involved in lipid metabolism and transport. Two members of the epidermal differentiation complex (EDC), Ifapsoriasin and a new LCE gene, as well as a Prosaposin retrogene, were previously uncharacterized. Altogether, compiled results from EST database and Q-RT PCR showed a good potential for identification of epidermis late-expressed genes, which might be relevant both in physiological and pathological situations.

INTRODUCTION High-throughput genomic projects focusing on the identification of cell- and tissue-specific transcriptomes are expected to uncover fundamental insights into biological processes. Particularly intriguing are genes in sequenced genomes that remain hypothetical and/or poorly represented in expressed sequence databases, and whose function in health and disease remains unknown. Some of them are most probably implicated in organ-specific functions. Their characterization is essential to complete the annotation of sequenced genomes and is

155 Résultats expérimentaux expected to contribute to advances in physiology and pathology. In order to achieve such goals, transcriptome studies on tissues rather than cultured cells, and eventually on a single cell type at a precise differentiation step are more likely to bring new information. Epidermis is a highly specialized tissue mainly dedicated to the establishment of a barrier that restricts both water loss from the body and ingress of pathogens. The barrier function of the epidermis is known to involve the expression of numerous tissue-specific genes that are, for most of them, specifically expressed in the late steps of differentiation. In order to establish and constantly maintain this barrier, keratinocytes undergo a complex, highly organized and tightly controlled differentiation program leading to cornification and finally to desquamation. During this process, cells migrate from the basal, proliferative layer, to the surface, where they form the cornified layer. According to the current model of skin epithelial maintenance, basal keratinocytes encompass a heterogeneous cell population that includes slow-cycling stem cells (Watt et al., 2006). These stem cells give rise to transiently amplifying keratinocytes that constitute most of the basal layer. They divide only a few times and finally move upward while differentiating to form the spinous layer. The proliferating compartment is characterised by the specific expression of cell cycle regulators and of integrin family members responsible for the attachment of the epidermis to the basement membrane. Growth arrested keratinocytes undergo differentiation, mainly characterised by a shift in cytokeratin expression from KRT5 (keratin 5) and KRT14 in the basal layer to KRT1 and KRT10 in suprabasal layers. As differentiation progresses, keratinocytes from the spinous layers progressively express a few epidermal differentiation markers, like involucrin. However, the differentiation program culminates in the granular layer. At this step, keratinocytes express more than 30 epidermis-specific proteins, some of which being stored in cytosolic granules characteristic of granular keratinocytes. These proteins include well known components of the cornified layers, like loricrin and elafin, but also recently identified ones as Keratinocyte Differentiation Associated Protein (KDAP), suprabasin, cornifin, repetin… Granular keratinocytes undergo a special programmed cell death, the cornification, to give corneocytes, which do not exhibit transcriptional or translational activity anymore and are devoid of organelles. Rather, their intracellullar content consists in a homogeneous matrix mainly composed of covalently linked keratins. The cornified envelope, a highly specialised insoluble structure, encapsulates corneocytes in place of their plasma membrane (see Kalinin et al. for a recent review (Kalinin et al., 2004)). The lipid-enriched extracellular matrix, which subserves the barrier, is produced by a highly active lipid factory, mainly operative in the granular layer, which comprises secretory organelles, named the epidermal lamellar bodies

156 Résultats expérimentaux

(Elias et al., 1998). In addition to the provision of lipids for the barrier, lamellar bodies deliver a large number of proteins including lipid-processing enzymes, proteases and anti-proteases that regulate desquamation, antimicrobial peptides and corneodesmosin, an adhesive protein secondarily located in the external face of the desmosomes, as they turn into corneodesmosomes. Therefore, the components of the stratum corneum, responsible for the most of the protective cutaneous functions, are produced by granular keratinocytes. Thus, transcriptome studies of selected cell types of the human epidermis are expected to contribute to the elucidation of the mechanisms responsible for the barrier function. They will also shed further light on the causes of monogenic genodermatoses, and the pathomechanisms of common complex skin disorders like psoriasis. However, the present knowledge in the gene repertoire expressed by keratinocytes remains largely fragmentary. Among the ~8 millions human expressed sequence tags (ESTs) from the dbEST division of the GenBank database, only 1210 are annotated as originating form the epidermis, but are in fact derived from cultured keratinocytes, which do not fully recapitulate the complex in vivo differentiation program. In this article, we describe the results of a large scale cDNA sequencing project from granular keratinocytes of healthy human skin, purified by a new method. In order to characterize genes expressed at a low level and to avoid the repetitive sequencing of highly expressed ones, we used the ORESTES (open reading frame EST) method to prepare a large series of small size cDNA libraries using arbitrarily chosen primers for reverse transcription (RT) and PCR amplification (Dias Neto et al., 2000). The sequencing of about 25 000 clones has produced a list of 3387 genes expressed by granular keratinocytes, some of them in a cell-specific manner, as assessed by quantitative RT-PCR experiments. This effort resulted in a large number of novel candidate genes of importance for epidermis barrier function and the ethiology of genodermatoses.

MATERIAL AND METHODS ƒ Skin samples and RNA extraction Normal human skin was obtained from patients undergoing abdominal plastic surgery (kindly provided by Professor J.P. Chavoin, “Service de Chirurgie Plastique et des Brûlés”, Centre Hospitalier Universitaire Rangueil, Toulouse, France) after informed consent and in accordance with Helsinky principles. Subcutaneous fat was promptly removed and part of the samples was put aside for histological and biochemical analyses. Strips of skin were incubated, epidermis side up, for 1 h at 4°C in PBS containing 0.5mg/ml thermolysin (T7902, SIGMA). The epidermis was dissected free of dermis tissue with forceps and rinsed in cold

157 Résultats expérimentaux

PBS. Epidermal fragments were either immediately frozen for total RNA extraction or incubated in 1X trypsin-EDTA solution (25300-054, Invitrogen) at 4°C under gentle agitation for 15 min. The remaining epidermal fragments were rinsed in cold PBS and incubated in another trypsin-EDTA solution, while fetal calf serum (10270098, Invitrogen) was added to the suspended cells (10% final concentration). After centrifugation, the cells were frozen as dry pellets. The procedure was repeated twice leading to three successive fractions of dissociated cells named T1, T2 and T3. The residual fragments (T4 fraction) were drained on a gauze compress, frozen and ground to a powder under liquid nitrogen. Total RNA was extracted from the various cell batches using the RNeasy extraction kit (Qiagen). Purification of poly(A)+ RNA was always performed from the T4 fraction of individual patients, using oligo(dT)25-tagged magnetic beads according to the manufacturer’s instructions (Dynal). Two rounds of hybridization to the beads were performed. The mRNAs were treated with DNAse I (Invitrogen) and the absence of genomic DNA was confirmed by PCR using primers for the corneodesmosin gene (AF03130). ƒ Morphological analysis of epidermis samples After each trypsin incubation, an aliquot of epidermal fragments was fixed in Bouin's solution, embedded in paraffin, and sections (10 µm) were stained with hematoxylin-eosin. ƒ Production and analysis of ORESTES ORESTES production was essentially performed as described (Leerkes et al., 2002). Purified mRNA (20 ng) were heated 10 minutes at 65°C, reverse transcribed at 37°C for 1hr with 200 U of Moloney murine leukemia virus reverse transcriptase (Promega) and 10 pmol of an arbitrary selected primer (18-25 nt) in a final volume of 20 µl. The reaction products (1µl) were amplified by PCR using either the primer used for the reverse transcription, or a single, alternative arbitrary chosen primer. The hybridization step of the first PCR cycle was set at 37°C, while the 35 remaining cycles were performed in standard conditions with a hybridization temperature complying with the length of the primer (typically 55°C). After gel electrophoresis, products with predominant bands reflecting the amplification of highly abundant sequences were not further processed. Smear-like reaction products were gel- purified with a 500 bp cut-off. Mini-libraries were then produced by T/A cloning of the purified PCR fragments (TOPO-TA cloning kit, Invitrogen). ƒ Plasmid purification and sequencing Sequencing was performed by standard procedures (ABI Prism Dye Terminator Cycle Sequencing kit, Applera) either after plasmid purification (Wizard miniprep kit, Promega) or after rolling circle amplification of the plasmids.

158 Résultats expérimentaux

ƒ Sequence analysis An automated protocol for the sequence analysis was used to verify sequence quality (GENOSCOPE). Sequences were then analyzed using a stepwise approach (EST pipeline, CBIB). Starting with RepeatMasker (Smit, AFA, Hubley, R & Green, P. RepeatMasker Open- 3.0.1996-2004 .), ORESTES were clustered with the PHRED algorithm (http://www.phrap.org/). Consensus sequences or singletons were annotated using Blast searches against human databases (best-hit among successively RefSeq, Uniprot and EST_Human databases (Altschul et al., 1997)). Sequences were also aligned on the human genome (May 2004 assembly) using BLAT (Kent, 2002) and inserted as a custom track into the UCSC Genome Browser. ƒ Analysis of gene expression For quantitative real-time RT-PCR experiments, all primer pairs (available upon request) were chosen to generate amplicons of 100-250 bp encompassing different exons, thus avoiding the amplification of potential contaminating genomic DNA. The primer sequences were designed using Primer3 software (Rozen and Skaletsky, 2000) and BLAST analysis (Altschul et al., 1997) ensured the absence of similarity to any other human sequence. Reverse transcription was performed by standard procedures, starting from 100 ng of total RNA of each cell batch and using a mixture of oligo(dT) and random hexamers. Amplification assays were performed with the ABI prism 7000 Sequence Detection System and analyzed with the corresponding software (Applied Biosystems, Foster City, CA) using the Platinum SYBR Green qPCR SuperMix-UDG (Invitrogen). Fluorescence was quantified as Ct (threshold cycle) values. Samples were analyzed in triplicate, with differences between the 3 Ct values lower than 0.3. Expression levels were calibrated using galectin 7 (LGALS7), or beta-2-microglubulin (B2M) mRNA as internal controls. The differences between the mean Ct values of the various amplicons and the reference genes were denoted (ΔCt). The difference between ΔCt obtained with the indicated cell samples was labelled ΔΔCt. 2 (-ΔΔCt) gave the relative level of gene expression between the T1 and T4 fractions. Control wells containing the SYBR Green PCR master mix and primers without template cDNA emitted no significant fluorescence after 40 cycles. ƒ RACE-PCR experiments 5' RLM-RACE was performed using the FirstChoice RLM-RACE kit (Ambion). Briefly, total RNA was dephosphorylated with calf intestine phosphatase then decapped using tobacco acid pyrophosphatase to target full-length mRNA. An adapter was then ligated to mRNA and reverse transcription was performed using random decamers. PCR was performed to amplify

159 Résultats expérimentaux the resulting cDNA using the Outer 5' RLM-RACE primer and a gene specific lower primer. Nested PCR was then performed with the Inner 5’ RLM-RACE primer. The RACE nested PCR products were cloned into the pCRII-TOPO vector using a TOPO T/A cloning kit (Invitrogen) and sequenced.

RESULTS ƒ Granular keratinocytes enrichment As a first step of this transcriptome project we devised a method to purify granular keratinocytes. Iterative incubations of pieces of human epidermis with trypsin were performed to give 3 suspended cell factions (thereafter named T1-T3) and finally isolate cells attached to the stratum corneum (T4 fraction). Morphological analyses revealed that after three treatments, residual epidermal fragments were almost composed of corneocytes and granular keratinocytes (Figure 1). Quantitative real-time PCR was performed to quantify the enrichment in granular keratinocytes. To first select a reference gene for normalization, the relative expression of eight housekeeping genes (GAPDH, SOD1, ACTB, B2M, HPRT1, HMBS, TBP and UBC) in each cell fraction (T1-T4) was analysed using GeNorm (Vandesompele et al., 2002). In agreement with previous data (Bonnet-Duquennoy et al., 2006), B2M (beta-2-microglobulin) appeared to be stably expressed during epidermis differentiation, and was thus chosen for normalization. In addition, we used the lectin Galectin-7 (LSGAL7) gene that was previously shown by in situ hybridization to be equally expressed in all epidermal layers (Magnaldo et al., 1998). BPAG2 (Bullous Pemphigoid Antigen 2) or KRT14, and KLK7 (kallikrein 7 aka SCCE, Stratum Corneum Chymotryptic Enzyme) were selected as specific for the basal and the granular keratinocytes, respectively. For 4 cell fractionations from different individuals, the mean T1/T4 expression ratio of KRT14 was 13, whereas the mean T4/T1 expression ratio of SCCE was approximately 130 (Table 1). The KRT14 ratio might be indicative of a slight contamination of the T4 fraction with basal keratinocytes. Alternatively, a relatively weak expression of the KRT14 gene by granular keratinocytes might have been overlooked in in situ hybridization experiments. On the other hand, the large SCCE ratio indicates that very few, if any, granular keratinocytes were present in the T1 fraction. From this, we concluded that the T4 fraction was suitable for a large scale study of the transcriptome of granular keratinocytes.

160 Résultats expérimentaux

ƒ An ORESTES dataset from human granular keratinocytes PolyA+ RNAs were extracted from individual #3 T4 fractions and used to generate cDNA mini-libraries using the ORESTES method (Dias Neto et al., 2000). This method uses arbitrarily chosen primers for reverse transcription and PCR amplification. The successful amplification of an mRNA thus depends primarily on sequence homology with the primer rather than on abundance. This, and the elimination of cDNA preparations that display proeminent bands on gels (indicative of the selective amplification of particular mRNAs), results in a normalization and allows the detection of rare transcripts. One hundred and fifthy cDNA libraries were constructed with different primers, the analysis of 100-200 clones from each of them leading to the production of 22 585 sequences (Figure 2A). Among these, 1453 (approx. 6%) corresponded to empty plasmids or uninformative sequences, 377 (1.7%) were of bacterial origin, and 2303 (10%) matched the human mitochondrial genome. Despite two rounds of polyA+ RNA purification, 1859 sequences (8.2%) arose from ribosomal RNA. In addition, 187 sequences corresponded to unspliced intergenic DNA and may reflect spurious transcriptional activity or genomic contamination. The remaining 16 591 sequences (73%) matched known or predicted transcribed regions, of which 62% aligned with the human genome in several blocks, and thus corresponded to spliced transcripts. After clustering, we evidenced the transcription of 3387 genes by granular keratinocytes. Additionally, 23 sequences matched overlapping genes belonging to 2 genes transcribed on opposite orientations and thus could not be attributed to one gene. The ORESTEs dataset was aligned with the human genome using BLAT (Kent, 2002). The BLAT results were used to write a custom track (Figure 3) which allows the visualisation of the position of a particular ORESTE relative to other annotations such as RefSeq genes, vertebrate orthologs, SNP, microarray expression data, etc., and is freely available at http://genome.ucsc.edu/cgi-bin/hgTracks?org=human&hgt.customText=http://udear.cnrs.free.fr/orestes.txt ƒ Redundancy of the dataset The normalization ability of the ORESTES method was examined by classifying genes according to the number of matching sequences in the dataset (Figure 2B). Half of the genes were represented by a unique sequence and 76.3% by 3 or less sequences, thus showing an acceptable level of normalization with a mean of 4.6 ORESTES per gene. However, the ORESTES method only partially compensates for transcript abundance, as several genes were represented by a large ORESTES number. In these cases, we examined the number of sequences in the corresponding UniGene clusters, a rough mesure of gene expression level. This revealed two situations: (1) the gene is strongly expressed in many cell types including

161 Résultats expérimentaux granular keratinocytes (high number of both ORESTES and UniGene entries), (2) the gene is particularly expressed in granular keratinocytes (high number of ORESTES, but low number of UniGene entries). The first category mainly includes housekeeping genes from the translation machinery (RPS8, EEF1A1, RPL3, RPL7A, RPL28…) (Table 2). The second category contains genes previously implicated in the epidermis barrier function (KRT, DMKN, LEP7, FLG, KRT2A, SPRR2E, CASP14, CDSN, hKRP, SBSN…) and, interestingly, new candidates for this function (TSPAN5, DUOX2, TMEM14C, SERPINA12, SLC22A5, IFPS, C7orf24). Dermokine (DMKN), represented by 217 ORESTES, was recently shown to be selectively transcribed in mouse granular keratinocytes by high- throughput in situ hybridization (Matsui et al., 2004) and signal sequence trap (Moffatt et al., 2004) screens. The present ORESTES dataset allowed us to described 13 novel splicing human isoforms with distinct subcellular locations and expression patterns (Toulza et al., 2006). ƒ Poorly represented genes in expressed sequence databases As few sequencing projects from human epidermis relative to other organs have been performed so far, genes expressed during the late steps of epidermis differentiation are poorly represented in sequence databases. Among the 3375 genes from our set, 330 (10%) corresponded to UniGene clusters containing les than 100 mRNA/EST sequences, and were thus good candidates for epidermis late-expressed genes. These were subdivided into 4 classes. The first one contains all the genes already known to be specifically expressed in the suprabasal layers (Table 3A). Ten additional genes known to be expressed in all epidermal layers are also present in our dataset. To note that all known late-expressed genes are poorly represented in EST databases. The second class consists of genes with known or inferred functions that were previously shown to be expressed in various tissues, and whose expression in the epidermis has never been assessed (Table 3B). We suggest that some of them might play a specific role in epidermal differentiation. This could be the case for SERPINA12, DUOX2, and, to a lesser extent, CASZ1, which are represented by a large ORESTES number. We also suspect that CLDN23 might play an important role in granular keratinocytes since claudin-based tight junctions that exist in the granular layer contribute to barrier function of the epidermis claudin-1-deficient mice barrier being severely affected (Furuse et al., 2002). The third class gathers uncharacterized paralogues of known genes (Table 3C). The last class (almost one third of the total 330 entries) is composed of genes that remain hypothetical and about which nothing is known regarding their normal function or disease relevance (Table 3D). The remaining are mainly genes expressed in numerous tissues,

162 Résultats expérimentaux but their epidermal expression is described here for the first time to our best knowledge (Supplementary table S1). Some of these poorly represented genes in expressed sequence databases have been selected to assess their expression in the course of epidermal differentiation by real-time PCR (see below). ƒ Expressed retrogenes and pseudogenes Pseudogenes generally correspond to retrocopies with many disruptions in their open reading frame (ORF). However, a large number of retrocopies are frequently transcribed, some of them being putative true protein coding genes (Vinckenbosch et al., 2006). Among the top 50 transcribed retrocopies reported by Vinckenbosch et al., 11 were detected in granular keratinocytes by the ORESTES method. Among them, CALML3 (Calmodulin-Like 3) is furthermore known to be specific of keratinocyte terminal differentiation (Rogers et al., 2001). We identified 3 other expressed retrogenes with conserved ORF, corresponding to the retrotransposition of the CTAGE5 (Cutaneous T-cell lymphoma associated antigen 5), CNOT6L (CCR4-NOT Transcription complex, subunit 6-Like) and PSAP (prosaposin) genes. The latter has been further characterized in detail (see Figure 3 and below). Moreover, six unspliced ORESTES correspond to a part of intron 8 of the PPP2R5A gene, and include the small nucleolar RNA (snoRNA) U98b sequence. The snoRNAs are non- protein coding that guide the 2’O-ribose methylation (C/D box snoRNAs) or the pseudouridylation (H/ACA box snoRNAs) of ribosomal RNAs that are generally processed from introns of RNA polymerase II transcripts (see snoRNABase at http://www- snorna.biotoul.fr/). Interestingly, the U98b snoRNA is a primate-specific retroposon of the ACA16 snoRNA hosted by the PNAS-123 gene (Weber, 2006). We thus suggest that the ORESTEs from the PPP2R5A gene correspond to a precursor form of the snoRNA U98b, and that snoRNA retroposons are indeed expressed when located in an intron of a new host gene in the sense orientation. ƒ Non-coding genes We obtained two long spliced ORESTEs highly similar to the BC070486 mRNA form of the GAS5 gene, a non protein-coding gene, which belongs to the Growth Arrest Specific family but is disrupted in its ORF by a premature stop codon. The GAS5 gene is the host gene for 10 box C/D small nucleolar RNAs (snoRNAs) (Smith and Steitz, 1998). Other snoRNA host genes included in our ORESTE dataset are RPS11, RPS12, RPL10 and EIF4A1. In certain cases, ORESTEs contain the snoRNA sequence (U39B in RPS11, mgU6-77 in EIF4A1, U70

163 Résultats expérimentaux in RPL10), and probably correspond to alternative splicing forms of the host gene mRNA, with intron retention. We furthermore obtained sequences for long, non-coding transcripts. MALAT-1 (Metastasis Associated Lung Adenocarcinoma Transcript 1) (22 ORESTEs) is a conserved long non- coding RNA (more than 8000 nucleotides) with unknown function, highly expressed in numerous healthy organs and overexpressed in metastazing non-small cell lung carcinomas (Ji et al., 2003). Close to MALAT1 on 11q13.1, TncRNA (trophoblast-derived noncoding RNA) (44 ORESTES) is a non-coding RNA of 481 nucleotides involved in trophoblastic MHC suppression by inhibiting CIITA (Class II Transactivator) transcription (Geirsson et al., 2003). H19 is an uncoding, maternally imprinted mRNA (2 spliced ORESTES) (Zhang and Tycko, 1992). H19 is highly transcribed in extraembryonic and fetal tissues, as well as in adult skeletal muscle. It has been shown that H19 is involved in the genomic imprinting of IGF2 (Insulin-like Growth Factor 2) (Thorvaldsen et al., 1998). The expression and the potential function of these 3 RNAs in the epidermis had never been assessed. Six spliced ORESTES corresponded to a totally unknown gene without mRNA sequences in databases. We performed RACE experiments and identified 16 exons and 15 introns with canonical splice sites and a consensus polyadenylation signal. In agreement with the Human Gene Nomenclature Committee, we named this gene C1orf81. To date, only 4 EST are present in databases, one from testis and the others from pooled tissues. PCR on a panel of cDNAs from 16 healthy human tissues and organs show that spliced transcripts for this gene are detectable in almost all samples (data not shown). Intriguingly, conceptual translation of the mRNA shows a +1 frameshift disruption of the open reading frame, expected to lead to transcript degradation by the nonsense-mediated RNA decay (NMD). More intriguingly, alignment of the exons 7, 8 and 9 show an insertion in the human genome in exon 9 that does not appear in other species, including primates. The two putative ORF overlap by 87 amino acids, and a translational frameshifting is expected to lead to the production of a full-length protein of 633 amino acids. ƒ Real-time PCR expression profiling of selected clones To compare the expression levels between basal and granular keratinocytes of some candidate genes identified in this study, quantitative real-time PCR experiments were performed with the T4 and T1 cell fractions. Based on predicted domains and homologies, 75 genes represented by less than 100 ESTs were selected. Among these, 20 could not be detected despite the use of at least 2 different primer pairs, 36 were overexpressed in the granular layer with T4/T1 ratios ranging from 5 to 800, 10 were equally expressed in the two layers, and 9

164 Résultats expérimentaux were overexpressed in the basal layer and (Table 4). For several genes, the T4/T1 expression ratio was thus much larger than that observed for the KLK7 gene, used as a specific marker of the granular keratinocytes in our cell purification experiments (Table 1). Therefore, these data emphasize the high degree of purity of the granular keratinocytes we have purified from healthy human skin. They also provide us with new, highly-specific markers for this cell type.

ƒ Identification of new genes – Epidermal Differentiation Complex The Epidermal Differentiation Complex (EDC) spans 1.62 megabases on 1q21.3 and contains approximately 50 genes specifically involved in the barrier function, such as involucrin, loricrin, filaggrin, Small Proline Rich proteins (SPRR1-4) or Late Cornified Envelope proteins (LCE1-5). We cloned many sequences corresponding to known genes of this locus (Figure 4), but also sequences for previously uncharacterized transcripts. Ifapsoriasin (IFPS) displays features of the fused-family genes (filaggrin, trichohyalin, or repetin) with 3 exons and a large predicted protein sequence (2391 amino acids) containing 2 calcium binding EF-hand domains and a large domain made of repeated segments of about 25 amino acids. The amino acid composition of IFPS, also named Filaggrin 2 in public databases, is very similar to that of filaggrin, with a high content in serine (22%), glycine (20%), histine (10%) and glutamine (10%). We also identified a new member of the LCE family, telomeric to LCE1A. RACE experiments led to the cloning of two exons (GenBank Accession DQ991251), revealing that this gene has the same organisation than the related members of LCE or SPRR families. The examination of the genomic sequence further suggested the presence of a TATAA box at position -31 relative to the cap site. The predicted protein sequence (80 amino acids) is homologous to that of others members of the LCE family. Considering the phylogenetic tree comparing all LCE and SPRR members (Figure 5), we propose to name this new gene LCE6A in accordance with the HGNC (HUGO Gene Nomenclature Committee). The expression of both genes is likely restricted to the epidermis, as shown by PCR on a panel of cDNAs from 16 healthy human tissues and organs (Figure 6). Real-time PCR showed furthermore a strong overexpression of the IFPS and LCE6A genes in granular keratinocytes, with a T4/T1 ratio of 300 and 650, respectively. These results thus establish that these 2 genes are new functional members of the EDC complex, in agreement with their similarity with other genes involved in the epidermal barrier function. – Prosaposin-like 1 gene

165 Résultats expérimentaux

Prosaposin (PSAP) is a secreted precursor for 4 saposins (SAP) A, B, C, and D, acting as cofactors for enzymes involved in sphingolipid metabolism. PSAP is essential to the cutaneous barrier formation and mutations of the PSAP gene are responsible for metachromatic leukodystrophies. (Doering et al., 1999). We identified an expressed PSAP processed retrogene (11 ORESTES), that is located in an intron of the SORCS2 gene in the reverse orientation. Surprisingly, the human reference sequence differed from the ORESTE sequence by the absence of a single nucleotide, resulting in a frameshifting that leads to a putative stop codon 69 amino acids after the first methionine. As this difference did not correspond to a known polymorphism, we sequenced genomic DNA from 4 individuals and did not evidence such ORF disruption. Chimpanzee sequence and human partial mRNA sequences BC034552, BC048325 and BC068579 do not display such a stop either, confirming that nucleotide deletion is likely due to an error in the present genome assembly. After correction (see GenBank Accession DQ991252), the human retrogene encodes a 521 amino acid (aa) protein with 44% identity and 62% homology with the PSAP protein. We thus named this new gene PSAPL1 (Prosaposin-like 1) in accordance with the HGNC. The PSAPL1 protein shows the same domain architecture than PSAP, with a signal peptide sequence, an N-terminal SAPA domain, 4 SAPB domains and a C-terminal SAPA domain. The PSAPL1 gene is mainly expressed in epidermis and lung as shown by PCR on a panel of 16 cDNAs (Figure 6), and is upregulated in granular keratinocytes with a real-time PCR T4/T1 ratio of 600. By genomic alignment, the mouse PSAPL1 gene was also localized in the Sorcs2 gene, and corresponds to the 2310020A2Rik mRNA. As for the human gene, it encodes a 525 aa protein with 35% identity with the mouse PSAP protein, but 66% identity and 82% homology with its human counterpart (data not shown). Similarly, functional PSAPL1 genes were localized in rhesus monkey and cow genomes. In the rat and rabbit, the coding sequence was disrupted by frameshift mutations, which might or not correspond to sequence errors. On the contrary, the dog PSAPL1 retrogene, also located in the orthologue of the SORCS2 gene, is clearly non functional, with a mutated ATG initiation codon and multiple frameshift mutations. The PSAPL1 gene could not be localized in other sequenced vertebrate genomes, like armadillo, elephant and opossum, although the PSAP gene was present. Multiple aligments showed that the various PSAPL1 proteins and PSAP protein form separate clusters (data not shown). This suggests that the PSAPL1 gene originate from a retrotransposition event in a commun ancestor of Laurasiatheria and Euarchontoglires, and rapidely diverged to eventually increase the saposin repertoire.

166 Résultats expérimentaux

DISCUSSION We have described here the first large scale study of the transcriptome of human epidermal cells. As we are interested in genes that participate in the barrier function of the skin, we focused on granular keratinocytes, which correspond to the ultimate step in the course of keratinocytes differentiation, and are the last epidermal cells to display gene expression activity before undergoing a particular programmed cell death leading to cornification. Because these cells represent less than 10% of epidermis population, a preliminary step was to design an efficient purification from healthy human skin fragments. After unsuccessful tries using size filtration, ficoll gradients, and fluorescence-activated cell sorting with various specific markers, we used successive short-term enzyme incubations, at 4°C to stop metabolic cell activity and preserve the mRNA pool from degradation. This point is highly relevant as many growth factors, cell cycle regulators and transcription factors, only transiently needed by cells are encoded by unstable mRNA. Quantitative PCR experiments were used to assess the relative expression level of several cell-type specific genes in the successive cell fractions. ƒ ORESTE technique In the present transcriptome project, the ORESTE methodology was selected because it produces sequences that are distributed predominantly within the central part of the corresponding transcripts and is biased towards less-abundant mRNA (Dias Neto et al., 2000). When using arbitrarily chosen primers for reverse transcription and PCR, the amplification of a given transcript is proportional to its length and to the probability for the primer to anneal at low stringency (37°C). This conceptual normalization was secondarily strengthened by removing cDNA libraries with highly abundant amplification products. After the elimination of irrelevant sequences, we produced 16 591 ORESTES representing 3387 genes. The distribution of the ORESTE number per gene (Figure 2), and the low number of ESTs in the corresponding UniGene entries fully confirmed that the transcript normalization obtained with this method is at least comparable to that of hybridization–substraction techniques (for an example, see (Smith et al., 2001)). ƒ Overrepresented genes Nevertheless, a few genes were represented by more than 100 sequences obtained from several different mini-libraries. These include ubiquitous, highly expressed, genes like RPS8 and EEF1A1, and genes already known to be highly transcribed in granular keratinocytes (keratin 1, late envelope protein 7 or profilaggrin). Other members of this class, Dermokine (formerly ZD52F10), SERPINA12 and Ifapsoriasin were not previously known to be

167 Résultats expérimentaux overexpressed in the skin, and were studied in more detail. We characterised the ZD52F10 gene, now known as the Dermokine gene (Matsui et al., 2004) and described 13 novel mRNA isoforms, that are either ubiquitous or epidermis-specific depending upon alternative promoter usage. The epidermis-specific forms encode secreted protein of still unclear function, and is abundantly transcribed in this tissue (Toulza et al., 2006). SERPINA12 is an extracellular serine protease inhibitor identified as Vaspin (Visceral adipose tissue-derived serine protease inhibitor), a protein that displays insulin-sensitizing effects (Hida et al., 2005). Real-time PCR confirmed that SERPINA12 is also highly expressed in epidermis, specifically in granular keratinocytes. This protein might thus have a role in the regulation of complex balance between various proteases and their inhibitors operative in the desquamation process. Ifapsoriasin (IFPS) lies in the Epidermal Differentiation Complex, a locus on 1q21.3 containing about 50 genes involved in cornification. Like other members of the fused-family genes, IFPS predicted protein contains 2 EF-hand domains allowing calcium binding, and numerous repeated regions. Our quantitative RT-PCR experiments revealed that IFPS displays strong specificity for granular keratinocytes. Interestingly, its composition is very close to that of filaggrin. The degradation of filaggrin is considered to be at the origin of the free amino acid pool of the Natural Moisturizing Factor, which is capable of attracting and retaining water to achieve skin softness and flexibility. We suggest that IFPS might have a similar function. ƒ Non protein-coding RNA We cloned several spliced transcripts corresponding to non protein-coding genes, including snoRNA host genes. A new gene characterized in this study, nearly ubiquitously transcribed, C1orf81, is particularly intriguing as the corresponding transcript (2284 nt) displays an ORF disruption by a +1 frameshift insertion. To our best knowledge, OAZ1 (Ornithine decarboxylase Antizyme 1) is the only human gene known to be translated with +1 translational frameshifting (Tosaka et al., 2000). Although we succeded in cloning of 16 exons of the C1orf21 gene from human epidermis, its expression level was too weak to perform real-time PCR experiments. The premature stop codon introduced in the human C1orf21 gene by the frameshift is located 103 bp upstream of the exon 3’ end, and is therefore expected to lead to mRNA degradation by the NMD, a phenomenon might explain its very level of the transcript. The putative C1orf81 protein contains no known domains and its function in epidermis remains elusive. However, this illustrates the potency of the ORESTE method for the discovery of new, weakly expressed genes.

168 Résultats expérimentaux

ƒ Real-time PCR experiments Real-time PCR experiments revealed very strong expression ratios for granular keratinocyte specific genes such as KLK7. However, moderate ratios were observed for basal keratinocyte specific genes such as K14 or BPAG2. This is likely due to the fact that after the first dissociation of 15 min in trypsin, very few if any dissociated granular keratinocytes contaminate the first cell batch (T1), whereas some basal keratinocytes are trapped inside the epidermis fragments and remain in the last fraction (T4). We detected indeed some genes known to be specific for the basal keratinocytes like keratin 5 or BPAG2. ORESTES representation for these highly expressed could be due to mRNA stability in suprabasal layers or little basal keratinocyte contamination. Our purification method is thus very powerful to detect granular keratinocyte specific genes, which was our goal, while less adapted to the study of basal keratinocytes. ƒ Granular keratinocyte specific candidate genes The top 10% of genes, that is the 330 genes with the lowest EST number in the UniGene database (≤ 100 EST), have been analysed manually. Interestingly, 42% of them are coding for hypothetical proteins. Furthermore, the known specific genes involved in keratinocyte terminal differentiation, represent 15% of the panel. This shows that genes expressed specifically in the uppermost layers of epidermis are poorly represented in the sequence databases, and suggests that some of the genes coding for hypothetical proteins may have functional implications in the late steps of epidermal differentiation. To test this hypothesis, candidate genes have been chosen to assess or confirm their expression in the course of epidermal differentiation by quantitative real-time PCR. They mainly correspond to genes containing possibly functional domains suspected to play a role in cornification. Twenty of 75 selected genes could not be evidenced by PCR on entire epidermis, or T4 cDNA. This shows the sensitivity of ORESTES method towards these less abundant mRNAs that have been identified in our minilibraries while undetectable with classical or real-time PCR. Finally, among the 55 tested genes, 36 are upregulated in the course of epidermis differentiation. The balance between proteases and protease inhibitors is essential to desquamation. We identified a protease and 3 protease inhibitors potentially involved in this process. P11 is a secreted serine protease expressed in normal human placenta and various malignant neoplasms of breast, ovary, testis, and stomach (Grundmann et al., 1990). Its specific targets have not yet been determined. In the epidermis, P11 could act in the course of desquamation like other serine proteases, either by cleaving corneodesmosome components, or by activating other proteases. In addition to SERPINA12, 2 other members of the serine protease inhibitor

169 Résultats expérimentaux serpins superfamily have been spotted. SERPINB7, also known as Megsin, is secreted by mesangial cells in the extracellular matrix (Miyata et al., 2002), but its targets have not been identified to date. SERPINB12 is expressed in many tissues, and display inhibitor properties against trypsin-like serine proteases (Askew et al., 2001). This is the first report of serpin protease inhibitor expression in granular keratinocytes. It would be of great interest to identify their target in epidermis, as serine proteases like kallikreins 5 (SCTE) and 7 (SCCE) have a key function in desquamation (Caubet et al., 2004). Three additional transmembrane proteases, TMPRSS13, TMPRSS11F and RHBDL2 could be involved in signal transduction by cleaving ligands, as RHBDL2 has been shown to cleave ephrins B2 and B3 that are ligands for EPH-related receptor tyrosine kinases (Pascall and Brown, 2004). Interestingly, we detected ephrin B3 expression by sequencing of 2 spliced ORESTES. WAP2 is a serine protease inhibitor that displays antimicrobial activity in mouse tongue and kidney (Hagiwara et al., 2003). It could play a similar role in uppermost epidermal layers. Defects in lipid metabolism or transport have already been implicated in epidermal barrier dysfunctions. Nine genes involved in several steps of these processes are overexpressed in granular keratinocytes, especially genes potentially acting on fatty acid (PNPLA1, THEM5, ADHD9, FAM83F) and ceramide (LASS3, ASAH3, SMPD3) metabolisms. We also identified an expressed retrocopy of prosaposin in the intron of SORCS2 (Sortilin-Related VPS10 domain Containing receptor 2). Interestingly, only 14 EST are present in the UniGene database, indicating transcription of the gene with a putative tissue-specificity. PSAPL1 showed strong granular keratinocyte specificity. Surprisingly, the parent gene and the retrocopy have little amino-acid sequence conservation but show the same domain architecture, including signal peptide sequence. These results suggest a relatively old retrotransposition evolving under strong selective constraints. This new transcribed retrogene may play an essential function in the synthesis of the lipids of the cornified layer of the epidermis. It could be involved in pathology, just like UTP14B, a retrogene that has been reported to cause recessive spermatogenic defect in mice when mutated (Bradley et al., 2004). A new gene of the Epidermal Differentiation Complex specifically expressed in granular keratinocytes was also identified in this study. No complete mRNA was present in public databases and this gene was not detected by automated predictions. Multiple alignment of predicted protein sequence with known members of these two close families showed that the new gene we identified is clearly related to LCE family and is thus probably involved in cornified envelope formation.

170 Résultats expérimentaux

CASZ1 is a transcription factor induced during embryogenesis in the course of mesenchyme differentiation (Liu et al., 2006), but its potential targets remain unexplored. Finally, 8 genes encoding hypothetical proteins without known domains such as C20orf95, CXorf33, or LOC440449 displayed also granular keratinocyte expression. Their role in epidermal differentiation remains thus completely elusive. After all, 65% of the genes tested by real-time PCR displayed overexpression in the course of epidermis differentiation. This shows that our means of candidate selection was particularly relevant to identify new granular keratinocyte-specific genes. As a whole, the EST generated in this work as well as the real-time PCR expression data provide a comprehensive resource for genes functioning in the establishment of the epidermis barrier function.

171 Résultats expérimentaux

REFERENCES Altschul, S. F., Madden, T. L., Schaffer, A. A., Zhang, J., Zhang, Z., Miller, W., and Lipman, D. J. (1997). Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res 25, 3389-3402. Askew, Y. S., Pak, S. C., Luke, C. J., Askew, D. J., Cataltepe, S., Mills, D. R., Kato, H., Lehoczky, J., Dewar, K., Birren, B., and Silverman, G. A. (2001). SERPINB12 is a novel member of the human ov-serpin family that is widely expressed and inhibits trypsin-like serine proteinases. J Biol Chem 276, 49320-49330. Bonnet-Duquennoy, M., Abaibou, H., Tailhardat, M., Lazou, K., Bosset, S., Le Varlet, B., Cleuziat, P., and Kurfurst, R. (2006). Study of housekeeping gene expression in human keratinocytes using OLISAtrade mark, a long-oligonucleotide microarray and q RT-PCR. Eur J Dermatol 16, 136-140. Bradley, J., Baltus, A., Skaletsky, H., Royce-Tolland, M., Dewar, K., and Page, D. C. (2004). An X-to-autosome retrogene is required for spermatogenesis in mice. Nat Genet 36, 872- 876. Caubet, C., Jonca, N., Lopez, F., Esteve, J. P., Simon, M., and Serre, G. (2004). Homo- oligomerization of human corneodesmosin is mediated by its N-terminal glycine loop domain. J Invest Dermatol 122, 747-754. Dias Neto, E., Correa, R. G., Verjovski-Almeida, S., Briones, M. R., Nagai, M. A., da Silva, W., Jr., Zago, M. A., Bordin, S., Costa, F. F., Goldman, G. H., et al. (2000). Shotgun sequencing of the human transcriptome with ORF expressed sequence tags. Proc Natl Acad Sci U S A 97, 3491-3496. Doering, T., Holleran, W. M., Potratz, A., Vielhaber, G., Elias, P. M., Suzuki, K., and Sandhoff, K. (1999). Sphingolipid activator proteins are required for epidermal permeability barrier formation. J Biol Chem 274, 11038-11045. Elias, P. M., Cullander, C., Mauro, T., Rassner, U., Komuves, L., Brown, B. E., and Menon, G. K. (1998). The secretory granular cell: the outermost granular cell as a specialized secretory cell. J Investig Dermatol Symp Proc 3, 87-100. Furuse, M., Hata, M., Furuse, K., Yoshida, Y., Haratake, A., Sugitani, Y., Noda, T., Kubo, A., and Tsukita, S. (2002). Claudin-based tight junctions are crucial for the mammalian epidermal barrier: a lesson from claudin-1-deficient mice. J Cell Biol 156, 1099-1111. Geirsson, A., Paliwal, I., Lynch, R. J., Bothwell, A. L., and Hammond, G. L. (2003). Class II transactivator promoter activity is suppressed through regulation by a trophoblast noncoding RNA. Transplantation 76, 387-394. Grundmann, U., Romisch, J., Siebold, B., Bohn, H., and Amann, E. (1990). Cloning and expression of a cDNA encoding human placental protein 11, a putative serine protease with diagnostic significance as a tumor marker. DNA Cell Biol 9, 243-250. Hagiwara, K., Kikuchi, T., Endo, Y., Huqun, Usui, K., Takahashi, M., Shibata, N., Kusakabe, T., Xin, H., Hoshi, S., et al. (2003). Mouse SWAM1 and SWAM2 are antibacterial proteins composed of a single whey acidic protein motif. J Immunol 170, 1973-1979. Hida, K., Wada, J., Eguchi, J., Zhang, H., Baba, M., Seida, A., Hashimoto, I., Okada, T., Yasuhara, A., Nakatsuka, A., et al. (2005). Visceral adipose tissue-derived serine protease inhibitor: a unique insulin-sensitizing adipocytokine in obesity. Proc Natl Acad Sci U S A 102, 10610-10615. Ji, P., Diederichs, S., Wang, W., Boing, S., Metzger, R., Schneider, P. M., Tidow, N., Brandt, B., Buerger, H., Bulk, E., et al. (2003). MALAT-1, a novel noncoding RNA, and thymosin beta4 predict metastasis and survival in early-stage non-small cell lung cancer. Oncogene 22, 8031-8041. Kalinin, A. E., Idler, W. W., Marekov, L. N., McPhie, P., Bowers, B., Steinert, P. M., and Steven, A. C. (2004). Co-assembly of envoplakin and periplakin into oligomers and

172 Résultats expérimentaux

Ca(2+)-dependent vesicle binding: implications for cornified cell envelope formation in stratified squamous epithelia. J Biol Chem 279, 22773-22780. Kent, W. J. (2002). BLAT--the BLAST-like alignment tool. Genome Res 12, 656-664. Leerkes, M. R., Caballero, O. L., Mackay, A., Torloni, H., O'Hare, M. J., Simpson, A. J., and de Souza, S. J. (2002). In silico comparison of the transcriptome derived from purified normal breast cells and breast tumor cell lines reveals candidate upregulated genes in breast tumor cells. Genomics 79, 257-265. Liu, Z., Yang, X., Tan, F., Cullion, K., and Thiele, C. J. (2006). Molecular cloning and characterization of human Castor, a novel human gene upregulated during cell differentiation. Biochem Biophys Res Commun 344, 834-844. Magnaldo, T., Fowlis, D., and Darmon, M. (1998). Galectin-7, a marker of all types of stratified epithelia. Differentiation 63, 159-168. Matsui, T., Hayashi-Kisumi, F., Kinoshita, Y., Katahira, S., Morita, K., Miyachi, Y., Ono, Y., Imai, T., Tanigawa, Y., Komiya, T., and Tsukita, S. (2004). Identification of novel keratinocyte-secreted peptides dermokine-alpha/-beta and a new stratified epithelium- secreted protein gene complex on human chromosome 19q13.1. Genomics 84, 384-397. Miyata, T., Inagi, R., Nangaku, M., Imasawa, T., Sato, M., Izuhara, Y., Suzuki, D., Yoshino, A., Onogi, H., Kimura, M., et al. (2002). Overexpression of the serpin megsin induces progressive mesangial cell proliferation and expansion. J Clin Invest 109, 585-593. Moffatt, P., Salois, P., St-Amant, N., Gaumond, M. H., and Lanctot, C. (2004). Identification of a conserved cluster of skin-specific genes encoding secreted proteins. Gene 334, 123- 131. Pascall, J. C., and Brown, K. D. (2004). Intramembrane cleavage of ephrinB3 by the human rhomboid family protease, RHBDL2. Biochem Biophys Res Commun 317, 244-252. Rogers, M. S., Kobayashi, T., Pittelkow, M. R., and Strehler, E. E. (2001). Human calmodulin-like protein is an epithelial-specific protein regulated during keratinocyte differentiation. Exp Cell Res 267, 216-224. Rozen, S., and Skaletsky, H. (2000). Primer3 on the WWW for general users and for biologist programmers. Methods Mol Biol 132, 365-386. Smith, C. M., and Steitz, J. A. (1998). Classification of gas5 as a multi-small-nucleolar-RNA (snoRNA) host gene and a member of the 5'-terminal oligopyrimidine gene family reveals common features of snoRNA host genes. Mol Cell Biol 18, 6897-6909. Smith, T. P., Grosse, W. M., Freking, B. A., Roberts, A. J., Stone, R. T., Casas, E., Wray, J. E., White, J., Cho, J., Fahrenkrug, S. C., et al. (2001). Sequence evaluation of four pooled-tissue normalized bovine cDNA libraries and construction of a gene index for cattle. Genome Res 11, 626-630. Thorvaldsen, J. L., Duran, K. L., and Bartolomei, M. S. (1998). Deletion of the H19 differentially methylated domain results in loss of imprinted expression of H19 and Igf2. Genes Dev 12, 3693-3702. Tosaka, Y., Tanaka, H., Yano, Y., Masai, K., Nozaki, M., Yomogida, K., Otani, S., Nojima, H., and Nishimune, Y. (2000). Identification and characterization of testis specific ornithine decarboxylase antizyme (OAZ-t) gene: expression in haploid germ cells and polyamine-induced frameshifting. Genes Cells 5, 265-276. Toulza, E., Galliano, M. F., Jonca, N., Gallinaro, H., Mechin, M. C., Ishida-Yamamoto, A., Serre, G., and Guerrin, M. (2006). The human dermokine gene: description of novel isoforms with different tissue-specific expression and subcellular location. J Invest Dermatol 126, 503-506. Vandesompele, J., De Preter, K., Pattyn, F., Poppe, B., Van Roy, N., De Paepe, A., and Speleman, F. (2002). Accurate normalization of real-time quantitative RT-PCR data by

173 Résultats expérimentaux

geometric averaging of multiple internal control genes. Genome Biol 3, RESEARCH0034. Vinckenbosch, N., Dupanloup, I., and Kaessmann, H. (2006). Evolutionary fate of retroposed gene copies in the human genome. Proc Natl Acad Sci U S A 103, 3220-3225. Watt, F. M., Celso, C. L., and Silva-Vargas, V. (2006). Epidermal stem cells: an update. Curr Opin Genet Dev. Weber, M. J. (2006). Mammalian small nucleolar RNAs are mobile genetic elements. PLoS Genet In press. Zhang, Y., and Tycko, B. (1992). Monoallelic expression of the human H19 gene. Nat Genet 1, 40-44.

174 Résultats expérimentaux

FIGURES

Figure 1 : Histological analysis of epidermis samples. A : Hematoxylin-eosin stained sections of entire epidermis after thermolysin incubation and separation from the dermis. B, C, and D : Remaining epidermis fragments after the first, second, and third trypsin incubation, respectively.

Table 1 : Expression ratios for KRT14 and KLK7 as measured by real time PCR from 4 independent samples. Sample # 1 2 3 4 K14 7.5 5.9 25 13.6 Expression (T1/T4) ratio KLK7 164 189 120 54 (T4/T1)

175 Résultats expérimentaux

Figure 2 : Analysis of ORESTES dataset. A: Repartition of the 22 585 sequences obtained from granular keratinocytes. B: Histogram showing the number of ORESTES at each level of redundancy.

A 0,8%

10,2% mRNA Genomic Mitochondrial 72,7% 26,5% 8,2% Ribosomal Uninformative 6,4% Bacterial 1,7%

B 1800

800 //

600

400

200 Number of occurences

0 // 1 1 1 1 1 1 1 1 2 4 0 1 2 3 4 4 6 9 1 0 1 2 3 4 5 6 7 8 9 1011121314161718192021222324252627282930 0 5 7 7 0 2 9 3 7 2 Number of ORESTES per gene

176 Résultats expérimentaux

Table 2 : Representative sample of genes with the highest number of ORESTES. Blue : ubiquitous genes with a high number of UniGene EST ; green : known epidermis specific genes ; yellow : genes with unknown function

Number of Number of Gene Symbol Full name ORESTES UniGene EST

402 KRT1 134 keratin 1 (epidermolytic hyperkeratosis) 217 DMKN 275 dermokine 193 TSPAN5 526 tetraspanin 5 142 RPS8 3382 ribosomal protein S8 140 LEP7 5 late envelope protein 7 (xp32) 127 DUOX2 64 dual oxidase 2 115 EEF1A1 29374 eukaryotic translation elongation factor 1 alpha 1 100 FLG 5 filaggrin 99 TMEM14C 476 transmembrane protein 14C 99 SERPINA12 11 serpin peptidase inhibitor, clade A (alpha-1 antitrypsin), member 12 77 HLA-B 4536 major histocompatibility complex, class I, B 71 RPL3 11561 ribosomal protein L3 71 KRT2A 12 keratin 2A (epidermal ichthyosis bullosa of Siemens) 66 SLC22A5 142 solute carrier family 22 (organic cation transporter), member 5 62 SPRR2E 36 small proline-rich protein 2E 62 NCL 2970 nucleolin 61 CASP14 19 caspase 14, apoptosis-related cysteine peptidase 59 CDSN 91 corneodesmosin 56 hKPRP 7 human keratinocyte proline rich protein 56 IFPS 10 ifapsoriasin 55 RPL28 2394 ribosomal protein L28 55 RPL7A 5864 ribosomal protein L7a 54 PKP1 263 plakophilin 1 (ectodermal dysplasia/skin fragility syndrome) 51 RPSA 5623 ribosomal protein SA 50 PABPC1 4385 poly(A) binding protein, cytoplasmic 1 41 C7orf24 309 chromosome 7 open reading frame 24 34 RPS18 2292 ribosomal protein S18 32 SBSN 49 suprabasin 30 DSG1 61 desmoglein 1

177 Résultats expérimentaux

Table 3A : Genes with less than 100 UniGene EST encoding known granular keratinocyte expressed genes.

Number of Number of Gene Symbol Full name ORESTES UniGene EST 2 LCE1F 1 late cornified envelope 1F 4 LCE2C 1 late cornified envelope 2C 1 C1orf46 2 chromosome 1 open reading frame 46 (xp 33) 1 LCE2A 3 late cornified envelope 2A 6 LCE5A 3 late cornified envelope 5A 11 LCE1A 3 late cornified envelope 1A 2 PGLYRP3 5 peptidoglycan recognition protein 3 5 LCE1C 5 late cornified envelope 1C 100 FLG 5 filaggrin 140 LEP7 5 late envelope protein 7 2 RPTN 6 repetin 1 LCE2B 7 late cornified envelope 2B 56 hKPRP 7 human keratinocyte proline rich protein 9 LOR 11 loricrin 71 KRT2A 12 keratin 2A (epidermal ichthyosis bullosa of Siemens) 2 C1orf42 15 chromosome 1 open reading frame 42 (NICE-1) 5 TGM5 15 transglutaminase 5 13 DSC1 17 desmocollin 1 16 KRT1B 18 keratin 1B 61 CASP14 19 caspase 14, apoptosis-related cysteine peptidase 1 CNFN 20 cornifelin 4 CALML5 25 calmodulin-like 5 1 ALOXE3 28 arachidonate lipoxygenase 3 8 ALOX12B 30 arachidonate 12-lipoxygenase, 12R type 62 SPRR2E 36 small proline-rich protein 2E 17 IVL 38 involucrin 2 EPPK1 42 epiplakin 1 5 POU2F3 45 POU domain, class 2, transcription factor 3 (oct-11) 4 ICHTHYIN 48 ichthyin 32 SBSN 49 suprabasin 2 KLK8 53 kallikrein 8 (neuropsin/ovasin) 4 TGM3 54 transglutaminase 3 1 ABCA12 55 ATP-binding cassette, sub-family A (ABC1), member 12 3 PADI1 56 peptidyl arginine deiminase, type I 30 DSG1 61 desmoglein 1 2 GJB3 65 gap junction protein, beta 3, 31kDa (connexin 31) 1 CALML3 68 calmodulin-like 3 13 SASpase 69 skin aspartic protease 15 KLK7 69 kallikrein 7 (chymotryptic, stratum corneum) 6 A2ML1 76 alpha-2-macroglobulin-like 1 1 CST6 78 cystatin E/M 1 SULT2B1 80 sulfotransferase family, cytosolic, 2B, member 1 2 KLK11 83 kallikrein 11 3 HAL 86 histidine ammonia-lyase (histidase) 14 EVPL 91 envoplakin 59 CDSN 91 corneodesmosin 3 PDZK1IP1 92 PDZK1 interacting protein 1 4 TGM1 92 transglutaminase 1 2 SERPINB8 99 serpin peptidase inhibitor, clade B (ovalbumin), member 8 20 SCEL 99 sciellin

178 Résultats expérimentaux

Table 3B : Genes with 100 or less UniGene EST, known as mainly expressed in a specific tissue different from epidermis.

UniGene ORESTES Gene Symbol Full name Main specificity EST 99 SERPINA12 11 serpin peptidase inhibitor, clade A, member 12 adipocytes 1 BSND 12 Bartter syndrome, infantile, with sensorineural deafness kidney and inner ear 1 OPN1LW 16 opsin 1 (cone pigments), long-wave-sensitive eye 5 GRIN2 16 G-protein-regulated inducer of neurite outgrowth brain 2 IL1RL2 24 interleukin 1 receptor-like 2 neuron 13 LCTL 25 lactase-like kidney 1 PPEF2 31 protein phosphatase, EF-hand calcium binding domain 2 retina 2 SLC6A3 34 solute carrier family 6 (dopamine transporter), 3 neuron 3 CDC42BPG 41 CDC42 binding protein kinase gamma (DMPK-like) heart and sk. muscle 4 GPR75 41 G protein-coupled receptor 75 retina 1 OTX1 45 orthodenticle homolog 1 (Drosophila) neuron 1 K5B 46 keratin 5b tongue 1 TBX15 46 T-box 15 embryo 3 TMPRSS5 53 transmembrane protease, serine 5 (spinesin) spinal chord 3 LEAP-2 53 liver-expressed antimicrobial peptide 2 liver 1 BMP8B 56 bone morphogenetic protein 8b (osteogenic protein 2) embryo 1 PTGFR 59 prostaglandin F receptor (FP) uterus 2 TEC 59 tec protein tyrosine kinase hematopoietic cells 3 SLC5A1 60 solute carrier family 5 (sodium/glucose transporter), 1 intestine and kidney 20 CASZ1 61 castor homolog 1, zinc finger (Drosophila) mesenchyme 2 KCNJ12 62 potassium inwardly-rectifying channel, subfamily J, 12 heart 1 P11 64 26 serine protease placenta 14 SERPINB7 64 serpin peptidase inhibitor, clade B (ovalbumin), 7 mesangial cells 127 DUOX2 64 dual oxidase 2 thyroid 3 GDPD2 68 glycerophosphodiester phosphodiesterase containing 2 osteoblasts 3 PDE11A 75 phosphodiesterase 11A testis 2 CLDN23 76 claudin 23 placenta 1 PLCL4 78 phospholipase C-like 4 neuron 1 EYA4 81 eyes absent homolog 4 (Drosophila) heart and cochlea 1 LIPH 85 lipase, member H stomach 1 RBP3 88 retinol binding protein 3, interstitial retina

179 Résultats expérimentaux

Table 3C : Genes with 100 or less UniGene EST, corresponding to uncharacterized paralogues of known genes.

Number of Number of Gene Symbol Full name ORESTES UniGene EST 13 ASAH3 4 N-acylsphingosine amidohydrolase (alkaline ceramidase) 3 11 CLEC2A 7 C-type lectin domain family 2, member A 2 IGFL3 12 insulin growth factor-like family member 3 5 TMPRSS11F 13 transmembrane protease, serine 11F 3 LYG2 14 lysozyme-like 1 PNPLA1 15 patatin-like phospholipase domain containing 1 9 GSDM1 16 gasdermin 1 1 GRID2IP 17 glutamate receptor, ionotropic, delta 2 (Grid2) interacting protein 2 IL1F7 17 interleukin 1 family, member 7 (zeta) 2 FCRL6 17 Fc receptor-like 6 3 AADACL2 20 arylacetamide deacetylase-like 2 1 LAMB4 26 laminin, beta 4 10 THEM5 26 thioesterase superfamily member 5 1 FLJ90165 27 gamma-glutamyltransferase 6 homolog (rat) 3 FLJ45651 28 phospholipase A2, group IVE 1 LPIN3 31 lipin 3 1 SLC25A34 36 solute carrier family 25, member 34 1 GPR115 37 G protein-coupled receptor 115 1 LRP5L 41 low density lipoprotein receptor-related protein 5-like 1 HSPC105 45 NAD(P) dependent steroid dehydrogenase-like 1 QPCTL 52 glutaminyl-peptide cyclotransferase-like 3 PLA2G4F 56 phospholipase A2, group IVF 1 KIAA0605 58 ADAMTS-like 2 1 CTGLF1 60 centaurin, gamma-like family, member 1 1 RHBDL2 62 rhomboid, veinlet-like 2 (Drosophila) 2 UGT3A2 65 UDP glycosyltransferase 3 family, polypeptide A2 1 GALNT17 74 polypeptide N-acetylgalactosaminyltransferase 17 1 BAIAP2L2 76 BAI1-associated protein 2-like 2 1 FLJ43692 80 ARHGEF5-like 1 VILL 86 villin-like 1 LOC203427 87 similar to solute carrier family 25 , member 16 1 IL17RE 100 interleukin 17 receptor E

180 Résultats expérimentaux

Table 3D : Unknown genes with 100 or less UniGene EST.

Number of Number of Gene Symbol Full name ORESTES UniGene EST 1 FLJ43861 3 FLJ43861 1 LOC389791 3 hypothetical gene supported by AK094537 1 LOC285435 4 hypothetical LOC285435 2 LOC387846 6 hypothetical LOC387846 4 LOC401062 6 hypothetical gene supported by AK092973 1 IMAGE:5260914 7 IMAGE:5260914 5 LOC338667 7 hypothetical protein LOC338667 5 PSORS1C2 8 psoriasis susceptibility 1 candidate 2 1 DKFZp779B1540 9 hypothetical protein DKFZp779B1540 5 C14orf72 9 chromosome 14 open reading frame 72 1 FLJ37989 10 FLJ37989 56 IFPS 10 ifapsoriasin 10 WFDC5 11 WAP four-disulfide core domain 5 1 LOC402110 12 hypothetical LOC402110 1 PLEKHN1 12 pleckstrin homology domain containing, family N member 1 1 LOC441240 13 hypothetical protein LOC441240 4 FLJ38159 14 hypothetical protein FLJ38159 1 C1orf177 15 chromosome 1 open reading frame 177 1 HMCN2 16 hemicentin 2 2 MGC23985 16 similar to AVLV472 1 OFCC1 17 orofacial cleft 1 candidate 1 1 LOC441860 17 novel KRAB box containing C2H2 type zinc finger protein 5 AMIGO3 18 adhesion molecule with Ig-like domain 3 1 LOC441257 20 hypothetical protein LOC441257 1 LOC285484 20 hypothetical protein LOC285484 1 C20orf91 20 chromosome 20 open reading frame 91 1 LOC202460 21 hypothetical protein LOC202460 2 FLJ25664 21 FLJ25664 8 FLJ41623 21 FLJ41623 10 LOC342897 21 similar to F-box only protein 2 1 LOC339237 23 similar to Envoplakin 13 LOC126248 24 hypothetical protein LOC126248 1 LOC389142 27 hypothetical LOC389142 3 C20orf95 28 chromosome 20 open reading frame 95 1 FKBP9L 31 FK506 binding protein 9-like 1 FNDC8 31 fibronectin type III domain containing 8 3 FLJ46311 31 FLJ46311 protein 1 C3orf47 33 chromosome 3 open reading frame 47 1 LOC283143 35 hypothetical protein LOC283143 1 LOC388727 35 hypothetical LOC388727 2 FLJ44317 35 FLJ44317 1 FLJ31184 36 FLJ31184 1 LOC125893 39 hypothetical protein LOC125893 1 ZNF311 40 zinc finger protein 311 1 BC041923 40 IMAGE:5300199 2 ZNF600 43 zinc finger protein 600 3 MCMDC1 43 minichromosome maintenance deficient domain containing 1 3 FLJ13646 46 hypothetical protein FLJ13646 1 C14orf121 48 chromosome 14 open reading frame 121 1 FAM83F 49 family with sequence similarity 83, member F 3 ABHD9 51 abhydrolase domain containing 9

181 Résultats expérimentaux

1 LOC134466 52 hypothetical protein LOC134466 1 CXorf33 52 chromosome X open reading frame 33 2 FLJ25006 52 hypothetical protein FLJ25006 2 DKFZp434N062 53 hypothetical protein DKFZp434N062 9 LASS3 53 LAG1 longevity assurance homolog 3 (S. cerevisiae) 1 C14orf21 54 chromosome 14 open reading frame 21 1 C17orf67 56 chromosome 17 open reading frame 67 1 FAM62C 58 family with sequence similarity 62, member C 2 C14orf29 60 chromosome 14 open reading frame 29 1 FLJ21736 61 esterase 31 3 LOC349114 61 hypothetical protein LOC349114 1 MGC26885 62 hypothetical protein MGC26885 1 SMA3 62 SMA3 8 FAM46B 62 family with sequence similarity 46, member B 13 ELMOD1 62 ELMO/CED-12 domain containing 1 3 DENND2C 63 DENN/MADD domain containing 2C 13 ANKRD35 64 ankyrin repeat domain 35 5 LOC401553 66 hypothetical gene supported by BC019073 1 LOC390927 67 similar to zinc finger protein 569 1 ZNF696 67 zinc finger protein 696 2 CCDC9 69 coiled-coil domain containing 9 6 C15orf40 70 chromosome 15 open reading frame 40 1 LOC148137 73 hypothetical protein BC017947 1 ZC3H12C 74 zinc finger CCCH-type containing 12C 1 APXL2 74 apical protein 2 1 ZMYND19 75 zinc finger, MYND-type containing 19 1 LRRC37B 77 leucine rich repeat containing 37B 2 FLJ32356 77 family with sequence similarity 109, member A 3 DQX1 77 DEAQ box polypeptide 1 (RNA-dependent ATPase) 2 C9orf9 79 chromosome 9 open reading frame 9 4 FNDC6 79 fibronectin type III domain containing 6 1 MSTP9 82 macrophage stimulating, pseudogene 9 1 HES2 83 hairy and enhancer of split 2 (Drosophila) 1 FLJ37464 84 hypothetical protein FLJ37464 1 KIAA1862 84 KIAA1862 protein 1 LOC196264 86 hypothetical protein LOC196264 1 C1orf51 86 chromosome 1 open reading frame 51 2 ANKRD5 86 ankyrin repeat domain 5 1 CXorf23 87 chromosome X open reading frame 23 2 SMCR8 88 Smith-Magenis syndrome chromosome region, candidate 8 2 DKFZp686L1814 88 hypothetical protein DKFZp686L1814 2 MGC34647 88 hypothetical protein MGC34647 1 C6orf105 89 chromosome 6 open reading frame 105 1 FLJ23186 90 chromosome 3 open reading frame 52 1 SAMD10 91 sterile alpha motif domain containing 10 2 KIAA1287 91 KIAA1287 2 C19orf36 91 chromosome 19 open reading frame 36 1 ZNF662 93 zinc finger protein 662 2 ZNF429 97 zinc finger protein 429 12 SMPD3 98 sphingomyelin phosphodiesterase 3 1 PCGF1 100 polycomb group ring finger 1 1 C17orf61 100 chromosome 17 open reading frame 61 1 KIAA1853 100 KIAA1853 1 C22orf23 100 chromosome 22 open reading frame 23

182 Résultats expérimentaux

Table 4 : Real-time PCR experiments. T4* : T4/T1 ratio between 5 and 20 ; ** : T4/T1 ratio between 20 and 100 ; *** : T4/T1 ratio higher than 100.

Gene UniGene ORESTES Full name PCRQ symbol EST 8 LCE6A new Late Cornified Envelope member - T4*** 56 IFPS ifapsoriasin 10 T4*** 9 GSDM1 gasdermin 1 16 T4*** 2 IL1F7 interleukin 1 family, member 7 (zeta) 17 T4*** 2 SLC37A2 solute carrier family 37 (glycerol-3-phosphate transporter), 2 67 T4*** 10 PSAPL1 prosaposin-like 1 - T4** 10 LOC440449 Similar to WDNM1 homolog (LOC645638) - T4** 1 WFDC12 WAP four-disulfide core domain 12 (WAP2) 3 T4** 13 ASAH3 N-acylsphingosine amidohydrolase (alkaline ceramidase) 3 4 T4** 99 SERPINA12 serpin peptidase inhibitor, clade A, member 12 11 T4** 5 TMPRSS11F transmembrane protease, serine 11F 13 T4** 3 C20orf95 chromosome 20 open reading frame 95 28 T4** 13 ELMOD1 ELMO/CED-12 domain containing 1 62 T4** 12 SMPD3 sphingomyelin phosphodiesterase 3 98 T4** 6 SERPINB12 serpin peptidase inhibitor, clade B (ovalbumin), member 12 6 T4* 5 PSORS1C2 psoriasis susceptibility 1 candidate 2 8 T4* 1 PLEKHN1 pleckstrin homology domain containing, family N member 1 12 T4* 1 PNPLA1 patatin-like phospholipase domain containing 1 15 T4* 3 AADACL2 arylacetamide deacetylase-like 2 20 T4* 10 LOC342897 similar to F-box only protein 2 21 T4* 10 THEM5 thioesterase superfamily member 5 26 T4* 1 GGT6 gamma-glutamyltransferase 6 homolog (rat) 27 T4* 1 FAM83F family with sequence similarity 83, member F 49 T4* 3 ABHD9 abhydrolase domain containing 9 51 T4* 1 CXorf33 chromosome X open reading frame 33 52 T4* 9 LASS3 LAG1 longevity assurance homolog 3 (S. cerevisiae) 53 T4* 20 CASZ1 castor homolog 1, zinc finger (Drosophila) 61 T4* 1 RHBDL2 rhomboid, veinlet-like 2 (Drosophila) 62 T4* 8 FAM46B family with sequence similarity 46, member B 62 T4* 1 P11 26 serine protease 64 T4* 14 SERPINB7 serpin peptidase inhibitor, clade B (ovalbumin), member 7 64 T4* 1 TMPRSS13 transmembrane protease, serine 13 75 T4* 2 CLDN23 claudin 23 76 T4* 2 TMEM16H transmembrane protein 16H 78 T4* 1 CARD14 caspase recruitment domain family, member 14 86 T4* 1 C3orf52 chromosome 3 open reading frame 52 90 T4* 10 WFDC5 WAP four-disulfide core domain 5 (WAP1) 11 T1 = T4 5 KIAA0514 KIAA0514 16 T1 = T4 5 AMIGO3 adhesion molecule with Ig-like domain 3 18 T1 = T4

183 Résultats expérimentaux

3 PLA2G4E phospholipase A2, group IVE 28 T1 = T4 1 HSPC105 NAD(P) dependent steroid dehydrogenase-like 45 T1 = T4 3 PLA2G4F phospholipase A2, group IVF 56 T1 = T4 127 DUOX2 dual oxidase 2 64 T1 = T4 1 APXL2 apical protein 2 74 T1 = T4 3 RAB38 RAB38, member RAS oncogene family 79 T1 = T4 1 AFMID arylformamidase 87 T1 = T4 3 CDC42BPG CDC42 binding protein kinase gamma (DMPK-like) 41 T1 3 LEAP-2 liver-expressed antimicrobial peptide 2 53 T1 1 LRP5L low density lipoprotein receptor-related protein 5-like 41 T1 3 MCMDC1 minichromosome maintenance deficient domain containing 1 43 T1 1 C14orf21 chromosome 14 open reading frame 21 54 T1 1 NEIL3 nei endonuclease VIII-like 3 (E. coli) 76 T1 4 FNDC6 fibronectin type III domain containing 6 79 T1 2 ANKRD5 ankyrin repeat domain 5 86 T1 2 KIAA1287 KIAA1287 91 T1

Figure 3 : Sample of custom track on the human UCSC Genome Browser.

184 Résultats expérimentaux

Figure 4 : ORESTES representation of genes lying in the Epidermal Differentiation Complex (EDC). Top panel : schematic view of the EDC by the UCSC genome browser according to the hg18 assembly (NCBI Build 36.1, March 2006) ; bottom panel : number of ORESTES for each gene of the locus (bold : genes with at least one ORESTE, underlined with red bars : new genes described in this work).

Figure 5 : Phylogenetic tree of LCE and SPRR members including LCE6A.

185 Résultats expérimentaux

Figure 6 : Expression profile of newly identified genes. PBL : Peripheral Blood Leukocytes.

186 Résultats expérimentaux

Supplementary table S1 : Genes with 100 or less UniGene EST expressed in numerous tissues for which epidermal expression had never been assessed.

Gene UniGene ORESTES Full name Symbol EST 1 WFDC12 3 WAP four-disulfide core domain 12 6 SERPINB12 6 serpin peptidase inhibitor, clade B (ovalbumin), member 12 4 ROH1 9 1 LOC401904 11 similar to 60S ribosomal protein L23a 2 WNT16 11 wingless-type MMTV integration site family, member 16 1 LOC388574 12 similar to 60S ribosomal protein L23a 4 BPIL2 13 bactericidal/permeability-increasing protein-like 2 2 RAET1E 16 retinoic acid early transcript 1E 2 CD207 17 CD207 antigen, langerin 13 LY6G6C 19 lymphocyte antigen 6 complex, locus G6C 1 SOAT2 21 sterol O-acyltransferase 2 2 FAM10A5 24 family with sequence similarity 10, member A5 1 ZNF396 26 zinc finger protein 396 1 RPS6KA6 28 ribosomal protein S6 kinase, 90kDa, polypeptide 6 1 PASD1 29 PAS domain containing 1 34 LOC400590 30 hypothetical LOC400590 11 SLC15A1 30 solute carrier family 15 (oligopeptide transporter), member 1 1 XKRX 31 XK, Kell blood group complex subunit-related, X-linked 1 ANKRD20A 31 ankyrin repeat domain 20 family, member A1 6 OR2A20P 34 olfactory receptor, family 2, subfamily A, member 20 pseudogene 1 HAVCR1 34 hepatitis A virus cellular receptor 1 5 RHOV 36 ras homolog gene family, member V 1 INCA1 38 inhibitor of CDK interacting with cyclin A1 1 BNC1 39 basonuclin 1 1 CARD15 39 caspase recruitment domain family, member 15 3 LGALS7 40 lectin, galactoside-binding, soluble, 7 (galectin 7) 1 IL22RA1 40 interleukin 22 receptor, alpha 1 4 SERPINB13 42 serpin peptidase inhibitor, clade B (ovalbumin), member 13 1 NIP 45 homolog of Drosophila Numb-interacting protein 2 ATG9B 46 ATG9 autophagy related 9 homolog B (S. cerevisiae) 5 MAPK15 47 mitogen-activated protein kinase 15 5 CCL22 48 chemokine (C-C motif) ligand 22 1 ACCN3 48 amiloride-sensitive cation channel 3 2 RNF39 48 ring finger protein 39 5 GJB5 50 gap junction protein, beta 5 (connexin 31.1) 1 GGTA1 50 glycoprotein, alpha-galactosyltransferase 1 2 SOX15 51 SRY (sex determining region Y)-box 15 2 SFTPD 53 surfactant, pulmonary-associated protein D 1 RP11-19J3.3 54 hypothetical protein MGC88047 4 GSTT2 55 glutathione S-transferase theta 2

187 Résultats expérimentaux

2 GRHL3 56 grainyhead-like 3 (Drosophila) 2 BNIPL 58 BCL2/adenovirus E1B 19kD interacting protein like 1 KLC2L 60 kinesin light chain 3 2 BLOC1S3 61 biogenesis of lysosome-related organelles complex-1, subunit 3 phosphodiesterase 4C, cAMP-specific (phosphodiesterase E1 dunce 1 PDE4C 63 homolog, Drosophila) 2 SLC6A9 63 solute carrier family 6 (neurotransmitter transporter, glycine), member 9 1 GIPC2 64 GIPC PDZ domain containing family, member 2 2 CBLC 65 Cas-Br-M (murine) ecotropic retroviral transforming sequence c 2 IPMK 65 inositol polyphosphate multikinase 5 USP43 67 ubiquitin specific peptidase 43 1 HYPE 67 Huntingtin interacting protein E 2 SLC37A2 67 solute carrier family 37 (glycerol-3-phosphate transporter), member 2 1 HCN1 69 hyperpolarization activated cyclic nucleotide-gated potassium channel 1 1 TXK 71 TXK tyrosine kinase 3 MYCL1 72 v-myc myelocytomatosis viral oncogene homolog 1, lung carcinoma derived 1 LGR6 72 leucine-rich repeat-containing G protein-coupled receptor 6 1 LOC440582 73 similar to Peptidyl-prolyl cis-trans isomerase E (Cyclophilin 33) 1 HLA-DQB2 74 major histocompatibility complex, class II, DQ beta 2 2 FBXO27 74 F-box protein 27 6 CCL27 75 chemokine (C-C motif) ligand 27 1 MSP 75 transmembrane protease, serine 13 5 GCET2 75 germinal center expressed transcript 2 1 NEIL3 76 nei endonuclease VIII-like 3 (E. coli) 1 SLC6A16 77 solute carrier family 6, member 16 2 TMEM16H 78 transmembrane protein 16H 4 USF1 79 upstream transcription factor 1 3 RAB38 79 RAB38, member RAS oncogene family 1 CBR3 79 carbonyl reductase 3 1 TLR3 81 toll-like receptor 3 4 CHMP4C 81 chromatin modifying protein 4C 1 FBF-1 81 Fas (TNFRSF6) binding factor 1 1 RNASEL 81 ribonuclease L (2',5'-oligoisoadenylate synthetase-dependent) 1 ENTPD7 83 ectonucleoside triphosphate diphosphohydrolase 7 2 GPR39 85 G protein-coupled receptor 39 1 CARD14 86 caspase recruitment domain family, member 14 4 COL5A3 86 collagen, type V, alpha 3 1 TRAF3IP1 86 TNF receptor-associated factor 3 interacting protein 1 1 TRMT5 86 TRM5 tRNA methyltransferase 5 homolog (S. cerevisiae) 1 AFMID 87 arylformamidase 2 GAL3ST4 87 galactose-3-O-sulfotransferase 4 1 PROM2 88 prominin 2 1 PTK6 88 PTK6 protein tyrosine kinase 6 2 TNFRSF10A 88 tumor necrosis factor receptor superfamily, member 10a 1 IL7 89 interleukin 7

188 Résultats expérimentaux

3 PLXDC2 89 plexin domain containing 2 1 IGSF9 90 immunoglobulin superfamily, member 9 3 PUS3 90 pseudouridylate synthase 3 1 DSCR1L2 91 Down syndrome critical region gene 1-like 2 2 N4BP3 91 Nedd4 binding protein 3 2 RGR 91 Ral-GDS related protein Rgr 1 AP4E1 91 adaptor-related protein complex 4, epsilon 1 subunit 1 CHRNB1 92 cholinergic receptor, nicotinic, beta 1 (muscle) 1 FRAT2 92 frequently rearranged in advanced T-cell lymphomas 2 2 ADAMTS17 93 ADAM metallopeptidase with thrombospondin type 1 motif, 17 1 SLC6A17 93 solute carrier family 6, member 17 1 SURF2 93 surfeit 2 3 ANXA9 93 annexin A9 1 DNAH9 94 dynein, axonemal, heavy polypeptide 9 1 ESPN 94 espin 2 JPH2 94 junctophilin 2 1 ARHGEF5 94 Rho guanine nucleotide exchange factor (GEF) 5 2 LOC283874 95 hypothetical protein LOC283874 2 SLC9A3 96 solute carrier family 9 (sodium/hydrogen exchanger), member 3 1 LTB4R 96 leukotriene B4 receptor 1 SLC30A4 98 solute carrier family 30 (zinc transporter), member 4 1 HRH1 98 histamine receptor H1 2 PIK3C2G 98 phosphoinositide-3-kinase, class 2, gamma polypeptide 3 TRAF6 98 TNF receptor-associated factor 6 1 CD96 99 CD96 antigen 1 RASGEF1B 99 RasGEF domain family, member 1B 3 DUOX1 100 dual oxidase 1

189

III. RÉSULTATS COMPLÉMENTAIRES ET DISCUSSION

191

Résultats complémentaires et discussion

Parmi plus de 7 millions d’EST présents dans les banques de données, seulement un nombre de séquences insignifiant (1200 séquences) provient de kératinocytes d’épiderme sain. Il s’agit de plus uniquement d’EST obtenus à partir de kératinocytes prolifératifs, cultivés in vitro. Les autres séquences, identifiées dans la banque UniGene comme provenant d’échantillons de peau, proviennent en fait de banques de fibroblastes dermiques, de lignées de mélanocytes ou de carcinomes épidermoïdes. Ces chiffres témoignent du retard considérable qui a été pris dans l’étude de l’épiderme. La production des premières séquences a permis le repérage de deux nouveaux gènes alors inconnus. La dermokine et l’α2 macroglobulin-like 1 ont ainsi été rapidement caractérisées au laboratoire, parallèlement à la poursuite de la description du transcriptome du kératinocyte granuleux à grande échelle.

1 La dermokine Au cours de notre travail de caractérisation de la dermokine humaine, ce gène a été décrit chez la souris, transcrit sous 2 isoformes α et β, qui comportent un peptide signal dans leur séquence protéique prédite. Nous avons identifié 2 nouveaux groupes de transcrits de la dermokine dans l’épiderme humain normal. Le groupe γ, spécifique de l’épiderme et vraisemblablement transcrit à partir du même promoteur que l’isoforme β, comprend les isoformes γ1 et γ2 qui diffèrent par l’épissage alternatif de l’exon 9. Le groupe δ comprend les seules isoformes intracellulaires et exprimées de façon ubiquitaire. Neuf transcrits différents ont été identifiés dans l’épiderme: δ1, δ2, δ3, δ4, δ5a-b, δ6a-c, différant par l’épissage alternatif des exons 8, 9, 10, 11 et 19 (figure 35), et codant potentiellement pour 6 protéines différentes δ1 à δ6. Nos résultats montrent aussi que les isoformes β et γ sont spécifiques du kératinocyte granuleux, alors que l’isoforme α est exprimée dans toutes les couches de l’épiderme et dans le placenta. La fonction précise de ces différentes isoformes n’a pu toutefois être précisée, faute de domaines protéiques connus. Les isoformes β et γ apparaissent, en termes de nombre d’ORESTES, comme très fortement transcrites dans le kératinocyte granuleux. Les isoformes γ1 et γ2 diffèrent de l’isoforme β par l’utilisation d’un exon 3’ alternatif terminal contenant un signal de polyadénylation. Comme l’isoforme β, elles comprennent dans leur séquence protéique une région riche en glycine et serine. Les acides aminés 235 à 329, codés par les exons 4, 5 et 7, contiennent 41,1% de serine et 38,9% de glycine. De tels domaines ont été identifiés dans les cytokératines, la loricrine ou certaines protéines de liaison à l’ARN, où ils forment selon le modèle de Peter

193 Résultats complémentaires et discussion

Steinert des structures en « boucles glycine » (Steinert et al., 1991). Celles-ci seraient responsables des propriétés d’adhérence et de flexibilité de ces protéines qui pourraient s’assembler grâce à ces domaines à la manière d’un velcro.

AB M M * * M 2 2 6 7 8 9 11 12 13 15 16 18 20 1 22 24 δ1 1 2 3 45 78 12 13 15 16 18 20 22 24 β M 1 2 * 6 7 8 9 12 13 15 161819 20 1 22 24 δ2 M M 2 * * 6 7 8 9 12 13 15 1618 20 1 22 24 δ3 M * 1 2 3 45 78 9 12 13 14 γ 2 6 7 8 9 10 11 12 13 15 1618 20 1 22 24 δ4 M 2 * M M M 6 7 8 12 13 15 161819 20 1 22 24 δ5-a * M * 2 2 6 7 8 9 10 11 12 13 15 16 1819 20 22 24 δ 6 7 12 13 15 161819 20 1 22 24 δ5-b 1 M 2 * 6 7 8 11 12 13 15 1618 20 1 22 24 M δ6-a M * * 2 2 6 7 8 12 13 15 1618 20 1 22 24 δ6-b 100 pb 17 18 20 22 24 α M 1 2 * 6 7 12 13 15 1618 20 1 22 24 δ6-c

Figure 35 : représentation schématique des différentes isoformes de dermokine. A : groupes d’isoformes α, β, γ et δ. B : détail de l’ensemble des transcrits de l’isoforme δ. Les exons alternatifs sont représentés en gris, les exons spécifiques d’un groupe d’isoformes sont hachurés et la région protéique prédite riche en glycine et serine est représentée en pointillés. M : méthionine initiatrice, * : codon stop, triangle : domaine RGD.

Selon ce modèle, des régions longues de 50 à 150 résidus contenant des répétitions riches en glycine et en résidus polaires tels que serine, asparagine, arginine, ou cystéine, sont entrecoupées par des acides aminés aromatiques ou éventuellement aliphatiques qui forment les « pieds » des boucles. D’autres protéines riches en glycine et serine identifiées dans la nacre (lustrine) ou la soie (séricine) satisfont aux critères du modèle de Peter Steinert. La cornéodesmosine enfin, contient 2 domaines qui s’organisent vraisemblablement en « boucles glycine » et qui sont responsables des propriétés d’adhérence homophile de la protéine au sein du cœur extracellulaire des cornéodesmosomes (Caubet et al., 2004). Toutefois, la région riche en glycine et serine des dermokines β/γ ne comporte pas d’acides aminés aromatiques ou aliphatiques et ne rentre donc pas dans le cadre du modèle des « boucles glycine ». La présence d’une cystéine de part et d’autre de cette région pourrait cependant être à l’origine d’un pont disulfure intramoléculaire et permettre la formation d’une seule grande boucle de 100 résidus chez l’homme et 121 résidus chez la souris. Nous n’avons néanmoins pas pu mettre en évidence d’interactions homophiles de la dermokine β, ni hétérophiles avec la cornéodesmosine par des expériences de coimmunoprécipitation (résultats non montrés). D’autre part les expériences d’immunomicroscopie électronique montrent que les dermokines

194 Résultats complémentaires et discussion

β/γ sont sécrétées dans l’espace intercornéocytaire mais ne sont pas localisées au niveau des cornéodesmosomes. La séquence protéique des dermokines β/γ humaines contient un motif RGDS en position 296. Le tripeptide RGD est retrouvé dans de nombreuses protéines de la matrice extracellulaire et permet la liaison aux récepteurs membranaires de la famille des intégrines. Les intégrines exprimées dans l’épiderme normal semblent spécifiques de la couche basale. Toutefois, les auteurs de l’étude récente du transcriptome épidermique par puces à ADN font état par des résultats non montrés d’une expression persistante dans les couches suprabasales des intégrines α5 et β1 (Radoja et al., 2006). Enfin, même si la dermokine prédite chez la souris contient une séquence RGD, celle-ci présente une localisation différente au sein de la protéine (position 83) et se traduit par un motif RGDV. Ces isoformes sécrétées de dermokine ne correspondent pas non plus à des protéoglycanes, leur détection en Western blotting ne révélant pas de bandes de haut PM. Le traitement à la N- glycosidase F (PNGase) n’a pas mis en évidence de modification significative du PM apparent de la protéine, et le traitement par la sialidase induit un tassement subtil de la bande observée en Western blotting (résultats non montrés). L’analyse de la dermokine β humaine ou murine avec l’outil PredictProtein, qui permet une analyse détaillée des propriétés physico- chimiques et de la structure prédite de la protéine (Rost and Liu, 2003), n’a pas révélé de nouvelles pistes quant à sa fonction potentielle. Toutefois, l’hydrophilie moyenne des dermokine β/γ est supérieure à 1 selon l’algorithme de Kyte et Doolittle (Kyte and Doolittle, 1982). Ces isoformes, que nous supposons très abondantes, pourraient contribuer à l’hydratation de la couche cornée. L’incubation de la dermokine β produite sous forme recombinante en fusion avec un épitope V5-his, en présence de tranglutaminase 2 commerciale montre une bande de haut poids moléculaire après révélation par western blotting anti-V5 (Figure 36, piste 3). Cette bande correspond à des molécules de dermokine liées par des liaisons covalentes. La dermokine β constitue donc in vitro un substrat pour la transglutaminase 2, et pourrait être incorporée in vivo à l’enveloppe cornée sous l’action des transglutaminases 1, 3 et/ou 5. Enfin, des analyses sur cryocoupe de peau (cuir chevelu) par immunofluorescence avec un double marquage anti-CDSN ont montré que les isoformes de dermokine β et γ sont exprimées dans la gaine épithéliale interne du follicule pileux (Figure 37).

195 Résultats complémentaires et discussion

Figure 36 : incubation de dermokine β recombinante en présence de transglutaminase 2 (TGM2) et western blotting anti-V5. Piste 1 : dermokine β seule, piste 2 : incubation en l’absence de TGM2, piste 3 : incubation en présence de TGM2.

Figure 37 : immunofluorescence sur cryocoupe de follicule pileux. A : anticorps anti-dermokine ; B : anticorps anti-cornéodesmosine ; C : contraste de phase ; D : superposition A+B.

L’isoforme δ, transcrite à partir d’un 3ème promoteur est, de façon intrigante, exprimée dans de nombreux types cellulaires. Sa séquence protéique prédite ne comporte pas de peptide signal, et des expériences de production de protéine recombinante in vitro confirment sa localisation intracellulaire. Cette isoforme est de plus soumise à un épissage complexe : nous avons cloné 13 ARNm différents résultant de l’usage de 5 exons alternatifs à partir d’épiderme humain. Là

196 Résultats complémentaires et discussion encore, l’absence de domaine protéique connu ou de signaux de localisation subcellulaire ne permet pas de spéculer sur sa fonction putative. Un premier anticorps commercial, produit contre un peptide carboxy-terminal partagé par les isoformes β, δ et α a été testé et s’est avéré incapable de reconnaître la protéine recombinante. Un second anticorps anti-peptide a été produit au laboratoire. Capable de reconnaître la protéine recombinante en Western blotting, sa sensibilité s’est avérée toutefois insuffisante pour la détection de la forme endogène et pour une utilisation en immunohistochimie ou en immunofluorescence. L’isoforme α ne comporte pas non plus de domaines protéiques connus. Nous avons montré que 3 groupes d’isoformes (dermokine β, γ and α) codent pour des protéines sécrétées alors que la dermokine δ code pour des protéines intracellulaires. De tels exemples de produits d’un même gène avec ou sans peptide signal sont rares dans la littérature. La gelsoline est produite sous 2 formes, sécrétée et intracellulaire, par l’utilisation de 2 sites d’initiation de la transcription situés sur des exons 5’ alternatifs (Kwiatkowski et al., 1988). Toutefois, ces isoformes semblent jouer le même rôle dans les 2 compartiments, c’est à dire la dépolymérisation et la clairance de l’actine. La transferrine est synthétisée principalement dans le foie où elle est sécrétée. Les oligodendrocytes expriment cependant de façon spécifique un transcrit alternatif ne comportant pas de peptide signal et codant pour une isoforme cytosolique de la protéine. La transferrine joue vraisemblablement dans ces cellules un rôle particulier, autre que le transport de fer, et pourrait être impliquée dans le processus de myélinisation (de Arriba Zerpa et al., 2000). Enfin, CHRDL2 (chordin-like 2), présente un épissage alternatif conduisant à la présence ou non d’un peptide signal, régulé au cours de la différenciation des myoblastes et des ostéoblastes, ce qui suggère un rôle pour la protéine dans ces processus (Oren et al., 2004). De façon intéressante, dans chacun de ces 3 exemples, la production de transcrits alternatifs codant pour des protéines avec une localisation différente est associée à une spécificité tissulaire d’expression, comme c’est le cas pour la dermokine. Le patron d’expression des différentes isoformes de dermokine, associé avec la localisation subcellulaire, cytosolique ou sécrétée, suggère que ces isoformes pourraient jouer des rôles physiologiques très différents. De plus, le point isoélectrique des différentes isoformes est très divergent: les dermokine β et γ, suprabasales et de grande taille, sont légèrement acides (pI 6,88 et 6,15, respectivement) alors que les petites isoformes δ et α sont fortement basiques (pI 9,8 et 9,88, respectivement). Pour conclure, la fonction des différentes isoformes de dermokine reste à déterminer. Des expériences de double hybride chez la levure avec différentes régions protéiques sont actuellement en cours au laboratoire dans le but d’identifier des partenaires potentiels pour

197 Résultats complémentaires et discussion chacun des groupes d’isoformes. L’inactivation spécifique de l’isoforme β chez la souris par recombinaison homologue ou par insertion pourrait induire un phénotype cutané et apporter des informations nouvelles concernant les fonctions de cette protéine. L’isoforme δ, elle ne semble pas être présente chez la souris. L’analyse de l’ensemble des EST présents chez cette espèce, ainsi que la recherche d’homologie de son 1er exon, n’ont pas permis d’identifier cette isoforme. Pour ce qui concerne l’isoforme γ, le site accepteur d’épissage, le codon stop et le signal de polyadénylation sont conservés chez la souris, mais aucun EST contenant cet exon potentiel n’est pour le moment présent dans les banques de données. De plus, les expériences de Northern blot effectuées chez la souris montrent uniquement la présence de 2 isoformes, α et β (Matsui et al., 2004; Moffatt et al., 2004).

2 L’alpha 2 macroglubulin-like 1 (A2ML1) Grâce à la production d’EST, nous avons aussi identifié un nouvel inhibiteur de protéases de la famille des α2-macroglobulines, dont l’expression dans l’épiderme est restreinte à la couche granuleuse. En accord avec le HGNC (HUGO Gene Nomenclature Committee), nous avons nommé ce gène A2ML1 (Alpha 2 Macroglobulin-Like 1). Des transcrits ont été détectés par PCR sur des ADNc commerciaux préparés à partir de placenta, de thymus et de testicule. Toutefois, A2ML1 n’a pu être détectée dans des extraits protéiques commerciaux de placenta et de testicule, alors que l’anticorps fonctionne très bien en Western blotting et en immunohistochimie sur extraits ou coupes d’épiderme humain. Il semble donc que si la protéine est présente dans ces tissus, c’est dans de très faibles proportions. D’autre part, parmi les 67 EST présents dans les banques de données, 5 proviennent de placenta, 5 de testicule, et les autres ont été clonés en grande majorité à partir de tissus exprimant un programme de différenciation proche de celui de l’épiderme comme la langue, l’oesophage, l’hypopharynx ou des carcinomes épidermoïdes. In vitro, A2ML1 présente une meilleure efficacité d’inhibition sur les protéases de type chymotrypsine comme la SCCE, la papaïne et la subtilisine, que sur les protéases de la famille de la trypsine. Nous avons aussi montré qu’elle est capable de se lier de façon covalente à la SCCE, probablement grâce à une réaction de la protéase avec la liaison thiol ester interne de A2ML1. In vivo, SCCE pourrait donc constituer la cible physiologique de A2ML1. Des expériences d’immunomicroscopie électronique montrent de plus que A2ML1 est sécrétée par les kératinosomes dans l’espace extracellulaire à l’interface de la couche granuleuse et de la couche cornée. Sa liaison avec des protéases est donc susceptible de réguler la desquamation. D’autres protéases à cystéine de la famille de la papaïne pourraient aussi constituer des cibles

198 Résultats complémentaires et discussion de A2ML1. La cathepsine L2 (ou cathepsine V, aussi dénommée stratum corneum thiol protease), et la cathepsine L-like sont en effet deux protéases à cystéine qui pourraient intervenir dans la desquamation (Bernard et al., 2003). Enfin, l’inhibition de la subtilisine, une protéase à serine bactérienne, suggère un rôle dans la défense antimicrobienne. A2ML1 agit sous forme monomérique. Il a été montré que les α2-macroglobulines dimériques ou tétramériques sont des inhibiteurs de protéases plus efficaces que les membres monomériques de cette famille. Les inhibiteurs monomériques doivent en fait former une liaison covalente avec la protéase cible, ce qui est cohérent avec l’observation de liaisons A2ML1-SCCE. L’α2-macroglobuline (A2M) est capable de lier de nombreux facteurs de croissance ou cytokines tels que le TGF-β, le PDGF-BB (platelet-derived growth factor-BB) ou le NGF- β (nerve growth factor-beta) grâce à un peptide de liaison proche du domaine appât (Gonias et al., 2000). Ce peptide étant conservé au sein d’A2ML1, cette protéine pourrait se lier à certains facteurs de croissance pour réguler leur disponibilité, et participer ainsi au maintien de l’homéostasie épidermique. En particulier, le TGF-β1 est produit au niveau des couches différenciées de l’épiderme (Gold et al., 2000) et pourrait constituer un ligand d’A2ML1. A2M intervient dans la clairance plasmatique des facteurs de croissance, cytokines ou protéases, auxquels elle se lie, via l’internalisation des complexes par un récepteur de type récepteur aux LDL : LRP1 (Low density lipoprotein receptor-Related Protein) (LaMarre et al., 1991). On peut là aussi spéculer sur un rôle équivalent pour A2ML1 dans l’épiderme, qui pourrait passer par ce même récepteur ou un autre récepteur de la même famille. Il est intéressant de noter à cet égard que plusieurs d’entre eux comme LRP4, 6, 10 et 11, ainsi qu’un gène codant pour une protéine homologue encore non caractérisée, LRP5L, ont été mis en évidence dans l’épiderme par la production d’ORESTES. La recherche et l’inactivation du gène orthologue chez la souris devraient permettre de préciser le rôle d’A2ML1, à la fois au cours de la desquamation et dans la régulation de la biodisponibilité des facteurs de croissance dans l’épiderme.

3 Analyse du transcriptome du kératinocyte granuleux

3.1 Purification des kératinocytes granuleux de l’épiderme humain Dans le but de produire des minibanques d’EST de kératinocytes granuleux, plusieurs techniques de purification de ces cellules ont été testées. Des échantillons de peau saine provenant de plastie abdominale ont été utilisés dès leur sortie du bloc opératoire, et traités à

199 Résultats complémentaires et discussion

4°C afin de préserver le transcriptome des cellules. L’épiderme a été séparé du derme par incubation d’1h en présence de thermolysine puis dissection mécanique. Dans une première approche, l’ensemble des cellules de l’épiderme a été dissocié par 5 incubations successives en trypsine, puis diverses méthodes ont été testées pour isoler les kératinocytes granuleux. Le tri des cellules en fonction de leur taille et de leur granulométrie s’est révélé inefficace en raison de la présence de petites cellules agrégées par deux ou trois. L’emploi d’un anticorps fluorescent dirigé contre une protéine membranaire spécifique (la cornéodesmosine) s’est avéré inefficace en cytométrie de flux, la majorité des épitopes étant dégradés lors du traitement à la trypsine. L’utilisation d’un marqueur intracellulaire tel que la filaggrine nécessite la perméabilisation préalable et donc la fixation des cellules, entraînant la fuite et la dégradation partielle des ARNm qu’elles contiennent. La séparation mécanique des cellules par leur taille en gradient discontinu de ficoll ou à l’aide de filtres de porosité variable n’a pas permis non plus de purifier efficacement d’importantes quantités de kératinocytes granuleux. Finalement, la mise au point s’est focalisée sur le nombre et la durée d’incubations en trypsine nécessaires pour dissocier le maximum de kératinocytes basaux et épineux et ne conserver que des fragments composés de couche cornée, imperméable à l’enzyme, et de kératinocytes granuleux non dissociés. Le protocole retenu pour le traitement de l’épiderme depuis la sortie du bloc opératoire jusqu’à l’obtention des 4 fractions cellulaires, dure environ 4h et toutes les incubations enzymatiques se font à 4°C. Ce protocole est à comparer à celui utilisé par Radoja et al. qui traitent les échantillons de peau (plasties mammaires) 2 à 6h après résection, séparent l’épiderme du derme par incubation d’une nuit à 4°C avec la dispase, et dissocient les kératinocytes par 3 incubations de 10 minutes avec la trypsine à 37°C (Radoja et al., 2006). L’isolement des kératinocytes basaux à l’aide de billes magnétiques recouvertes d’anticorps anti-intégrine β4 se fait durant 1 à 2h à 4°C. Au total, environ 24h s’écoulent entre la résection du tissu et l’extraction des ARN. Sachant que de nombreux facteurs de croissance, protéines du cycle cellulaire ou facteurs de transcription sont codés par des ARNm instables, la réduction de la durée du traitement des échantillons est particulièrement importante. Une analyse histologique et des expériences de PCR quantitative en temps réel avec des marqueurs spécifiques de la couche granuleuse (SCCE) et de la couche basale (KRT14) ont confirmé le fort enrichissement en kératinocytes granuleux obtenu avec notre méthode. Il apparaît au niveau morphologique que le premier échantillon (T1) ne contient quasiment aucun kératinocyte granuleux, alors qu’à l’inverse les derniers fragments (T4) sont contaminés par des kératinocytes de petite taille, vraisemblablement emprisonnés à l’intérieur

200 Résultats complémentaires et discussion de fragments repliés sur eux-mêmes. Un redécoupage de ces fragments avant le traitement à la trypsine a permis seulement en partie de diminuer cette contamination. Pour évaluer ou confirmer la spécificité d’expression de certains transcrits au cours de la différenciation épidermique, le ratio T4/T1 (couche granuleuse / couche basale) a été mesuré par PCR quantitative en temps réel. Nous avons fait le choix d’utiliser la chimie SYBR Green, beaucoup plus économique que les sondes marquées, pour déterminer le profil d’expression de nombreux gènes différents. Dans un premier temps, nous avons utilisé pour la normalisation l’ARNr 18S et le gène LGALS7 (galectine 7), qui a été montré comme étant transcrit au niveau de toutes les couches de l’épiderme par des expériences d’hybridation in situ (Magnaldo et al., 1998). L’utilisation du 18S a été rapidement abandonnée, en raison de sa trop forte abondance qui nécessitait une dilution des échantillons plus importante que pour les gènes testés. Sept « gènes de ménage » ont été testés sur l’ensemble des fractions cellulaires T1 à T4. L’analyse par l’outil « geNorm » (Vandesompele et al., 2002) a révélé que la β2-microglobuline, codant pour une protéine du CMH, est le gène exprimé le plus stablement au cours de la différenciation épidermique. Toutefois, les gènes surexprimés dans les couches différenciées présentent toujours de très importants ratios, toujours supérieurs à 5 et souvent supérieurs à 20 pour les plus tardifs. Le choix du gène utilisé pour la normalisation n’est ainsi pas aussi crucial que dans des cas où de petites variations d’expression sont mesurées. Les résultats obtenus en PCR quantitative confirment l’analyse cytologique. Des gènes spécifiques des couches granuleuses présentent de très importants ratios T4/T1 (de l’ordre de plusieurs dizaines voire centaines) alors que réciproquement, les ratios T1/T4 obtenus pour des gènes spécifiques du kératinocyte basal sont moindres (de l’ordre d’un facteur 5 au maximum). A partir d’un prélèvement abdominal d’environ 200 cm², environ 50 millions de cellules basales (T1) et 300 mg de fragments enrichis en kératinocytes granuleux (T4) sont collectés. L’extraction des ARN des échantillons T4 nécessite un broyage préalable en raison de la grande quantité de couche cornée, extrêmement cohésive, qu’ils contiennent. Le broyage manuel dans l’azote liquide suivi de l’utilisation d’un broyeur à couteaux de type Ultraturax a donné les meilleurs résultats. Pour améliorer le rendement de l’extraction, des essais avec un agitateur à haute vitesse de type FastPrep en présence de billes de tailles variables ont été effectués et se sont révélés peu concluants en raison d’une forte contamination par de l’ADN génomique. Au total, des quantités d’environ 100 µg et 60 µg d’ARN total sont obtenues respectivement à partir des échantillons T1 et T4.

201 Résultats complémentaires et discussion

3.2 La technique des ORESTES Le principe de la technique des ORESTES s’appuie sur l’utilisation d’oligonucléotides de séquence définie, utilisés à faible stringence pour générer un grand nombre de minibanques de fragments d’ADNc de faible complexité (cf. chapitre 1.2.2). Pour l’ensemble de ce travail, seules des amorces déjà disponibles au laboratoire ont été employées : amorces plasmidiques, génomiques, de souris, etc. L’analyse par criblage PCR des premiers clonages a montré qu’environ 10% des vecteurs ne contenaient pas d’insert. Afin d’éliminer au maximum les clones contenant un vecteur vide, une stratégie de criblage LacZ/X-gal a été adoptée par la suite. Moins de 5% de clones vides ont été finalement obtenus grâce à cette stratégie. Parmi les mises au point techniques, une réduction de la contamination par l’ARN ribosomique, a été mise en place. Après extraction des ARN totaux, les ARNm sont purifiés à l’aide de billes magnétiques couplées à des amorces oligo(dT). Deux purifications successives ont été effectuées et ont permis de réduire sensiblement le niveau de contamination. Les séquences ribosomiques représentent toutefois plus de 8% de l’ensemble. Les travaux du consortium brésilien à l’origine de la technique des ORESTES font état d’une proportion de 7.8% de séquences ribosomiques (Camargo et al., 2001). Les fragments d’ADNc produits avec une amorce donnée sont insérés dans le vecteur pCRII- TOPO par clonage A/T et permettent d’obtenir 100 à 200 clones. Plus de 2200 clones ont été produits au laboratoire puis séquencés par le service commun de l’IFR30. L’analyse manuelle a été effectuée grâce aux outils disponibles en ligne, principalement ceux présents sur le site du NCBI et le navigateur (« genome browser ») de l’université de Santa Cruz de Californie (UCSC). Une base de données Access a été initialement mise en place pour stocker ces informations, puis convertie en base de données MySQL accessible par une interface PHP. L’intégration par la suite de l’ensemble des ORESTES obtenus dans le navigateur de l’UCSC a été très utile pour l’analyse des séquences. Leur représentation graphique par rapport au gène correspondant et à de nombreuses données complémentaires (ARNm, EST, prédictions, cadre de lecture ouvert, conservation, séquences répétées...) a souvent été déterminante. Le repérage d’un groupe de plusieurs ORESTES, situés dans une région conservée au milieu d’un intron, nous a permis par exemple de mettre en évidence le rétrogène PSAPL1 (voir plus loin) que nous n’aurions pu repérer par un simple alignement de séquence. De même, le nouveau gène LCE a été repéré par un ensemble de séquences correspondant à une région génomique située dans le locus de l’EDC. Le navigateur de l’UCSC est ainsi finalement devenu la principale interface d’accès à nos données, rapide et facile à utiliser pour

202 Résultats complémentaires et discussion l’ensemble des membres du laboratoire. La mise à disposition de cet outil vis-à-vis de la communauté internationale lors de la publication de nos résultats donnera un accès très facile à l’ensemble de nos données. Après les étapes de mise au point de la production d’EST, 22 000 clones supplémentaires ont été produits correspondant à 150 minibanques et envoyés au Genoscope pour extraction plasmidique et séquençage dans le cadre d’un appel d’offre. Une analyse informatique automatisée des séquences a été effectuée en collaboration avec le centre de bioinformatique de Bordeaux (CBiB) dirigé par le Pr. Antoine de Daruvar. Cette aide précieuse a permis une première annotation de l’ensemble des séquences, leur « contigage » et la récupération des coordonnées par rapport au génome humain, nécessaires à la création du « custom track » dans le navigateur de l’UCSC. Parmi les 2200 premières séquences produites, 800 gènes différents étaient représentés, soit une redondance de moins de 3 séquences par gène. La production d’EST à grande échelle a fait passer cette proportion à plus de 4 séquences par gène avec un total de 3387 gènes. Cette divergence s’explique par le fait que les premiers clones produits étaient systématiquement criblés par PCR et électrophorèse. Un trop grand nombre de fragments de même taille pour un même clonage (considérés comme potentiellement redondants) conduisait à leur élimination. D’autre part, le séquençage des clones d’une même minibanque se faisant progressivement, les clonages fortement redondants n’étaient pas analysés en totalité. Malgré les capacités de normalisation de la technique des ORESTES, 9 gènes sont représentés par plus de 100 séquences. C’est le cas de la dermokine ainsi que de 3 gènes connus pour être fortement exprimés par le kératinocyte granuleux (la kératine 1, la filaggrine et la protéine d’enveloppe LEP7). Deux gènes correspondant à des protéines exprimées de façon ubiquiste et abondante (une protéine ribosomique RPS8 et le facteur d’élongation EEF1A1) sont aussi très fortement représentés dans la banque d’ORESTES. Les 3 derniers gènes codent pour des protéines peu ou pas connues : l’ifapsoriasine, l’inhibiteur de protéases à serine SERPINA12 et la tétraspanine 5. Une caractéristique importante de ces gènes surreprésentés est qu’ils apparaissent tous, sauf un, dans de nombreuses minibanques différentes. Leur forte représentation ne peut donc être due uniquement à une amplification préférentielle lors d’une réaction de RT-PCR où l’ARNm aurait une forte homologie avec l’amorce utilisée. On retrouve de plus parmi eux des gènes connus pour être très fortement exprimés dans la couche granuleuse comme la filaggrine ou la kératine 1. Ces gènes très représentés sont ainsi supposés être fortement transcrits dans notre échantillon. Ceci a été confirmé pour la dermokine, qui présente en northern blotting une forte expression dans les kératinocytes

203 Résultats complémentaires et discussion granuleux. Des expériences de PCR quantitative ont aussi montré que la SERPINA12, et l’ifapsoriasine sont spécifiques des kératinocytes granuleux. La tétraspanine 5 (TSPAN5) s’est révélée exprimée dans toutes les couches de l’épiderme. Toutefois, l’ensemble des séquences de tétraspanine 5 obtenues sont identiques et proviennent de la même minibanque. Il est donc probable que le grand nombre d’ORESTES obtenus soit dû à une amplification préférentielle du fragment correspondant lors de la RT-PCR à faible stringence et une mauvaise purification sur gel. Une analyse reposant sur les termes GO (gene ontology, cf. chapitre 1.5.1) a été effectuée pour l’ensemble des 3375 gènes mis en évidence par la technique des ORESTES. Tous les essais concernant les processus biologiques ou la fonction moléculaire, ont abouti à un nombre de termes différents bien trop grand pour pouvoir les regrouper en catégories fonctionnelles. La localisation subcellulaire est quant à elle souvent contradictoire pour un même gène. Le nombre de termes utilisés dans la base de données illustre bien ces écueils : 10745 processus biologiques, 7433 fonctions moléculaires et 1799 localisations subcellulaires ! Cette classification doit donc dans tous les cas être revue manuellement. Nous avons fait plutôt le choix de nous focaliser sur les gènes codant pour des protéines hypothétiques, faiblement représentés dans les banques de données et donc potentiellement spécifiques de l’épiderme. Parmi eux, nous nous sommes plus particulièrement intéressés à ceux qui contenaient des domaines protéiques prédits importants lors de la cornification ou de la desquamation comme des protéases ou inhibiteurs de protéases, des gènes intervenant dans le métabolisme des lipides, des protéines de structure. La sélection de gènes candidats potentiellement impliqués dans les étapes tardives de la différenciation épidermique s’est donc basée en priorité sur leur faible représentation dans les bases de données. En effet, les gènes connus comme spécifiques des kératinocytes granuleux sont en quasi-totalité représentés par un « cluster » UniGene contenant moins de 100 EST. C’est le cas par exemple de la filaggrine, la loricrine, les transglutaminases 1, 3 et 5, la cornéodesmosine, etc. Les nouveaux gènes d’expression potentiellement restreinte à ces cellules sont donc aussi supposés correspondre à un petit nombre d’EST publiés. Parmi les gènes représentés par moins de 100 EST, 330 environ, un second tri s’est basé sur la présence de domaines protéiques particuliers. La variation d’expression de 78 de ces gènes, au cours de la différenciation, a été mesurée en PCR quantitative en temps réel par le ratio T4/T1, afin de déterminer lesquels étaient spécifiques des kératinocytes granuleux. Une vingtaine n’ont pu être amplifiés, ou très faiblement, malgré l’utilisation dans certains cas d’un second couple d’amorces ciblant une région différente du transcrit. La présence d’un ou plusieurs

204 Résultats complémentaires et discussion

ORESTES, épissés pour la plupart, montre pourtant que ces gènes sont transcrits dans nos échantillons, mais sans doute à un niveau très faible. Ceci confirme la capacité de la méthode des ORESTES à identifier les messagers rares. Neuf gènes se sont révélés légèrement plus exprimés dans les kératinocytes basaux, et 10 autres sont exprimés dans toutes les couches épidermiques de manière équivalente. Au contraire, 39 gènes, soit la moitié des gènes testés, se sont avérés plus exprimés dans les kératinocytes les plus différenciés. Ces résultats montrent que notre stratégie pour le choix des gènes à tester était adaptée. En effet, la proportion de gènes surexprimés dans les kératinocytes granuleux par rapport aux kératinocytes basaux, mesurée par la technique des puces à ADN, est seulement de 6,5% (analyses effectuées par Nicolas Mattiuzzo, voir plus loin). Parmi les gènes dont nous avons montré la surexpression dans les kératinocytes granuleux en PCR quantitative en temps réel, sont particulièrement représentés des protéases et des inhibiteurs de protéases. P11, une protéase à serine putative initialement identifiée dans le placenta, est surexprimée dans divers carcinomes (Grundmann et al., 1990). Sa fonction dans ces tissus n’a pas été déterminée mais sa séquence primaire contient un peptide signal, indiquant qu’elle pourrait être sécrétée par les kératinocytes granuleux et participer ainsi au processus de desquamation. TMPRSS13, TMPRSS11F (Transmembrane Protase, Serine, member 13/11F) et RHBDL2 (rhomboid-like2) sont des protéases à serine transmembranaires. Il a été montré que RHBDL2 est capable de cliver l’ephrine B3, un ligand de récepteurs à activité tyrosine-kinase (Pascall and Brown, 2004). Ces 3 protéases transmembranaires pourraient ainsi intervenir dans la transduction du signal au niveau des couches différenciées. Nous avons aussi montré la surexpression de 5 inhibiteurs de protéases dans les kératinocytes granuleux : outre l’A2ML1, les serpines A12 (voir plus loin), B7, et B12, ainsi que WAP2 (Whey Acidic Protein 2). WAP2, un inhibiteur de protéases à serine, a été identifié avec WAP1 chez la souris respectivement dans la langue et le rein, où ils présentent une activité antibactérienne (Hagiwara et al., 2003). WAP2 pourrait jouer le même rôle dans les couches différenciées de l’épiderme. Les serpines sont des inhibiteurs de protéases à serine. La serpine B7, ou megsine, est exprimée dans les cellules mésangiales où elle interviendrait lors de l’inflammation (Miyata et al., 2002). La serpine B12 est capable d’inhiber in vitro des protéases de la famille de la trypsine (Askew et al., 2001). Les auteurs de ce travail ont détecté par RT-PCR la serpine B12 dans tous les tissus testés. Ce dernier résultat est toutefois en contradiction avec le faible nombre de séquences (6, dont 2 de carcinome épidermoïde) présentes dans les banques de données. Dans l’épiderme, ces 2

205 Résultats complémentaires et discussion inhibiteurs de protéases à serine pourraient réguler par exemple l’activité de SCCE ou SCTE lors de la desquamation. D’autre part, 8 gènes surexprimés dans les kératinocytes granuleux codent pour des protéines hypothétiques contenant des domaines fonctionnels impliqués dans le métabolisme des lipides. C’est le cas de PSAPL1 (voir plus loin), de PNPLA1, ABHD9, LASS3, AADACL2, ASAH3, SMPD3 et FAM83F. Les fonctions putatives de ces protéines sont représentées dans le tableau ci-après :

PNPLA1 patatin-like phospholipase domain containing 1 Hydrolase d'acides gras THEM5 thioesterase superfamily member 5 Thioestérase d'acyl-CoA ABHD9 abhydrolase domain containing 9 Hydrolase/acyltransférase LASS3 LAG1 longevity assurance homolog 3 (S. cerevisiae) Synthèse des céramides AADACL2 arylacetamide deacetylase-like 2 Estérase/lipase FAM83F family with sequence similarity 83, member F Phospholipase D ASAH3 N-acylsphingosine amidohydrolase (alkaline ceramidase) 3 Céramidase SMPD3 sphingomyelin phosphodiesterase 3 Sphingomyélinase PSAPL1 prosaposin-like 1 Saposines (cf. chapitre 2.2.2.9)

CASZ1 (CAStor homolog, Zinc finger 1) est un facteur de transcription exprimé au cours de l’embryogenèse lors de la différenciation du système nerveux (Liu et al., 2006), et dont les cibles sont inconnues. Son rôle précis au cours de la différenciation épidermique reste donc à définir. SLC37A2 (Solute Carrier family 37 member A2) est homologue à 72% à SLC37A1, un transporteur de glycérol-3-phosphate ubiquitaire (Bartoloni et al., 2000). L’inactivation chez la souris de l’aquaporine 3, un autre transporteur de glycérol, induit une diminution de l’hydratation de la couche cornée (Ma et al., 2002). Il a depuis été proposé que le glycérol pourrait jouer un rôle dans le maintien de l’hydratation de la couche cornée (Choi et al., 2005). Enfin, SLC37A2 pourrait aussi participer à la régulation du taux de glycérol extracellulaire. Le gène IL1F7 (InterLeukin 1 Family, member 7 (zeta)) a été identifié par recherche d’homologie avec l’IL1 dans les banques d’EST (Kumar et al., 2000). Récemment, le locus contenant ce gène a été associé avec la susceptibilité à l’arthrite psoriasique (Rahman et al., 2006). Cette cytokine, potentiellement sécrétée par les kératinocytes granuleux, pourrait intervenir lors de l’inflammation. Les gènes SERPINA12, PSAPL1 mais aussi un nouveau gène homologue aux membres de la famille LCE (Late Cornified Envelope, cf. chapitre 2.2.2.6 concernant l’EDC), l’ifapsoriasine ainsi que la claudine 23 ont fait l’objet d’une caractérisation plus précise détaillée dans le chapitre suivant.

206 Résultats complémentaires et discussion

3.3 Identification de nouveaux gènes

3.3.1 Gènes de l’EDC Le complexe de différenciation épidermique, ou EDC, sur le locus 1q21, regroupe une cinquantaine de gènes codant pour des protéines, en particulier de structure, impliquées dans la cornification (cf. chapitre 2.2.2.5). Des ORESTES ont été identifiés pour environ la moitié d’entre eux (figure 38).

160

140

120

100

80

60

40 Nombre d’ORESTESNombre

20

0 IVL FLG THH LOR IFPS LEP7 RPTN CRNN HRNR MCSP LELP1 THHL1 LCE1F LCE1D LCE1A LCE5A LCE3D LCE3A LCE2D LCE2A LCE1E LCE1C LCE1B NICE-1 LCE3E LCE3C LCE3B LCE2C LCE2B LCE4A hKPRP SPRR4 SPRR3 C1orf46 SPRR2D SPRR2F SPRR1A SPRR1B SPRR2A SPRR2E SPRR2B SPRR2G LCE_new PGLYRP3 PGLYRP4 MCSP PGLYRP3-4 «fused» Late Cornified Envelope Involucrin SPRR Loricrin

Figure 38 : nombre d’ORESTES identifiés pour les gènes situés dans l’EDC.

3.3.1.1 Gènes de la « fused family » Nous avons pu mettre en évidence l’expression de la filaggrine, l’ifapsoriasine, la répétine et la cornuline. De façon intéressante, l’ifapsoriasine (IFPS, ou filaggrine 2) n’a jamais été caractérisée. L’ARNm présent dans les banques de données (NM_001014342) est composé de 3 exons et code pour une protéine prédite de 2391 aa constituée de 2 domaines EF-hand et de répétitions de 22 à 25 acides aminés (cf. chapitre 2.2.2.6 concernant l’EDC). D’autre part, le nombre important d’ORESTES provenant de minibanques diverses obtenu pour ce gène, suggère qu’il est fortement exprimé dans les kératinocytes granuleux. Pour confirmer cette hypothèse, nous avons testé l’expression de l’IFPS par PCR quantitative en temps réel. Les résultats montrent une très importante surexpression dans la couche granuleuse de l’épiderme (T4/T1 > 600). La composition en acides aminés de l’IFPS humaine et murine est très proche de celle de la filaggrine (tableau 3). Elle pourrait ainsi participer à l’élaboration du facteur d’hydratation, dont les acides aminés libres sont depuis longtemps considérés comme provenant exclusivement de la protéolyse de la filaggrine.

207 Résultats complémentaires et discussion

IFPS IFPS FLG FLG Moyenne composition (Hs) (Mm) (Hs) (Mm) GenBank asx D+N 3,179 4,065 7,2 5,2 9,3 thr T 7,988 1,778 4,4 0 6 ser S 22,459 20,533 24,8 19,8 7,3 glx E+Q 15,057 19,559 15,1 21,4 10,4 pro P 1,087 6,224 0,6 2,8 5,3 gly G 20,326 16,215 15,1 15,7 7,1 ala A 1,506 2,032 6,6 8,9 7,6 val V 2,008 3,218 1,3 3,6 6,4 cys C 1,004 1,693 0 0 1,9 met M 0,209 0,339 0 0 2,3 ile I 1,004 0,974 0,6 0 5,4 leu L 1,213 1,82 0,6 0,4 9,3 phe F 2,342 1,355 0,6 0,8 3,9 tyr Y 2,635 2,371 0,6 0 3,2 lys K 1,297 2,117 0 0 5,7 his H 10,33 8,256 12 8,9 2,3 arg R 6,064 6,986 9,8 12,5 5,4 trp W 0,293 0,466 0,6 0 1,4

Tableau 3 : composition en acides aminés de l’ifapsoriasine et de la filaggrine humaines et murines. Hs : Homo sapiens ; Mm : Mus musculus.

Aucune séquence n’a été retrouvée pour la trichohyaline, abondante dans le follicule pileux, et l’hornerine, spécifique chez l’homme de l’épiderme cicatriciel. Aucune séquence n’a été non plus clonée pour la trichohyalin-like 1 (THHL1). Ce gène, comme l’ifapsoriasine, n’a fait l’objet d’aucune étude. Nous avons donc essayé de déterminer son expression au cours de la différenciation épidermique par PCR quantitative en temps réel. Toutefois, nous n’avons pu détecter de transcrits pour THHL1 en PCR classique ni dans l’épiderme entier ni dans des échantillons enrichis en kératinocytes granuleux. Il serait intéressant d’évaluer son expression dans le follicule pileux ou dans l’épiderme prolifératif, que ce soit au cours de la cicatrisation ou dans les lésions psoriasiques.

3.3.1.2 Gènes des familles LCE et SPRR Il a été montré que l’épiderme normal exprime préférentiellement les LCE des groupes 1 et 2 et pas ceux du groupe 3, spécifiques des épithéliums pluristratifiés non cornifiés (cf. chapitre 2.2.2.6). La même étude n’avait pu mettre en évidence l’expression des gènes LCE4A et 5A par PCR quantitative sur échantillons de peau provenant d’abdomen, de bras, de prépuce ou de peau fœtale (Jackson et al., 2005). Toutefois, 10 ORESTES correspondent à l’expression

208 Résultats complémentaires et discussion du gène LCE5A dans nos échantillons, ce qui va à l’encontre des résultats de cette étude. Concernant les gènes de la famille SPRR, seuls des ORESTES correspondant à SPRR2E ont été produits. Le gène LEP7 (xp 32), situé au milieu des membres de la famille LCE mais n’appartenant pas à cette famille et pour lequel peu de données d’expression sont disponibles, apparaît comme fortement exprimé dans les kératinocytes granuleux (140 ORESTES). Enfin, des ORESTES non épissés correspondant à une région génomique située entre LCE1A et MCSP ont été repérés. L’analyse de la séquence protéique prédite correspondante montre qu’ils pourraient correspondre à un nouveau gène de type LCE. Nous avons réalisé des expériences de RACE qui ont permis d’identifier un premier exon non traduit en amont de ces séquences situées sur le 2ème exon. Les sites donneur et accepteur de l’unique intron sont canoniques, et la séquence génomique en amont du cap présente une boite TATAA, comme la plupart des gènes de l’EDC, en position -31. Des expériences de PCR quantitative montrent que ce gène est fortement surexprimé dans la couche granuleuse, et la construction d’un arbre phylogénétique avec les autres membres des familles LCE et SPRR montre que ce nouveau gène est plus proche de la famille LCE, de laquelle il est toutefois le plus divergent. La protéine produite pourrait constituer un nouveau précurseur de l’enveloppe cornée.

3.3.1.3 Involucrine, loricrine, et PGRP Comme attendu, plusieurs EST correspondant à l’involucrine et la loricrine ont été séquencés. PGLYRP3 est représentée par un seul ORESTE alors que PGLYRP4 n’est pas retrouvée dans la banque d’ORESTES. Ces récepteurs au PGN sont exprimés dans l’épiderme au niveau des kératinocytes granuleux (Lu et al., 2005).

3.3.2 Prosaposin-like 1 (PSAPL1) Ce gène sans intron, que nous proposons de nommer PSAPL1 (prosaposin-like 1) en accord avec le HGNC, résulte probablement de la rétrotransposition d’un ARNm codant pour la prosaposine (PSAP). Ce mécanisme est à l’origine de nombreux pseudogènes, qui, accumulant rapidement les mutations, constituent autant de « fossiles » au sein du génome humain. Toutefois, certains d’entre eux montrent un important taux de transcription et constituent réellement de nouveaux gènes fonctionnels (Vinckenbosch et al., 2006). PSAPL1 présente les mêmes domaines protéiques prédits que PSAP (figure 39). Tous deux possèdent un peptide signal potentiel dans leur séquence protéique prédite. De façon étonnante, l’homologie de la séquence primaire des 2 protéines n’est que de 62% (et 44% d’identité). Malgré cette divergence, le maintien du cadre de lecture et la conservation des domaines fonctionnels suggèrent que PSAPL1 a été soumis à une pression de sélection.

209 Résultats complémentaires et discussion

Figure 39 : domaines protéiques prédits de la PSAP (en haut) et PSAPL1 (en bas) selon l’algorithme CD-search (Marchler-Bauer and Bryant, 2004).

La protéine précurseur produite par le gène parent PSAP est clivée en 4 petites glycoprotéines agissant comme cofacteurs indispensables dans le métabolisme des céramides (cf. chapitre 2.2.2.9). Leur rôle est essentiel dans la myélinisation et dans la synthèse des céramides des lamellae intercornéocytaires de l’épiderme. Cependant, des mutations du gène PSAP sont responsables de pathologies essentiellement neuronales : certaines formes de la maladie de Gaucher et une leucodystrophie métachromatique. Les souris inactivées pour ce gène présentent des anomalies neurologiques avec un phénotype épidermique modéré. Nous avons montré que PSAPL1 est exprimé dans le poumon et dans l’épiderme où il est spécifique des couches suprabasales, lieu de synthèse des lipides de la couche cornée. On peut alors logiquement supposer que le gène PSAPL1, conservé chez la souris, est capable de compenser tout au moins partiellement l’absence de PSAP dans l’épiderme. De façon intéressante, la protéine B du surfactant présente 3 domaines saposin-like (Zaltash and Johansson, 1998). On peut ainsi spéculer sur un rôle analogue de PSAPL1 dans le poumon.

3.3.3 Claudine 23 (CLDN23) Ce gène a été identifié par puces à ADN comme étant sous-exprimé dans des cancers gastriques (Katoh and Katoh, 2003). Les auteurs ont évalué l’expression de ce gène uniquement par l’analyse des EST présents dans les banques de données, et en ont conclu qu’il était transcrit dans les centres germinatifs, le placenta, l’estomac, et les cancers du colon. Nous avons montré que sur un panel d’ADNc provenant de 16 tissus sains humains, la claudine 23 est exprimée dans le placenta, le poumon, le foie, le rein, le pancréas et le colon et plus faiblement dans presque tous les tissus testés. D’autre part, son expression dans l’épiderme est spécifique de la couche granuleuse. De façon intéressante, la claudine 4, elle aussi exprimée dans les couches les plus différenciées de l’épiderme, est de la même manière détectée dans la majorité des tissus testés par northern blotting (Paperna et al., 1998). Comme la claudine 4, la claudine 23 est un gène sans intron. Cette protéine encore non caractérisée

210 Résultats complémentaires et discussion pourrait participer, dans la couche granuleuse de l’épiderme, à la formation des jonctions serrées, importantes pour la fonction barrière du tissu.

3.3.4 Serine protease inhibitor A12 (SERPINA12) Cet inhibiteur de protéases à serine a été initialement identifié comme étant sécrété par les adipocytes chez le rat, et nommé Vaspin (Visceral Adipose tissue-derived Serine Protease INhibitor) (Hida et al., 2005). Elle semble jouer un rôle chez des rats OLETF, qui constituent un modèle d’obésité, dans la survenue d’un diabète de type II. Toutefois, ses cibles n’ont pas été identifiées. Nous avons montré que la SERPINA12 est principalement exprimée dans le foie et dans la couche granuleuse de l’épiderme. Elle pourrait constituer un nouvel acteur de la desquamation en participant à la régulation de l’activité de protéases à serine telles que SCCE ou SCTE.

3.3.5 Locus associés à des pathologies non caractérisées Parmi les nombreux gènes hypothétiques identifiés, certains pourraient constituer de nouveaux candidats pour des génodermatoses dont le gène responsable reste inconnu (tableau 4). Les ORESTES que nous avons obtenus pour chacun de ces locus constituent des gènes candidats potentiels. Pathologie Signes cliniques Locus MIM TYLOSE ASSOCIEE Kératodermie palmoplantaire avec 17q25 148500 A DES CANCERS hyperacanthose, hyperkératose DE L’OESOPHAGE (orthokératosique) et hypergranulose. Hyperkératose et hypohidrose 17q11.2-q21 161000 palmoplantaires, formation de bulles SYNDROME DE inflammatoires, pigmentation réticulaire NAEGELI de la peau, altération du fonctionnement des glandes sudoripares et anomalies dentaires. SYNDROME Naissance prématurée, ichthyose 9q33.3-q34.13 608649 D’ICHTHYOSE congénitale, complications respiratoires, AVEC éosinophilie persistante. Hyperkératose PREMATURITE folliculaire et atopie chez l’adulte. Minces squames blanches sans 19p13.1-p13.2 604781 érythrodermie ni ectropion, plus ICHTHYOSE importantes au niveau des genoux, des NONLAMELLAIRE chevilles et des oreilles. Lichenification NONERYTHRODER- palmoplantaire. Parmi 5 patients, 3 MIQUE, avaient un aspect de bébé collodion à la CONGENITALE naissance et 2 présentaient une ichthyose. RECESSIVE (NNCI) L’analyse histologique montre la présence

de couche granuleuse chez tous les patients.

211 Résultats complémentaires et discussion

Pathologie Signes cliniques Locus MIM Forme modérée d’ichthyose congénitale 17p13.1-p13.2 606545 caractérisée par la présence de squames ICHTHYOSE brunes de petite taille, plus épaisses et plus LAMELLAIRE DE sombres au niveau des genoux, des coudes TYPE 5 et du cou. Pas d’érythrodermie, ni de kératodermie palmoplantaire. ICHTHYOSE Ichthyose non érythrodermique, caractérisée 19p12-q12 604777 LAMELLAIRE DE par la présence de grandes squames brunes, 3p21 TYPE 3 aspect de bébé collodion à la naissance. ERYTHROKERAT 7q22 609313 O-DERMIE Hyperkératose, plaques érythémateuses de VARIABLE DE taille, forme et durée variables. TYPE 3

Tableau 4 : ichthyoses et hyperkératoses de transmission mendélienne et de base moléculaire inconnue, associées à un locus déterminé.

3.4 Analyse du transcriptome à l’aide de puces à ADN pangénomiques Parallèlement à la production d’EST, j’ai participé à une approche complémentaire par la technique des puces à ADN, mise en place dans le cadre du M2R effectué par Nicolas Mattiuzzo, actuellement étudiant en thèse au laboratoire. Des lames de verre contenant environ 25 000 sondes oligonucléotidiques (70mères) ciblant 22 000 gènes humains ont été produites par le réseau national des génopoles (RNG). Les premières analyses indiquent que parmi les 22 000 gènes testés, 10 854 ont été détectés et 709 sont apparus comme étant surexprimés dans les kératinocytes granuleux, soit 6,5%. De façon attendue, les gènes connus comme étant d’expression la plus tardive présentent les ratios les plus importants. C’est le cas de la filaggrine, la loricrine, la cornéodesmosine, les protéases SCCE et SCTE, la dermokine ou l’inhibiteur de protéases SPINK5. Des gènes d’expression précoce comme la kératine 1 ou la desmocolline 1 montrent des ratios proches du seuil de 1,5. Les transglutaminases 1, 3 et 5, les facteurs de transcription KLF4 ou POU2F3 ou encore A2ML1 n’ont pu être détectées par la méthode des puces à ADN, probablement du fait d’un manque de sensibilité. Les résultats obtenus par la technique des puces à ADN ont été confrontés avec la banque d’ORESTES. Parmi 3387 gènes correspondant à au moins un ORESTE, 3239 (soit 95%) étaient représentés par une sonde sur les puces du RNG. Environ 60% de ces transcrits, soit 1929, ont été détectés par cette technique et 6,4%, soit 124, se sont révélés surexprimés dans les kératinocytes granuleux. Ce

212 Résultats complémentaires et discussion pourcentage est cohérent avec la proportion globale indiquée par les puces à ADN. L’analyse fine des résultats se poursuivant, ils ne seront pas détaillés ici. A noter toutefois l’étude récente menée par Radoja et al. qui s’est attachée à comparer deux populations de kératinocytes avec comme marqueur discriminant l’utilisation de l’intégrine β4 (ITGB4) (Radoja et al., 2006). Les puces utilisées, produites par la compagnie Affymetrix, contiennent des sondes pour environ 10 000 gènes, soit moins de la moitié de ceux présents sur les puces produites par le RNG. D’autre part, les populations cellulaires comparées sont les kératinocytes basaux (ITGB4+) par rapport à l’ensemble des kératinocytes suprabasaux et des autres types cellulaires épidermiques. Parmi les gènes différentiellement exprimés sont représentés, comme dans notre étude, des molécules impliquées dans l’adhésion, la matrice extracellulaire, la protéolyse, la transcription, le métabolisme des lipides, la transduction du signal, le transport, ainsi que les marqueurs de différentiation connus. Enfin, des marqueurs spécifiques des mélanocytes ont été mis en évidence par cette étude. Au total, la technique des ORESTES s’est avérée très efficace pour l’identification de nouveaux gènes. Des gènes tels que PSAPL1 ou LCE6A n’étaient pas représentés sur les puces du RNG et n’auraient donc pu être identifiés par les puces à ADN. Au contraire, les puces à ADN telles que nous les avons utilisées par hybridation simultanée d’ADNc provenant de cellules basales et de kératinocytes granuleux permettent d’identifier à grande échelle des gènes dont l’expression est induite au cours de la différenciation épidermique. Puisque 60% des gènes correspondant à au moins un ORESTE et représentés par une sonde sont détectés par les puces à ADN, on peut spéculer sur un nombre de gènes exprimés dans l’épiderme autour de 15 000. Ce résultat peut paraître surprenant étant donné que le kératinocyte granuleux est une cellule extrêmement spécialisée, engagée dans un processus de mort cellulaire programmée. Cela confirme du moins qu’elle est une cellule métaboliquement très active. D’autre part, seulement environ 4,5% des gènes identifiés par la technique des ORESTES ne sont pas représentés sur les puces du RNG. Celles-ci comportant des sondes pour 22 400 gènes, nos résultats sont tout à fait cohérents avec un nombre de gènes dans le génome humain estimé légèrement inférieur à 25 000.

3.5 Conclusion générale Cette étude, basée sur la production d’EST à partir d’échantillons cellulaires enrichis en kératinocytes granuleux constitue une première vue d’ensemble des gènes exprimés au cours de la différenciation épidermique. Le séquençage de fragments d’ADNc, le plus souvent épissés, représente une preuve irréfutable de l’expression du gène correspondant dans notre

213 Résultats complémentaires et discussion

échantillon. Notre travail a donc permis l’établissement du premier catalogue, partiel il est vrai, de gènes exprimés par le kératinocyte granuleux. L’utilisation de la PCR quantitative en temps réel a finalement confirmé et précisé le patron d’expression de gènes codant pour des protéines hypothétiques non caractérisées. Les résultats préliminaires obtenus lors de ce travail nous ont permis de débuter la caractérisation de gènes codant pour des protéines alors inconnues, la dermokine et l’A2ML1. Nous avons identifié de nouvelles isoformes transcrites pour le premier, et montré que le second code pour un inhibiteur de protéases sécrété par les kératinosomes. Au total, nous avons montré l’expression de 3387 gènes pour lequel au moins un ORESTE a été identifié. L’épiderme étant un tissu très peu représenté dans les bases de données, nous avons postulé que les gènes qui parmi eux correspondent à un petit nombre d’EST dans la banque UniGene sont potentiellement spécifiques du kératinocyte granuleux. Le fait que la quasi-totalité des marqueurs de différenciation sont représentés par moins de 100 EST renforce cette hypothèse. Pour nombre de gènes spécifiques des étapes tardives de la différenciation, les séquences publiées à la suite de ce travail représenteront d’ailleurs un grand nombre de séquences supplémentaires par rapport à celles déjà présentes dans les banques de données (par exemple, la filaggrine qui est à ce jour représentée par 5 EST et pour laquelle nous mettrons 100 séquences additionnelles à la disposition de la communauté scientifique). Parmi les gènes candidats testés en PCR quantitative en temps réel, près de la moitié était effectivement surexprimée dans les kératinocytes granuleux, confirmant notre hypothèse. De nouveaux gènes spécifiques de ces cellules ont ainsi été repérés, comme l’ifapsoriasine, LCE6A ou PSAPL1. Ce travail montre pour la première fois la surexpression dans les kératinocytes granuleux de 36 gènes dont l’expression épidermique n’était pas connue. Nous avons ainsi identifié de nouveaux acteurs potentiellement impliqués dans la cornification et la desquamation. La fonction précise de nombre de gènes spécifiques des kératinocytes granuleux reste encore à déterminer. Ce travail ouvre la voie à la caractérisation de nouvelles protéines intervenant dans la différenciation kératinocytaire, et constituant autant de nouvelles cibles pharmacologiques potentielles.

214

IV. ANNEXES

215

Annexes

Au cours de ce travail de thèse, j’ai également contribué à la rédaction d’un article qui a servi de support à la conférence présentée par Marina Guerrin Weber lors du CoBiP 2005 (cours de biologie de la peau) à Lyon. Ce document devrait être publié prochainement.

Transcriptome et différenciation kératinocytaire Toulza E, Galliano MF, Jonca N, Gallinaro H, Serre G, Guerrin M

UDEAR UMR5165, 37 allées J. Guesde, 31073 Toulouse

Le premier assemblage de la séquence du génome humain a été publié au début de l’année 2001 par le consortium public HGP (Human Genome Project) et la Société Celera Genomics, en parallèle (Lander et al., 2001; Venter et al., 2001). Ce « projet Apollo » de la biologie a permis l’assemblage de l’ensemble du génome (soit environ 3 milliards de nucléotides) pour un total estimé de 30 à 40 000 gènes. Aujourd’hui cette séquence est considérée comme définitive et comprend un nombre de gènes codant pour une ou plusieurs protéines revu à la baisse (20 à 25 000) (2004). La mise à disposition des premières séquences dès 1998, a ouvert le début d’une ère post-génomique avec pour but l’identification de l’ensemble des transcrits exprimés : le transcriptome. Si le génome est en effet le même dans chacune des cellules d’un organisme, l’expression des gènes varie d’une cellule à l’autre selon sa fonction, son stade de différenciation, ou les conditions particulières dans lesquelles elle se trouve (souffrance cellulaire, réponse à un stimulus...). Les techniques d’analyse du transcriptome d’un échantillon peuvent être regroupées en deux grandes catégories. L’identification, par séquençage de banques d’ADNc, de chaque ARNm exprimé dans une population de cellules donne une vision qualitative du transcriptome avec la production d’un « catalogue » des gènes exprimés. Au contraire, d’autres techniques permettent une analyse quantitative du transcriptome par la comparaison d’échantillons maintenus dans des conditions différentes (traitement pharmacologique, état de différenciation, processus de tumorigenèse, etc.). Ces méthodes permettent donc de mettre en évidence les seuls gènes différentiellement exprimés entre deux échantillons. ƒ Méthodes qualitatives La technique classique utilisée pour accéder aux séquences transcrites repose sur le séquençage systématique de banques d’ADNc. Les ARNm sont extraits, convertis en ADNc par transcription inverse puis clonés dans un vecteur, ce qui constitue la banque d’ADNc. Le séquençage de chaque clone aboutit à une courte séquence de quelques centaines de

217 Annexes nucléotides, appelée EST (expressed sequence tag), correspondant généralement à une lecture unique de séquenceur (Adams et al., 1991). Ce séquençage peut se faire par l’une et/ou l’autre des extrémités du vecteur, les EST correspondants sont alors appelés 5’ ou 3’ EST. La production d’EST est aujourd’hui plus particulièrement utilisée pour la constitution de banques spécifiques (tissus, stade embryonnaire...). Sa principale limite réside dans son manque de sensibilité pour la détection des ARNm de faible abondance. Afin d’éviter le séquençage répété des transcrits les plus fréquents et d’accéder aux messagers rares, plusieurs méthodes de normalisation ont été mises au point. C’est le cas par exemple de la technique des ORESTES (« Open Reading Frame EST ») (Camargo et al., 2001; de Souza et al., 2000). Ces EST particuliers sont obtenus après transcription inverse, amplification par PCR à faible stringence à l’aide d’une amorce unique, choisie de manière arbitraire, puis clonage et séquençage. Cette méthode permet de produire des séquences situées en majorité dans la séquence codante de l’ARNm correspondant, d’où leur nom. Une autre alternative est l’utilisation de banques soustraites (Diatchenko et al., 1996). Cette technique repose sur l’hybridation soustractive d’un mélange de deux populations d’ADNc où seules les séquences non appariées car peu abondantes seront clonées et séquencées. Ainsi la banque produite est enrichie en ADNc faiblement exprimés (lorsque les deux populations soustraites proviennent du même échantillon) ou spécifiques de l’un ou l’autre des deux échantillons (lorsque ceux-ci sont différents), cette technique se rapprochant alors des méthodes quantitatives. ƒ Méthodes quantitatives Les méthodes permettant la comparaison des gènes exprimés entre différents échantillons sont nombreuses et comprennent entre autres le « differential display », le SAGE ou les puces à ADN. La technique du SAGE (Serial Analysis of Gene Expression) permet l’analyse à haut débit de l’ensemble des ARNm d’un échantillon, représentés chacun par une très courte séquence de 10 nucléotides (Velculescu et al., 1995). Ces séquences (ou étiquettes) sont concaténées, séquencées puis identifiées. La méthode permet théoriquement une quantification absolue de l’ensemble des transcrits, le niveau d’expression de chacun étant directement corrélé avec la fréquence de l’étiquette SAGE correspondante. Les données obtenues peuvent être facilement utilisées pour des comparaisons multiples entre échantillons. Cependant, de nombreuses étiquettes de 10 nucléotides sont susceptibles de provenir de transcrits différents ce qui constitue la limite principale de la méthode. Les puces à ADN, enfin, permettent la mesure simultanée du niveau d'expression de plusieurs milliers de gènes voire d'un génome entier. A l’inverse des techniques habituelles d’hybridation (e.g. northern blot), les sondes (correspondant aux différents gènes testés) sont immobilisées sur le support

218 Annexes tandis que les cibles (ensemble des ARNm ou ADNc de l’échantillon analysé) sont marquées (Schena et al., 1995). L’évolution des technologies de fabrication permet aujourd’hui le dépôt de plusieurs dizaines de milliers de sondes différentes sur un même support.

Transcriptome et différenciation kératinocytaire L’épiderme, épithélium pluristratifié cornifié, constitué en majorité de kératinocytes, contribue aux propriétés essentielles de protection assurées par la peau, lui conférant sa fonction barrière. De nombreuses protéines spécifiques de la couche cornée sont produites au niveau de la couche granuleuse, composée des derniers kératinocytes à présenter une activité transcriptionnelle et traductionnelle avant la lyse nucléaire qui accompagne la cornification. Le nombre d’EST présents dans les banques de données, isolés à partir d’épiderme humain et/ou de kératinocytes en culture, est environ 300 fois plus faible que le nombre de ceux isolés à partir d’organes tels que le cerveau (environ 1200 contre 355000 pour un total de plus de 6 millions d’EST humains), ce qui reflète le faible nombre d’études qualitatives réalisées dans ce domaine. Plusieurs études quantitatives ont cependant été récemment publiées. La technique du SAGE a été utilisée dans l’étude de kératinocytes en culture primaire, différenciés in vitro, en présence ou en absence de TNFα, dans le but de reproduire une différenciation semblable à celle observée dans un contexte d’inflammation cutanée (Jansen et al., 2001). Ce travail a montré que 90 gènes subissent une régulation (surexpression pour 47 d’entre eux, sous- expression pour les 43 autres) en réponse au traitement par le TNFα. Les auteurs ont également mis en évidence, par la même technique, des gènes spécifiquement exprimés dans des lésions de kératose actinique, parmi lesquels pourraient se trouver des marqueurs précoces du processus de cancérogenèse (van Ruissen et al., 2002a). La technique utilisée pose cependant un problème de sensibilité, puisque de nombreux gènes représentés par une seule séquence SAGE n’ont pas pu être inclus dans une analyse statistique. En utilisant la technologie des puces à ADN, deux équipes ont comparé les gènes exprimés par les kératinocytes dans différentes conditions : des modèles d’épiderme reconstruit in vitro, des kératinocytes en culture monocouche et de la peau normale (Gazel et al., 2003; Mehul et al., 2004). La première, qui utilise des puces pangénomiques, montre, à grande échelle, que les modèles d’épiderme reconstruit sont plus proches de l’épiderme normal au niveau transcriptionnel, que ne le sont les kératinocytes en culture monocouche. La seconde étude, basée sur l’utilisation de puces dédiées, montre que sur 504 gènes étudiés, 22 ont un niveau

219 Annexes d’expression qui diffère entre les 3 modèles d’épiderme reconstruit testés (culture organotypique de kératinocytes sur derme désépidermisé, sur matrice de collagène, modèle « Episkin™ »). Ces résultats montrent aussi que les modèles d’épiderme en 3 dimensions permettent, contrairement aux kératinocytes cultivés sur plastique, de reproduire l’expression de nombreux gènes associés à la différenciation terminale comme la cornéodesmosine, la loricrine, la caspase 14 ou la filaggrine. Enfin, une étude du transcriptome de l'épiderme entier ex vivo par la méthode SAGE a été publiée (van Ruissen et al., 2002b). Cependant, cette méthode est peu adaptée à la caractérisation de nouveaux gènes, par manque de spécificité. A ce jour, aucune étude à grande échelle, concernant les gènes spécifiquement exprimés au cours des dernières étapes de la différenciation kératinocytaire de l’épiderme humain normal in vivo, n’a été publiée.

Etude du transcriptome du kératinocyte granuleux Nous avons entrepris l’étude du transcriptome des kératinocytes granuleux issus de peau humaine normale, avec le soutien du Genoscope d’Evry, dans le but d’identifier de nouveaux gènes intervenant au cours des dernières étapes de la différenciation. En effet, la compréhension de mécanismes cellulaires complexes tels que la cornification, nécessite des données à grande échelle, obtenues à partir de prélèvements plutôt que de cellules en culture et à partir de populations homogènes de cellules plutôt que d'organes entiers. Des fragments d’épiderme obtenus après clivage dermo-épidermique sont enrichis en kératinocytes granuleux par des incubations itératives dans une solution de trypsine. Après purification des ARNm, des mini-banques d'ADNc sont produites par la technique des ORESTES. Le séquençage de plus de 2000 EST nous a permis d’identifier 900 gènes différents. L’expression dans l’épiderme de la plupart d’entre eux n’a jamais été décrite. 30% sont de fonction inconnue. Plus de 100 gènes sont représentés par moins de 40 EST dans les bases de données. Ces transcrits, pour lesquels peu de séquences ont été produites par l’ensemble de la communauté scientifique, sont considérés par conséquent comme peu exprimés et/ou tissus-spécifiques. Nos résultats confirment le pouvoir de normalisation de la technique des ORESTES et montrent que cette stratégie est adaptée à la mise en évidence de l’expression de gènes très peu connus car peu abondants ou très spécifiques d’un tissu donné. Les séquences issues de ce travail contribueront ainsi à l’annotation du génome par la publication de ces nouveaux EST. D’autre part, de nombreux loci tels que 17p13.1, 14q11.2, 3p21 ou 19p12-q12 pour l’ichthyose autosomique récessive, ou encore 3q21, 5q31-q33,

220 Annexes

13q12-q14 pour la dermatite atopique, ont été mis en évidence par des études de liaison. Ce travail permettra de disposer de gènes candidats, d’expression épidermique, à tester dans ces régions d’intérêt. Enfin, l’identification de gènes codant pour des protéines dont la fonction n’a encore jamais été décrite, contribue à mieux comprendre la mise en place de la fonction barrière et certains de ses dysfonctionnements. Ainsi, nous travaillons à caractériser les produits de deux gènes spécifiques de l’épiderme : un nouvel inhibiteur de protéases de la famille de l’α2-macroglobuline ainsi que le gène codant pour la dermokine (Toulza et al., 2006). L’utilisation de puces à ADN pangénomiques permettra la comparaison du transcriptome des kératinocytes granuleux à celui des cellules de la couche basale. Cette méthode est moins sensible que la production d’EST pour identifier des transcrits rares. Elle est cependant complémentaire pour identifier parmi les transcrits détectables, ceux qui sont régulés au cours de la différenciation. A plus long terme, les méthodes d’amplification d’ARN permettront d’appliquer cette technologie à l’étude de prélèvements pathologiques (ichtyoses, carcinomes épidermoïdes, psoriasis…) et définir ainsi des gènes dont l’expression dérégulée pourrait constituer un marqueur pronostique ou diagnostique. Ainsi, de nombreuses génodermatoses sont caractérisées par une hyperkératose importante bien que leurs substratums géniques soient très différents (cytokératines, transglutaminase, stéroïde sulfatase, ...). Nous souhaitons, à travers l’étude des acteurs moléculaires de la cornification, comprendre les raisons de cette réaction tissulaire univoque à des anomalies aussi diverses. Ces troubles pourraient être dus à des mécanismes généraux "réactionnels" développés par les kératinocytes granuleux, que nous rechercherons dans l’espoir d’aboutir à des propositions thérapeutiques « symptomatiques ». Une partie des travaux présentés a été soutenue par la Société Française de Dermatologie. Nous remercions Mitou Ribouchon pour son aide technique lors de la réalisation des mini- banques d’ORESTES.

221 Annexes

RÉFÉRENCES

1. International Human Genome Sequencing Consortium. 2004. Finishing the euchromatic sequence of the human genome. Nature 431:931-45. 2. Adams, M. D., J. M. Kelley, J. D. Gocayne, M. Dubnick, M. H. Polymeropoulos, H. Xiao, C. R. Merril, A. Wu, B. Olde, R. F. Moreno, and et al. 1991. Complementary DNA sequencing: expressed sequence tags and human genome project. Science 252:1651-6. 3. Camargo, A. A., H. P. Samaia, E. Dias-Neto, D. F. Simao, I. A. Migotto, M. R. Briones, F. F. Costa, M. A. Nagai, S. Verjovski-Almeida, M. A. Zago, L. E. Andrade, H. Carrer, H. F. El- Dorry, E. M. Espreafico, A. Habr-Gama, D. Giannella-Neto, G. H. Goldman, A. Gruber, C. Hackel, E. T. Kimura, R. M. Maciel, S. K. Marie, E. A. Martins, M. P. Nobrega, M. L. Paco- Larson, M. I. Pardini, G. G. Pereira, J. B. Pesquero, V. Rodrigues, S. R. Rogatto, I. D. da Silva, M. C. Sogayar, M. F. Sonati, E. H. Tajara, S. R. Valentini, F. L. Alberto, M. E. Amaral, I. Aneas, L. A. Arnaldi, A. M. de Assis, M. H. Bengtson, N. A. Bergamo, V. Bombonato, M. E. de Camargo, R. A. Canevari, D. M. Carraro, J. M. Cerutti, M. L. Correa, R. F. Correa, M. C. Costa, C. Curcio, P. O. Hokama, A. J. Ferreira, G. K. Furuzawa, T. Gushiken, P. L. Ho, E. Kimura, J. E. Krieger, L. C. Leite, P. Majumder, M. Marins, E. R. Marques, A. S. Melo, M. B. Melo, C. A. Mestriner, E. C. Miracca, D. C. Miranda, A. L. Nascimento, F. G. Nobrega, E. P. Ojopi, J. R. Pandolfi, L. G. Pessoa, A. C. Prevedel, P. Rahal, C. A. Rainho, E. M. Reis, M. L. Ribeiro, N. da Ros, R. G. de Sa, M. M. Sales, S. C. Sant'anna, M. L. dos Santos, A. M. da Silva, N. P. da Silva, W. A. Silva, Jr., R. A. da Silveira, J. F. Sousa, D. Stecconi, F. Tsukumo, V. Valente, F. Soares, E. S. Moreira, D. N. Nunes, R. G. Correa, H. Zalcberg, A. F. Carvalho, L. F. Reis, R. R. Brentani, A. J. Simpson, and S. J. de Souza. 2001. The contribution of 700,000 ORF sequence tags to the definition of the human transcriptome. Proc Natl Acad Sci U S A 98:12103-8. 4. de Souza, S. J., A. A. Camargo, M. R. Briones, F. F. Costa, M. A. Nagai, S. Verjovski- Almeida, M. A. Zago, L. E. Andrade, H. Carrer, H. F. El-Dorry, E. M. Espreafico, A. Habr- Gama, D. Giannella-Neto, G. H. Goldman, A. Gruber, C. Hackel, E. T. Kimura, R. M. Maciel, S. K. Marie, E. A. Martins, M. P. Nobrega, M. L. Paco-Larson, M. I. Pardini, G. G. Pereira, J. B. Pesquero, V. Rodrigues, S. R. Rogatto, I. D. da Silva, M. C. Sogayar, M. de Fatima Sonati, E. H. Tajara, S. R. Valentini, M. Acencio, F. L. Alberto, M. E. Amaral, I. Aneas, M. H. Bengtson, D. M. Carraro, A. F. Carvalho, L. H. Carvalho, J. M. Cerutti, M. L. Correa, M. C. Costa, C. Curcio, T. Gushiken, P. L. Ho, E. Kimura, L. C. Leite, G. Maia, P. Majumder, M. Marins, A. Matsukuma, A. S. Melo, C. A. Mestriner, E. C. Miracca, D. C. Miranda, A. N. Nascimento, F. G. Nobrega, E. P. Ojopi, J. R. Pandolfi, L. G. Pessoa, P. Rahal, C. A. Rainho, N. da Ros, R. G. de Sa, M. M. Sales, N. P. da Silva, T. C. Silva, W. da Silva, Jr., D. F. Simao, J. F. Sousa, D. Stecconi, F. Tsukumo, V. Valente, H. Zalcbeg, R. R. Brentani, F. L. Reis, E. Dias-Neto, and A. J. Simpson. 2000. Identification of human chromosome 22 transcribed sequences with ORF expressed sequence tags. Proc Natl Acad Sci U S A 97:12690-3. 5. Diatchenko, L., Y. F. Lau, A. P. Campbell, A. Chenchik, F. Moqadam, B. Huang, S. Lukyanov, K. Lukyanov, N. Gurskaya, E. D. Sverdlov, and P. D. Siebert. 1996. Suppression subtractive hybridization: a method for generating differentially regulated or tissue-specific cDNA probes and libraries. Proc Natl Acad Sci U S A 93:6025-30. 6. Gazel, A., P. Ramphal, M. Rosdy, B. De Wever, C. Tornier, N. Hosein, B. Lee, M. Tomic- Canic, and M. Blumenberg. 2003. Transcriptional profiling of epidermal keratinocytes: comparison of genes expressed in skin, cultured keratinocytes, and reconstituted epidermis, using large DNA microarrays. J Invest Dermatol 121:1459-68. 7. Jansen, B. J., F. van Ruissen, G. de Jongh, P. L. Zeeuwen, and J. Schalkwijk. 2001. Serial analysis of gene expression in differentiated cultures of human epidermal keratinocytes. J Invest Dermatol 116:12-22. 8. Lander, E. S., L. M. Linton, B. Birren, C. Nusbaum, M. C. Zody, J. Baldwin, K. Devon, K. Dewar, M. Doyle, W. FitzHugh, R. Funke, D. Gage, K. Harris, A. Heaford, J. Howland, L. Kann, J. Lehoczky, R. LeVine, P. McEwan, K. McKernan, J. Meldrim, J. P. Mesirov, C. Miranda, W. Morris, J. Naylor, C. Raymond, M. Rosetti, R. Santos, A. Sheridan, C. Sougnez, N. Stange-Thomann, N. Stojanovic, A. Subramanian, D. Wyman, J. Rogers, J. Sulston, R.

222 Annexes

Ainscough, S. Beck, D. Bentley, J. Burton, C. Clee, N. Carter, A. Coulson, R. Deadman, P. Deloukas, A. Dunham, I. Dunham, R. Durbin, L. French, D. Grafham, S. Gregory, T. Hubbard, S. Humphray, A. Hunt, M. Jones, C. Lloyd, A. McMurray, L. Matthews, S. Mercer, S. Milne, J. C. Mullikin, A. Mungall, R. Plumb, M. Ross, R. Shownkeen, S. Sims, R. H. Waterston, R. K. Wilson, L. W. Hillier, J. D. McPherson, M. A. Marra, E. R. Mardis, L. A. Fulton, A. T. Chinwalla, K. H. Pepin, W. R. Gish, S. L. Chissoe, M. C. Wendl, K. D. Delehaunty, T. L. Miner, A. Delehaunty, J. B. Kramer, L. L. Cook, R. S. Fulton, D. L. Johnson, P. J. Minx, S. W. Clifton, T. Hawkins, E. Branscomb, P. Predki, P. Richardson, S. Wenning, T. Slezak, N. Doggett, J. F. Cheng, A. Olsen, S. Lucas, C. Elkin, E. Uberbacher, M. Frazier, et al. 2001. Initial sequencing and analysis of the human genome. Nature 409:860-921. 9. Mehul, B., D. Asselineau, D. Bernard, J. Leclaire, M. Regnier, R. Schmidt, and F. Bernerd. 2004. Gene expression profiles of three different models of reconstructed human epidermis and classical cultures of keratinocytes using cDNA arrays. Arch Dermatol Res. 10. Schena, M., D. Shalon, R. W. Davis, and P. O. Brown. 1995. Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science 270:467-70. 11. Toulza, E., M. Galliano, N. Jonca, H. Gallinaro, M. Méchin, A. Ishida-Yamamoto, G. Serre, and M. Guerrin. The human dermokine gene: description of novel isoforms with different tissue-specific expression and subcellular location, J Invest Dermatol. In press 12. van Ruissen, F., B. J. Jansen, G. J. de Jongh, I. M. van Vlijmen-Willems, and J. Schalkwijk. 2002. Differential gene expression in premalignant human epidermis revealed by cluster analysis of serial analysis of gene expression (SAGE) libraries. Faseb J 16:246-8. 13. van Ruissen, F., B. J. Jansen, G. J. de Jongh, P. L. Zeeuwen, and J. Schalkwijk. 2002. A partial transcriptome of human epidermis. Genomics 79:671-8. 14. Velculescu, V. E., L. Zhang, B. Vogelstein, and K. W. Kinzler. 1995. Serial analysis of gene expression. Science 270:484-7. 15. Venter, J. C., M. D. Adams, E. W. Myers, P. W. Li, R. J. Mural, G. G. Sutton, H. O. Smith, M. Yandell, C. A. Evans, R. A. Holt, J. D. Gocayne, P. Amanatides, R. M. Ballew, D. H. Huson, J. R. Wortman, Q. Zhang, C. D. Kodira, X. H. Zheng, L. Chen, M. Skupski, G. Subramanian, P. D. Thomas, J. Zhang, G. L. Gabor Miklos, C. Nelson, S. Broder, A. G. Clark, J. Nadeau, V. A. McKusick, N. Zinder, A. J. Levine, R. J. Roberts, M. Simon, C. Slayman, M. Hunkapiller, R. Bolanos, A. Delcher, I. Dew, D. Fasulo, M. Flanigan, L. Florea, A. Halpern, S. Hannenhalli, S. Kravitz, S. Levy, C. Mobarry, K. Reinert, K. Remington, J. Abu-Threideh, E. Beasley, K. Biddick, V. Bonazzi, R. Brandon, M. Cargill, I. Chandramouliswaran, R. Charlab, K. Chaturvedi, Z. Deng, V. Di Francesco, P. Dunn, K. Eilbeck, C. Evangelista, A. E. Gabrielian, W. Gan, W. Ge, F. Gong, Z. Gu, P. Guan, T. J. Heiman, M. E. Higgins, R. R. Ji, Z. Ke, K. A. Ketchum, Z. Lai, Y. Lei, Z. Li, J. Li, Y. Liang, X. Lin, F. Lu, G. V. Merkulov, N. Milshina, H. M. Moore, A. K. Naik, V. A. Narayan, B. Neelam, D. Nusskern, D. B. Rusch, S. Salzberg, W. Shao, B. Shue, J. Sun, Z. Wang, A. Wang, X. Wang, J. Wang, M. Wei, R. Wides, C. Xiao, C. Yan, et al. 2001. The sequence of the human genome. Science 291:1304-51.

223

Annexes

Dans le cadre d’une collaboration avec l’équipe dirigée par Michel Simon, j’ai participé à la caractérisation des transcrits codant pour les différentes caspases dans l’épiderme humain normal. Ce travail a donné lieu à une publication dans le British Journal of Dermatology (sous presse).

225 Annexes

226 Annexes

227 Annexes

228 Annexes

229 Annexes

230 Annexes

231 Annexes

232 Annexes

233 Annexes

234 Annexes

235 Annexes

236 Annexes

237 Annexes

238 Annexes

239 Annexes

240 Annexes

241 Annexes

242 Annexes

243 Annexes

244 Annexes

245 Annexes

246 Annexes

247 Annexes

248 Annexes

249 Annexes

250 Annexes

Figure 1.

251 Annexes

Figure 2.

252 Annexes

Figure 3.

Figure 4.

253 Annexes

Figure 5.

254 Annexes

Au cours de mes travaux de thèse, j’ai eu l’occasion de présenter 7 communications, citées ci- après.

Congrès nationaux

Toulza E, Gallinaro H, Vincent C, Serre G, Guerrin M. Caractérisation du transcriptome des kératinocytes granuleux de l'épiderme humain. Les Journées de l’INSERM Midi-Pyrénées, TOULOUSE, mars 2002. Communication orale. Toulza E, Jonca N, Gallinaro H, Constans J, Serre G, Guerrin M. Caractérisation du transcriptome des kératinocytes granuleux de l’épiderme humain. VIIIème Colloque « De la Recherche à la Découverte », CNRS Sciences de la Vie, section 22, TOULOUSE, avril 2003. Communication affichée. Toulza E, Serre G, Guerrin M. Caractérisation du transcriptome au cours des étapes tardives de la différenciation kératinocytaire. Congrès Annuel de Recherche Dermatologique, NICE, juin 2004. Communication orale. J Invest Dermatol, 123: A98, 2004.

Congrès internationaux

Toulza E, Galliano MF, Serre G, Guerrin M. Identification of 900 genes expressed by the human granular keratinocyte. 34th Annual meeting of the European Society for Dermatological Research, VIENNA, September 2004. Communication affichée. J Invest Dermatol 123:A18, 2004. Toulza E, Serre G and Guerrin M. Identification of 900 genes expressed by the human granular keratinocyte and characterization of a new marker of cornification. Joint meeting of the "Gruppo Italiano di Ricerca Sperimentale in Dermatologia" and the "Société de Recherche en Dermatologie", GENOA, june 2005. Communication orale.

Galliano MF, Toulza E, Gallinaro H, Jonca N, Ishida-Yamamoto A, Serre G, Guerrin M. Characterization and expression analysis of a new gene encoding a protease inhibitor of the alpha2 macroglobulin family, which is expressed in the human epidermis. 35th Annual meeting of the European Society for Dermatological Research, TÜBINGEN, September 2005. Communication orale. J Invest Dermatol, 125:A6, 2005.

Toulza E., Mattiuzzo N., Galliano F., Jonca N., Serre G., Guerrin M. Identification of 3500 genes expressed by the human granular keratinocyte. 36th Annual meeting of the European Society for Dermatological Research, PARIS, September 2006. Communication affichée.

255

V. BIBLIOGRAPHIE

257

Bibliographie

The International Human Genome Sequencing Consortium (2004). Finishing the euchromatic sequence of the human genome. Nature 431, 931-945. Adams, M. D., Kelley, J. M., Gocayne, J. D., Dubnick, M., Polymeropoulos, M. H., Xiao, H., Merril, C. R., Wu, A., Olde, B., Moreno, R. F., and et al. (1991). Complementary DNA sequencing: expressed sequence tags and human genome project. Science 252, 1651- 1656. Adams, M. J., Reichel, M. B., King, I. A., Marsden, M. D., Greenwood, M. D., Thirlwell, H., Arnemann, J., Buxton, R. S., and Ali, R. R. (1998). Characterization of the regulatory regions in the human desmoglein genes encoding the pemphigus foliaceous and pemphigus vulgaris antigens. Biochem J 329 ( Pt 1), 165-174. Aho, H., Schwemmer, M., Tessman, D., Murphy, D., Mattei, G., Engel, W., and Adham, I. M. (1996). Isolation, expression, and chromosomal localization of the human mitochondrial capsule selenoprotein gene (MCSP). Genomics 32, 184-190. Aho, S., Li, K., Ryoo, Y., McGee, C., Ishida-Yamamoto, A., Uitto, J., and Klement, J. F. (2004). Periplakin gene targeting reveals a constituent of the cornified cell envelope dispensable for normal mouse development. Mol Cell Biol 24, 6410-6418. Akiyama, M., Sugiyama-Nakagiri, Y., Sakai, K., McMillan, J. R., Goto, M., Arita, K., Tsuji- Abe, Y., Tabata, N., Matsuoka, K., Sasaki, R., et al. (2005). Mutations in lipid transporter ABCA12 in harlequin ichthyosis and functional recovery by corrective gene transfer. J Clin Invest 115, 1777-1784. Albert, M. R., Foster, R. A., and Vogel, J. C. (2001). Murine epidermal label-retaining cells isolated by flow cytometry do not express the stem cell markers CD34, Sca-1, or Flk-1. J Invest Dermatol 117, 943-948. Ali, R. S., Falconer, A., Ikram, M., Bissett, C. E., Cerio, R., and Quinn, A. G. (2001). Expression of the peptide antibiotics human beta defensin-1 and human beta defensin-2 in normal human skin. J Invest Dermatol 117, 106-111. Allaker, R. P., Zihni, C., and Kapas, S. (1999). An investigation into the antimicrobial effects of adrenomedullin on members of the skin, oral, respiratory tract and gut microflora. FEMS Immunol Med Microbiol 23, 289-293. Allombert-Blaise, C., Tamiji, S., Mortier, L., Fauvel, H., Tual, M., Delaporte, E., Piette, F., DeLassale, E. M., Formstecher, P., Marchetti, P., and Polakowska, R. (2003). Terminal differentiation of human epidermal keratinocytes involves mitochondria- and caspase- dependent cell death pathway. Cell Death Differ 10, 850-852. Amagai, M., Fujimori, T., Masunaga, T., Shimizu, H., Nishikawa, T., Shimizu, N., Takeichi, M., and Hashimoto, T. (1995). Delayed assembly of desmosomes in keratinocytes with disrupted classic-cadherin-mediated cell adhesion by a dominant negative mutant. J Invest Dermatol 104, 27-32. Andersen, B., Weinberg, W. C., Rennekampff, O., McEvilly, R. J., Bermingham, J. R., Jr., Hooshmand, F., Vasilyev, V., Hansbrough, J. F., Pittelkow, M. R., Yuspa, S. H., and Rosenfeld, M. G. (1997). Functions of the POU domain genes Skn-1a/i and Tst-1/Oct- 6/SCIP in epidermal differentiation. Genes Dev 11, 1873-1884. April, C. S., and Barsh, G. S. (2006). Skin layer-specific transcriptional profiles in normal and recessive yellow (Mc1r/Mc1r) mice. Pigment Cell Res 19, 194-205. Armstrong, D. K., McKenna, K. E., Purkis, P. E., Green, K. J., Eady, R. A., Leigh, I. M., and Hughes, A. E. (1999). Haploinsufficiency of desmoplakin causes a striate subtype of palmoplantar keratoderma. Hum Mol Genet 8, 143-148. Ashcroft, G. S., Lei, K., Jin, W., Longenecker, G., Kulkarni, A. B., Greenwell-Wild, T., Hale- Donze, H., McGrady, G., Song, X. Y., and Wahl, S. M. (2000). Secretory leukocyte protease inhibitor mediates non-redundant functions necessary for normal wound healing. Nat Med 6, 1147-1153.

259 Bibliographie

Askew, Y. S., Pak, S. C., Luke, C. J., Askew, D. J., Cataltepe, S., Mills, D. R., Kato, H., Lehoczky, J., Dewar, K., Birren, B., and Silverman, G. A. (2001). SERPINB12 is a novel member of the human ov-serpin family that is widely expressed and inhibits trypsin-like serine proteinases. J Biol Chem 276, 49320-49330. Backendorf, C., and Hohl, D. (1992). A common origin for cornified envelope proteins? Nat Genet 2, 91. Bartoloni, L., Wattenhofer, M., Kudoh, J., Berry, A., Shibuya, K., Kawasaki, K., Wang, J., Asakawa, S., Talior, I., Bonne-Tamir, B., et al. (2000). Cloning and characterization of a putative human glycerol 3-phosphate permease gene (SLC37A1 or G3PP) on 21q22.3: mutation analysis in two candidate phenotypes, DFNB10 and a glycerol kinase deficiency. Genomics 70, 190-200. Bas, A., Forsberg, G., Hammarstrom, S., and Hammarstrom, M. L. (2004). Utility of the housekeeping genes 18S rRNA, beta-actin and glyceraldehyde-3-phosphate- dehydrogenase for normalization in real-time quantitative reverse transcriptase- polymerase chain reaction analysis of gene expression in human T lymphocytes. Scand J Immunol 59, 566-573. Bayer, M., Fischer, J., Kremerskothen, J., Ossendorf, E., Matanis, T., Konczal, M., Weide, T., and Barnekow, A. (2005). Identification and characterization of Iporin as a novel interaction partner for rab1. BMC Cell Biol 6, 15. Bazzi, H., Getz, A., Mahoney, M. G., Ishida-Yamamoto, A., Langbein, L., Wahl, J. K., 3rd, and Christiano, A. M. (2006). Desmoglein 4 is expressed in highly differentiated keratinocytes and trichocytes in human epidermis and hair follicle. Differentiation 74, 129-140. Bazzoni, G., and Dejana, E. (2002). Keratinocyte junctions and the epidermal barrier: how to make a skin-tight dress. J Cell Biol 156, 947-949. Bensch, K. W., Raida, M., Magert, H. J., Schulz-Knappe, P., and Forssmann, W. G. (1995). hBD-1: a novel beta-defensin from human plasma. FEBS Lett 368, 331-335. Bernard, D., Mehul, B., Thomas-Collignon, A., Simonetti, L., Remy, V., Bernard, M. A., and Schmidt, R. (2003). Analysis of proteins with caseinolytic activity in a human stratum corneum extract revealed a yet unidentified cysteine protease and identified the so- called "stratum corneum thiol protease" as cathepsin l2. J Invest Dermatol 120, 592-600. Bernard, F. X., Pedretti, N., Rosdy, M., and Deguercy, A. (2002). Comparison of gene expression profiles in human keratinocyte mono-layer cultures, reconstituted epidermis and normal human skin; transcriptional effects of retinoid treatments in reconstituted human epidermis. Exp Dermatol 11, 59-74. Berthou, C., Michel, L., Soulie, A., Jean-Louis, F., Flageul, B., Dubertret, L., Sigaux, F., Zhang, Y., and Sasportes, M. (1997). Acquisition of granzyme B and Fas ligand proteins by human keratinocytes contributes to epidermal cell defense. J Immunol 159, 5293- 5300. Bertioli, D. J., Schlichter, U. H., Adams, M. J., Burrows, P. R., Steinbiss, H. H., and Antoniw, J. F. (1995). An analysis of differential display shows a strong bias towards high copy number mRNAs. Nucleic Acids Res 23, 4520-4523. Birney, E., Andrews, D., Caccamo, M., Chen, Y., Clarke, L., Coates, G., Cox, T., Cunningham, F., Curwen, V., Cutts, T., et al. (2006). Ensembl 2006. Nucleic Acids Res 34, D556-561. Bishop, J. O., Morton, J. G., Rosbash, M., and Richardson, M. (1974). Three abundance classes in HeLa cell messenger RNA. Nature 250, 199-204. Blanpain, C., Lowry, W. E., Geoghegan, A., Polak, L., and Fuchs, E. (2004). Self-renewal, multipotency, and the existence of two cell populations within an epithelial stem cell niche. Cell 118, 635-648.

260 Bibliographie

Bonkobara, M., Das, A., Takao, J., Cruz, P. D., and Ariizumi, K. (2003). Identification of novel genes for secreted and membrane-anchored proteins in human keratinocytes. Br J Dermatol 148, 654-664. Bortoluzzi, S., d'Alessi, F., Romualdi, C., and Danieli, G. A. (2000). The human adult skeletal muscle transcriptional profile reconstructed by a novel computational approach. Genome Res 10, 344-349. Bowcock, A. M., Shannon, W., Du, F., Duncan, J., Cao, K., Aftergut, K., Catier, J., Fernandez-Vina, M. A., and Menter, A. (2001). Insights into psoriasis and other inflammatory diseases from large-scale gene expression studies. Hum Mol Genet 10, 1793-1805. Braff, M. H., Di Nardo, A., and Gallo, R. L. (2005). Keratinocytes store the antimicrobial peptide cathelicidin in lamellar bodies. J Invest Dermatol 124, 394-400. Brandner, J. M., Kief, S., Grund, C., Rendl, M., Houdek, P., Kuhn, C., Tschachler, E., Franke, W. W., and Moll, I. (2002). Organization and formation of the tight junction system in human epidermis and cultured keratinocytes. Eur J Cell Biol 81, 253-263. Brandner, J. M., Kief, S., Wladykowski, E., Houdek, P., and Moll, I. (2006). Tight junction proteins in the skin. Skin Pharmacol Physiol 19, 71-77. Brown, A. C., Kai, K., May, M. E., Brown, D. C., and Roopenian, D. C. (2004). ExQuest, a novel method for displaying quantitative gene expression from ESTs. Genomics 83, 528-539. Cabral, A., Sayin, A., de Winter, S., Fischer, D. F., Pavel, S., and Backendorf, C. (2001a). SPRR4, a novel cornified envelope precursor: UV-dependent epidermal expression and selective incorporation into fragile envelopes. J Cell Sci 114, 3837-3843. Cabral, A., Voskamp, P., Cleton-Jansen, A. M., South, A., Nizetic, D., and Backendorf, C. (2001b). Structural organization and regulation of the small proline-rich family of cornified envelope precursors suggest a role in adaptive barrier function. J Biol Chem 276, 19231-19237. Camargo, A. A., Samaia, H. P., Dias-Neto, E., Simao, D. F., Migotto, I. A., Briones, M. R., Costa, F. F., Nagai, M. A., Verjovski-Almeida, S., Zago, M. A., et al. (2001). The contribution of 700,000 ORF sequence tags to the definition of the human transcriptome. Proc Natl Acad Sci U S A 98, 12103-12108. Candi, E., Schmidt, R., and Melino, G. (2005). The cornified envelope: a model of cell death in the skin. Nat Rev Mol Cell Biol 6, 328-340. Capon, F., Semprini, S., Chimenti, S., Fabrizi, G., Zambruno, G., Murgia, S., Carcassi, C., Fazio, M., Mingarelli, R., Dallapiccola, B., and Novelli, G. (2001). Fine mapping of the PSORS4 psoriasis susceptibility region on chromosome 1q21. J Invest Dermatol 116, 728-730. Carles, A., Millon, R., Cromer, A., Ganguli, G., Lemaire, F., Young, J., Wasylyk, C., Muller, D., Schultz, I., Rabouel, Y., et al. (2006). Head and neck squamous cell carcinoma transcriptome analysis by comprehensive validated differential display. Oncogene 25, 1821-1831. Carninci, P., Kasukawa, T., Katayama, S., Gough, J., Frith, M. C., Maeda, N., Oyama, R., Ravasi, T., Lenhard, B., Wells, C., et al. (2005). The transcriptional landscape of the mammalian genome. Science 309, 1559-1563. Cassidy, A. J., van Steensel, M. A., Steijlen, P. M., van Geel, M., van der Velden, J., Morley, S. M., Terrinoni, A., Melino, G., Candi, E., and McLean, W. H. (2005). A homozygous missense mutation in TGM5 abolishes epidermal transglutaminase 5 activity and causes acral peeling skin syndrome. Am J Hum Genet 77, 909-917.

261 Bibliographie

Caubet, C., Jonca, N., Lopez, F., Esteve, J. P., Simon, M., and Serre, G. (2004). Homo- oligomerization of human corneodesmosin is mediated by its N-terminal glycine loop domain. J Invest Dermatol 122, 747-754. Chavanas, S., Bodemer, C., Rochat, A., Hamel-Teillac, D., Ali, M., Irvine, A. D., Bonafe, J. L., Wilkinson, J., Taieb, A., Barrandon, Y., et al. (2000). Mutations in SPINK5, encoding a serine protease inhibitor, cause Netherton syndrome. Nat Genet 25, 141-142. Chen, J. J., Rowley, J. D., and Wang, S. M. (2000). Generation of longer cDNA fragments from serial analysis of gene expression tags for gene identification. Proc Natl Acad Sci U S A 97, 349-353. Cheng, J., Syder, A. J., Yu, Q. C., Letai, A., Paller, A. S., and Fuchs, E. (1992). The genetic basis of epidermolytic hyperkeratosis: a disorder of differentiation-specific epidermal keratin genes. Cell 70, 811-819. Cheng, T., Hitomi, K., van Vlijmen-Willems, I. M., de Jongh, G. J., Yamamoto, K., Nishi, K., Watts, C., Reinheckel, T., Schalkwijk, J., and Zeeuwen, P. L. (2006). Cystatin M/E is a high affinity inhibitor of cathepsin V and cathepsin L by a reactive site that is distinct from the legumain-binding site. A novel clue for the role of cystatin M/E in epidermal cornification. J Biol Chem. Chidgey, M., Brakebusch, C., Gustafsson, E., Cruchley, A., Hail, C., Kirk, S., Merritt, A., North, A., Tselepis, C., Hewitt, J., et al. (2001). Mice lacking desmocollin 1 show epidermal fragility accompanied by barrier defects and abnormal differentiation. J Cell Biol 155, 821-832. Choi, E. H., Man, M. Q., Wang, F., Zhang, X., Brown, B. E., Feingold, K. R., and Elias, P. M. (2005). Is endogenous glycerol a determinant of stratum corneum hydration in humans? J Invest Dermatol 125, 288-293. Choi, M. J., and Maibach, H. I. (2005). Role of ceramides in barrier function of healthy and diseased skin. Am J Clin Dermatol 6, 215-223. Cole, J., Tsou, R., Wallace, K., Gibran, N., and Isik, F. (2001). Early gene expression profile of human skin to injury using high-density cDNA microarrays. Wound Repair Regen 9, 360-370. Collin, C., Moll, R., Kubicka, S., Ouhayoun, J. P., and Franke, W. W. (1992). Characterization of human cytokeratin 2, an epidermal cytoskeletal protein synthesized late during differentiation. Exp Cell Res 202, 132-141. Consortium, C. e. S. (1998). Genome sequence of the nematode C. elegans: a platform for investigating biology. Science 282, 2012-2018. Contzler, R., Favre, B., Huber, M., and Hohl, D. (2005). Cornulin, a new member of the "fused gene" family, is expressed during epidermal differentiation. J Invest Dermatol 124, 990-997. Cooper, L., Johnson, C., Burslem, F., and Martin, P. (2005). Wound healing and inflammation genes revealed by array analysis of 'macrophageless' PU.1 null mice. Genome Biol 6, R5. Cotsarelis, G., Sun, T. T., and Lavker, R. M. (1990). Label-retaining cells reside in the bulge area of pilosebaceous unit: implications for follicular stem cells, hair cycle, and skin carcinogenesis. Cell 61, 1329-1337. da Mota, A. F., Sonstegard, T. S., Van Tassell, C. P., Shade, L. L., Matukumalli, L. K., Wood, D. L., Capuco, A. V., Brito, M. A., Connor, E. E., Martinez, M. L., and Coutinho, L. L. (2004). Characterization of open reading frame-expressed sequence tags generated from Bos indicus and B. taurus mammary gland cDNA libraries. Anim Genet 35, 213-219. Dai, X., and Segre, J. A. (2004). Transcriptional control of epidermal specification and differentiation. Curr Opin Genet Dev 14, 485-491.

262 Bibliographie de Arriba Zerpa, G. A., Saleh, M. C., Fernandez, P. M., Guillou, F., Espinosa de los Monteros, A., de Vellis, J., Zakin, M. M., and Baron, B. (2000). Alternative splicing prevents transferrin secretion during differentiation of a human oligodendrocyte cell line. J Neurosci Res 61, 388-395. de Souza, S. J., Camargo, A. A., Briones, M. R., Costa, F. F., Nagai, M. A., Verjovski- Almeida, S., Zago, M. A., Andrade, L. E., Carrer, H., El-Dorry, H. F., et al. (2000). Identification of human chromosome 22 transcribed sequences with ORF expressed sequence tags. Proc Natl Acad Sci U S A 97, 12690-12693. Dellambra, E., Golisano, O., Bondanza, S., Siviero, E., Lacal, P., Molinari, M., D'Atri, S., and De Luca, M. (2000). Downregulation of 14-3-3sigma prevents clonal evolution and leads to immortalization of primary human keratinocytes. J Cell Biol 149, 1117-1130. Descargues, P., Deraison, C., Bonnart, C., Kreft, M., Kishibe, M., Ishida-Yamamoto, A., Elias, P., Barrandon, Y., Zambruno, G., Sonnenberg, A., and Hovnanian, A. (2005). Spink5-deficient mice mimic Netherton syndrome through degradation of desmoglein 1 by epidermal protease hyperactivity. Nat Genet 37, 56-65. Dias Neto, E., Correa, R. G., Verjovski-Almeida, S., Briones, M. R., Nagai, M. A., da Silva, W., Jr., Zago, M. A., Bordin, S., Costa, F. F., Goldman, G. H., et al. (2000). Shotgun sequencing of the human transcriptome with ORF expressed sequence tags. Proc Natl Acad Sci U S A 97, 3491-3496. Diatchenko, L., Lau, Y. F., Campbell, A. P., Chenchik, A., Moqadam, F., Huang, B., Lukyanov, S., Lukyanov, K., Gurskaya, N., Sverdlov, E. D., and Siebert, P. D. (1996). Suppression subtractive hybridization: a method for generating differentially regulated or tissue-specific cDNA probes and libraries. Proc Natl Acad Sci U S A 93, 6025-6030. Djalilian, A. R., McGaughey, D., Patel, S., Seo, E. Y., Yang, C., Cheng, J., Tomic, M., Sinha, S., Ishida-Yamamoto, A., and Segre, J. A. (2006). Connexin 26 regulates epidermal barrier and wound remodeling and promotes psoriasiform response. J Clin Invest 116, 1243-1253. Djian, P., and Delhomme, B. (2005). Systematic repeat addition at a precise location in the coding region of the involucrin gene of wild mice reveals their phylogeny. Genetics 169, 2199-2208. Djian, P., Delhomme, B., and Green, H. (1995). Origin of the polymorphism of the involucrin gene in Asians. Am J Hum Genet 56, 1367-1372. Djian, P., Easley, K., and Green, H. (2000). Targeted ablation of the murine involucrin gene. J Cell Biol 151, 381-388. Doering, T., Holleran, W. M., Potratz, A., Vielhaber, G., Elias, P. M., Suzuki, K., and Sandhoff, K. (1999). Sphingolipid activator proteins are required for epidermal permeability barrier formation. J Biol Chem 274, 11038-11045. Donato, R. (2001). S100: a multigenic family of calcium-modulated proteins of the EF-hand type with intracellular and extracellular functional roles. Int J Biochem Cell Biol 33, 637-668. Donato, R. (2003). Intracellular and extracellular roles of S100 proteins. Microsc Res Tech 60, 540-551. Dorschner, R. A., Pestonjamasp, V. K., Tamakuwala, S., Ohtake, T., Rudisill, J., Nizet, V., Agerberth, B., Gudmundsson, G. H., and Gallo, R. L. (2001). Cutaneous injury induces the release of cathelicidin anti-microbial peptides active against group A Streptococcus. J Invest Dermatol 117, 91-97. Droin, N. M., and Green, D. R. (2004). Role of Bcl-2 family members in immunity and disease. Biochim Biophys Acta 1644, 179-188.

263 Bibliographie

Duguid, J. R., Rohwer, R. G., and Seed, B. (1988). Isolation of cDNAs of scrapie-modulated RNAs by subtractive hybridization of a cDNA library. Proc Natl Acad Sci U S A 85, 5738-5742. Durr, U. H., Sudheendra, U. S., and Ramamoorthy, A. (2006). LL-37, the only human member of the cathelicidin family of antimicrobial peptides. Biochim Biophys Acta. Eckert, R. L., Broome, A. M., Ruse, M., Robinson, N., Ryan, D., and Lee, K. (2004a). S100 proteins in the epidermis. J Invest Dermatol 123, 23-33. Eckert, R. L., Crish, J. F., Efimova, T., Dashti, S. R., Deucher, A., Bone, F., Adhikary, G., Huang, G., Gopalakrishnan, R., and Balasubramanian, S. (2004b). Regulation of involucrin gene expression. J Invest Dermatol 123, 13-22. Eckert, R. L., and Green, H. (1986). Structure and evolution of the human involucrin gene. Cell 46, 583-589. Eckhart, L., Ban, J., Fischer, H., and Tschachler, E. (2000). Caspase-14: analysis of gene structure and mRNA expression during keratinocyte differentiation. Biochem Biophys Res Commun 277, 655-659. Egberts, F., Heinrich, M., Jensen, J. M., Winoto-Morbach, S., Pfeiffer, S., Wickel, M., Schunck, M., Steude, J., Saftig, P., Proksch, E., and Schutze, S. (2004). Cathepsin D is involved in the regulation of transglutaminase 1 and epidermal differentiation. J Cell Sci 117, 2295-2307. Eisen, M. B., Spellman, P. T., Brown, P. O., and Botstein, D. (1998). Cluster analysis and display of genome-wide expression patterns. Proc Natl Acad Sci U S A 95, 14863- 14868. Ekholm, E., and Egelrud, T. (2000). Expression of stratum corneum chymotryptic enzyme in relation to other markers of epidermal differentiation in a skin explant model. Exp Dermatol 9, 65-70. El-Rifai, W., Moskaluk, C. A., Abdrabbo, M. K., Harper, J., Yoshida, C., Riggins, G. J., Frierson, H. F., Jr., and Powell, S. M. (2002). Gastric cancers overexpress S100A calcium-binding proteins. Cancer Res 62, 6823-6826. Elias, P., Ahn, S., Brown, B., Crumrine, D., and Feingold, K. R. (2002). Origin of the epidermal calcium gradient: regulation by barrier status and role of active vs passive mechanisms. J Invest Dermatol 119, 1269-1274. Elias, P. M., Crumrine, D., Rassner, U., Hachem, J. P., Menon, G. K., Man, W., Choy, M. H., Leypoldt, L., Feingold, K. R., and Williams, M. L. (2004). Basis for abnormal desquamation and permeability barrier dysfunction in RXLI. J Invest Dermatol 122, 314-319. Fietz, M. J., Rogers, G. E., Eyre, H. J., Baker, E., Callen, D. F., and Sutherland, G. R. (1992). Mapping of the trichohyalin gene: co-localization with the profilaggrin, involucrin, and loricrin genes. J Invest Dermatol 99, 542-544. Fischer, H., Eckhart, L., Mildner, M., Jaeger, K., Buchberger, M., Ghannadan, M., and Tschachler, E. (2006). DNase1L2 Degrades Nuclear DNA during Corneocyte Formation. J Invest Dermatol. Forslind, B. (1986). Particle probe analysis in the study of skin physiology. Scan Electron Microsc, 1007-1014. Frohm, M., Agerberth, B., Ahangari, G., Stahle-Backdahl, M., Liden, S., Wigzell, H., and Gudmundsson, G. H. (1997). The expression of the gene coding for the antibacterial peptide LL-37 is induced in human keratinocytes during inflammatory disorders. J Biol Chem 272, 15258-15263. Fuchs, E., and Weber, K. (1994). Intermediate filaments: structure, dynamics, function, and disease. Annu Rev Biochem 63, 345-382.

264 Bibliographie

Fuellen, G., Nacken, W., Sorg, C., and Kerkhoff, C. (2004). Computational searches for missing orthologs: the case of S100A12 in mice. Omics 8, 334-340. Fujita, N., Suzuki, K., Vanier, M. T., Popko, B., Maeda, N., Klein, A., Henseler, M., Sandhoff, K., Nakayasu, H., and Suzuki, K. (1996). Targeted disruption of the mouse sphingolipid activator protein gene: a complex phenotype, including severe leukodystrophy and wide-spread storage of multiple sphingolipids. Hum Mol Genet 5, 711-725. Fulton, C., Anderson, G. M., Zasloff, M., Bull, R., and Quinn, A. G. (1997). Expression of natural peptide antibiotics in human skin. Lancet 350, 1750-1751. Furey, T. S. (2006). Comparison of human (and other) genome browsers. Hum Genomics 2, 266-270. Furuse, M., Hata, M., Furuse, K., Yoshida, Y., Haratake, A., Sugitani, Y., Noda, T., Kubo, A., and Tsukita, S. (2002). Claudin-based tight junctions are crucial for the mammalian epidermal barrier: a lesson from claudin-1-deficient mice. J Cell Biol 156, 1099-1111. Furuse, M., and Tsukita, S. (2006). Claudins in occluding junctions of humans and flies. Trends Cell Biol 16, 181-188. Gan, S. Q., McBride, O. W., Idler, W. W., Markova, N., and Steinert, P. M. (1990). Organization, structure, and polymorphisms of the human profilaggrin gene. Biochemistry 29, 9432-9440. Gavrieli, Y., Sherman, Y., and Ben-Sasson, S. A. (1992). Identification of programmed cell death in situ via specific labeling of nuclear DNA fragmentation. J Cell Biol 119, 493- 501. Gazel, A., Ramphal, P., Rosdy, M., De Wever, B., Tornier, C., Hosein, N., Lee, B., Tomic- Canic, M., and Blumenberg, M. (2003). Transcriptional profiling of epidermal keratinocytes: comparison of genes expressed in skin, cultured keratinocytes, and reconstituted epidermis, using large DNA microarrays. J Invest Dermatol 121, 1459- 1468. Ghazizadeh, S., and Taichman, L. B. (2001). Multiple classes of stem cells in cutaneous epithelium: a lineage analysis of adult mouse skin. Embo J 20, 1215-1222. Ghazizadeh, S., and Taichman, L. B. (2005). Organization of stem cells and their progeny in human epidermis. J Invest Dermatol 124, 367-372. Gibbs, S., Fijneman, R., Wiegant, J., van Kessel, A. G., van De Putte, P., and Backendorf, C. (1993). Molecular characterization and evolution of the SPRR family of keratinocyte differentiation markers encoding small proline-rich proteins. Genomics 16, 630-637. Glaser, R., Harder, J., Lange, H., Bartels, J., Christophers, E., and Schroder, J. M. (2005). Antimicrobial psoriasin (S100A7) protects human skin from Escherichia coli infection. Nat Immunol 6, 57-64. Gold, L. I., Jussila, T., Fusenig, N. E., and Stenback, F. (2000). TGF-beta isoforms are differentially expressed in increasing malignant grades of HaCaT keratinocytes, suggesting separate roles in skin carcinogenesis. J Pathol 190, 579-588. Golub, T. R., Slonim, D. K., Tamayo, P., Huard, C., Gaasenbeek, M., Mesirov, J. P., Coller, H., Loh, M. L., Downing, J. R., Caligiuri, M. A., et al. (1999). Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 286, 531-537. Gonias, S. L., Carmichael, A., Mettenburg, J. M., Roadcap, D. W., Irvin, W. P., and Webb, D. J. (2000). Identical or overlapping sequences in the primary structure of human alpha(2)-macroglobulin are responsible for the binding of nerve growth factor-beta, platelet-derived growth factor-BB, and transforming growth factor-beta. J Biol Chem 275, 5826-5831.

265 Bibliographie

Green, K. J., Parry, D. A., Steinert, P. M., Virata, M. L., Wagner, R. M., Angst, B. D., and Nilles, L. A. (1990). Structure of the human desmoplakins. Implications for function in the desmosomal plaque. J Biol Chem 265, 2603-2612. Groot, K. R., Sevilla, L. M., Nishi, K., DiColandrea, T., and Watt, F. M. (2004). Kazrin, a novel periplakin-interacting protein associated with desmosomes and the keratinocyte plasma membrane. J Cell Biol 166, 653-659. Grundmann, U., Romisch, J., Siebold, B., Bohn, H., and Amann, E. (1990). Cloning and expression of a cDNA encoding human placental protein 11, a putative serine protease with diagnostic significance as a tumor marker. DNA Cell Biol 9, 243-250. Guerrin, M., Simon, M., Montezin, M., Haftek, M., Vincent, C., and Serre, G. (1998). Expression cloning of human corneodesmosin proves its identity with the product of the S gene and allows improved characterization of its processing during keratinocyte differentiation. J Biol Chem 273, 22640-22647. Haas, U., Podda, M., Behne, M., Gurrieri, S., Alonso, A., Furstenberger, G., Pfeilschifter, J., Lambeau, G., Gelb, M. H., and Kaszkin, M. (2005). Characterization and differentiation-dependent regulation of secreted phospholipases A in human keratinocytes and in healthy and psoriatic human skin. J Invest Dermatol 124, 204-211. Hagiwara, K., Kikuchi, T., Endo, Y., Huqun, Usui, K., Takahashi, M., Shibata, N., Kusakabe, T., Xin, H., Hoshi, S., et al. (2003). Mouse SWAM1 and SWAM2 are antibacterial proteins composed of a single whey acidic protein motif. J Immunol 170, 1973-1979. Haider, A. S., Peters, S. B., Kaporis, H., Cardinale, I., Fei, J., Ott, J., Blumenberg, M., Bowcock, A. M., Krueger, J. G., and Carucci, J. A. (2006). Genomic analysis defines a cancer-specific gene expression signature for human squamous cell carcinoma and distinguishes malignant hyperproliferation from benign hyperplasia. J Invest Dermatol 126, 869-881. Hamilton, E. H., Payne, R. E., Jr., and O'Keefe, E. J. (1991). Trichohyalin: presence in the granular layer and stratum corneum of normal human epidermis. J Invest Dermatol 96, 666-672. Hanley, K., Wood, L., Ng, D. C., He, S. S., Lau, P., Moser, A., Elias, P. M., Bikle, D. D., Williams, M. L., and Feingold, K. R. (2001). Cholesterol sulfate stimulates involucrin transcription in keratinocytes by increasing Fra-1, Fra-2, and Jun D. J Lipid Res 42, 390-398. Hansson, L., Stromqvist, M., Backman, A., Wallbrandt, P., Carlstein, A., and Egelrud, T. (1994). Cloning, expression, and characterization of stratum corneum chymotryptic enzyme. A skin-specific human serine proteinase. J Biol Chem 269, 19420-19426. Harder, J., Bartels, J., Christophers, E., and Schroder, J. M. (1997). A peptide antibiotic from human skin. Nature 387, 861. Harder, J., Bartels, J., Christophers, E., and Schroder, J. M. (2001). Isolation and characterization of human beta -defensin-3, a novel human inducible peptide antibiotic. J Biol Chem 276, 5707-5713. Hatakeyama, S., Osawa, M., Omine, M., and Ishikawa, F. (1999). JTB: a novel membrane protein gene at 1q21 rearranged in a jumping translocation. Oncogene 18, 2085-2090. Hatzfeld, M., and Nachtsheim, C. (1996). Cloning and characterization of a new armadillo family member, p0071, associated with the junctional plaque: evidence for a subfamily of closely related proteins. J Cell Sci 109 ( Pt 11), 2767-2778. Hawthorne, S. K., Goodarzi, G., Bagarova, J., Gallant, K. E., Busanelli, R. R., Olend, W. J., and Kleene, K. C. (2005). Comparative genomics of the sperm mitochondria-associated cysteine-rich protein gene. Genomics. Heid, C. A., Stevens, J., Livak, K. J., and Williams, P. M. (1996). Real time quantitative PCR. Genome Res 6, 986-994.

266 Bibliographie

Heinzel, R., Appelhans, H., Gassen, G., Seemuller, U., Machleidt, W., Fritz, H., and Steffens, G. (1986). Molecular cloning and expression of cDNA for human antileukoprotease from cervix uterus. Eur J Biochem 160, 61-67. Henseler, T., and Christophers, E. (1985). Psoriasis of early and late onset: characterization of two types of psoriasis vulgaris. J Am Acad Dermatol 13, 450-456. Herron, B. J., Liddell, R. A., Parker, A., Grant, S., Kinne, J., Fisher, J. K., and Siracusa, L. D. (2005). A mutation in stratifin is responsible for the repeated epilation (Er) phenotype in mice. Nat Genet 37, 1210-1212. Hewett, D. R., Simons, A. L., Mangan, N. E., Jolin, H. E., Green, S. M., Fallon, P. G., and McKenzie, A. N. (2005). Lethal, neonatal ichthyosis with increased proteolytic processing of filaggrin in a mouse model of Netherton syndrome. Hum Mol Genet 14, 335-346. Hida, K., Wada, J., Eguchi, J., Zhang, H., Baba, M., Seida, A., Hashimoto, I., Okada, T., Yasuhara, A., Nakatsuka, A., et al. (2005). Visceral adipose tissue-derived serine protease inhibitor: a unique insulin-sensitizing adipocytokine in obesity. Proc Natl Acad Sci U S A 102, 10610-10615. Hiemstra, P. S., Maassen, R. J., Stolk, J., Heinzel-Wieland, R., Steffens, G. J., and Dijkman, J. H. (1996). Antibacterial activity of antileukoprotease. Infect Immun 64, 4520-4524. Hohl, D., Mehrel, T., Lichti, U., Turner, M. L., Roop, D. R., and Steinert, P. M. (1991). Characterization of human loricrin. Structure and function of a new class of epidermal cell envelope proteins. J Biol Chem 266, 6626-6636. Hollox, E. J., Armour, J. A., and Barber, J. C. (2003). Extensive normal copy number variation of a beta-defensin antimicrobial-gene cluster. Am J Hum Genet 73, 591-600. Horikoshi, T., Igarashi, S., Uchiwa, H., Brysk, H., and Brysk, M. M. (1999). Role of endogenous cathepsin D-like and chymotrypsin-like proteolysis in human epidermal desquamation. Br J Dermatol 141, 453-459. Huber, M., Siegenthaler, G., Mirancea, N., Marenholz, I., Nizetic, D., Breitkreutz, D., Mischke, D., and Hohl, D. (2005). Isolation and characterization of human repetin, a member of the fused gene family of the epidermal differentiation complex. J Invest Dermatol 124, 998-1007. Huelsken, J., Vogel, R., Erdmann, B., Cotsarelis, G., and Birchmeier, W. (2001). beta-Catenin controls hair follicle morphogenesis and stem cell differentiation in the skin. Cell 105, 533-545. Hwang, M., Kalinin, A., and Morasso, M. I. (2005). The temporal and spatial expression of the novel Ca++-binding proteins, Scarf and Scarf2, during development and epidermal differentiation. Gene Expr Patterns 5, 801-808. Hwang, M., and Morasso, M. I. (2003). The novel murine Ca2+-binding protein, Scarf, is differentially expressed during epidermal differentiation. J Biol Chem 278, 47827- 47833. Igarashi, S., Takizawa, T., Takizawa, T., Yasuda, Y., Uchiwa, H., Hayashi, S., Brysk, H., Robinson, J. M., Yamamoto, K., Brysk, M. M., and Horikoshi, T. (2004). Cathepsin D, but not cathepsin E, degrades desmosomes during epidermal desquamation. Br J Dermatol 151, 355-361. Iizuka, H., Takahashi, H., Honma, M., and Ishida-Yamamoto, A. (2004). Unique keratinization process in psoriasis: late differentiation markers are abolished because of the premature cell death. J Dermatol 31, 271-276. Ikenouchi, J., Furuse, M., Furuse, K., Sasaki, H., Tsukita, S., and Tsukita, S. (2005). Tricellulin constitutes a novel barrier at tricellular contacts of epithelial cells. J Cell Biol 171, 939-945.

267 Bibliographie

Ishida-Yamamoto, A. (2003). Loricrin keratoderma: a novel disease entity characterized by nuclear accumulation of mutant loricrin. J Dermatol Sci 31, 3-8. Ishida-Yamamoto, A., McGrath, J. A., Lam, H., Iizuka, H., Friedman, R. A., and Christiano, A. M. (1997). The molecular pathology of progressive symmetric erythrokeratoderma: a frameshift mutation in the loricrin gene and perturbations in the cornified cell envelope. Am J Hum Genet 61, 581-589. Ishida-Yamamoto, A., Simon, M., Kishibe, M., Miyauchi, Y., Takahashi, H., Yoshida, S., O'Brien, T. J., Serre, G., and Iizuka, H. (2004). Epidermal lamellar granules transport different cargoes as distinct aggregates. J Invest Dermatol 122, 1137-1144. Jackson, B., Tilli, C. L., Hardman, M., Avilion, A., Macleod, M., Ashcroft, G., and Byrne, C. (2005). Late cornified envelope family in differentiating epithelia--response to calcium and ultraviolet irradiation. J Invest Dermatol 124, 1062-1070. Jamora, C., and Fuchs, E. (2002). Intercellular adhesion, signalling and the cytoskeleton. Nat Cell Biol 4, E101-108. Janecke, A. R., Hennies, H. C., Gunther, B., Gansl, G., Smolle, J., Messmer, E. M., Utermann, G., and Rittinger, O. (2005). GJB2 mutations in keratitis-ichthyosis-deafness syndrome including its fatal form. Am J Med Genet A 133, 128-131. Janes, S. M., Ofstad, T. A., Campbell, D. H., Watt, F. M., and Prowse, D. M. (2004). Transient activation of FOXN1 in keratinocytes induces a transcriptional programme that promotes terminal differentiation: contrasting roles of FOXN1 and Akt. J Cell Sci 117, 4157-4168. Jang, S. I., and Steinert, P. M. (2002). Loricrin expression in cultured human keratinocytes is controlled by a complex interplay between transcription factors of the Sp1, CREB, AP1, and AP2 families. J Biol Chem 277, 42268-42279. Jansen, B. J., van Ruissen, F., de Jongh, G., Zeeuwen, P. L., and Schalkwijk, J. (2001). Serial analysis of gene expression in differentiated cultures of human epidermal keratinocytes. J Invest Dermatol 116, 12-22. Jaubert, J., Cheng, J., and Segre, J. A. (2003). Ectopic expression of kruppel like factor 4 (Klf4) accelerates formation of the epidermal permeability barrier. Development 130, 2767-2777. Ji, Y., Lalli, M. J., Babu, G. J., Xu, Y., Kirkpatrick, D. L., Liu, L. H., Chiamvimonvat, N., Walsh, R. A., Shull, G. E., and Periasamy, M. (2000). Disruption of a single copy of the SERCA2 gene results in altered Ca2+ homeostasis and cardiomyocyte function. J Biol Chem 275, 38073-38080. Jia, H. P., Schutte, B. C., Schudy, A., Linzmeier, R., Guthmiller, J. M., Johnson, G. K., Tack, B. F., Mitros, J. P., Rosenthal, A., Ganz, T., and McCray, P. B., Jr. (2001). Discovery of new human beta-defensins using a genomics-based approach. Gene 263, 211-218. Jinquan, T., Vorum, H., Larsen, C. G., Madsen, P., Rasmussen, H. H., Gesser, B., Etzerodt, M., Honore, B., Celis, J. E., and Thestrup-Pedersen, K. (1996). Psoriasin: a novel chemotactic protein. J Invest Dermatol 107, 5-10. Jonca, N., Guerrin, M., Hadjiolova, K., Caubet, C., Gallinaro, H., Simon, M., and Serre, G. (2002). Corneodesmosin, a component of epidermal corneocyte desmosomes, displays homophilic adhesive properties. J Biol Chem 277, 5024-5029. Jonkman, M. F., Pasmooij, A. M., Pasmans, S. G., van den Berg, M. P., Ter Horst, H. J., Timmer, A., and Pas, H. H. (2005). Loss of desmoplakin tail causes lethal acantholytic epidermolysis bullosa. Am J Hum Genet 77, 653-660. Kalinin, A. E., Idler, W. W., Marekov, L. N., McPhie, P., Bowers, B., Steinert, P. M., and Steven, A. C. (2004). Co-assembly of envoplakin and periplakin into oligomers and Ca(2+)-dependent vesicle binding: implications for cornified cell envelope formation in stratified squamous epithelia. J Biol Chem 279, 22773-22780.

268 Bibliographie

Kaminski, W. E., Piehler, A., and Wenzel, J. J. (2006). ABC A-subfamily transporters: structure, function and disease. Biochim Biophys Acta 1762, 510-524. Kane, M. D., Jatkoe, T. A., Stumpf, C. R., Lu, J., Thomas, J. D., and Madore, S. J. (2000). Assessment of the sensitivity and specificity of oligonucleotide (50mer) microarrays. Nucleic Acids Res 28, 4552-4557. Katoh, M., and Katoh, M. (2003). CLDN23 gene, frequently down-regulated in intestinal-type gastric cancer, is a novel member of CLAUDIN gene family. Int J Mol Med 11, 683- 689. Kazerounian, S., and Aho, S. (2003). Characterization of periphilin, a widespread, highly insoluble nuclear protein and potential constituent of the keratinocyte cornified envelope. J Biol Chem 278, 36707-36717. Kazerounian, S., Uitto, J., and Aho, S. (2002). Unique role for the periplakin tail in intermediate filament association: specific binding to keratin 8 and vimentin. Exp Dermatol 11, 428-438. Kelsell, D. P., Norgett, E. E., Unsworth, H., Teh, M. T., Cullup, T., Mein, C. A., Dopping- Hepenstal, P. J., Dale, B. A., Tadini, G., Fleckman, P., et al. (2005). Mutations in ABCA12 underlie the severe congenital skin disease harlequin ichthyosis. Am J Hum Genet 76, 794-803. Kent, W. J. (2002). BLAT--the BLAST-like alignment tool. Genome Res 12, 656-664. Kent, W. J., Sugnet, C. W., Furey, T. S., Roskin, K. M., Pringle, T. H., Zahler, A. M., and Haussler, D. (2002). The human genome browser at UCSC. Genome Res 12, 996-1006. Kitamura, K., Kangawa, K., Kawamoto, M., Ichiki, Y., Nakamura, S., Matsuo, H., and Eto, T. (1993). Adrenomedullin: a novel hypotensive peptide isolated from human pheochromocytoma. Biochem Biophys Res Commun 192, 553-560. Kljuic, A., Bazzi, H., Sundberg, J. P., Martinez-Mir, A., O'Shaughnessy, R., Mahoney, M. G., Levy, M., Montagutelli, X., Ahmad, W., Aita, V. M., et al. (2003). Desmoglein 4 in hair follicle differentiation and epidermal adhesion: evidence from inherited hypotrichosis and acquired pemphigus vulgaris. Cell 113, 249-260. Koch, P. J., de Viragh, P. A., Scharer, E., Bundman, D., Longley, M. A., Bickenbach, J., Kawachi, Y., Suga, Y., Zhou, Z., Huber, M., et al. (2000). Lessons from loricrin- deficient mice: compensatory mechanisms maintaining skin barrier function in the absence of a major cornified envelope protein. J Cell Biol 151, 389-400. Koch, P. J., Mahoney, M. G., Ishikawa, H., Pulkkinen, L., Uitto, J., Shultz, L., Murphy, G. F., Whitaker-Menezes, D., and Stanley, J. R. (1997). Targeted disruption of the pemphigus vulgaris antigen (desmoglein 3) gene in mice causes loss of keratinocyte cell adhesion with a phenotype similar to pemphigus vulgaris. J Cell Biol 137, 1091-1102. Kohler, K., and Zahraoui, A. (2005). Tight junction: a co-ordinator of cell signalling and membrane trafficking. Biol Cell 97, 659-665. Kolter, T., and Sandhoff, K. (2005). Principles of lysosomal membrane digestion: stimulation of sphingolipid degradation by sphingolipid activator proteins and anionic lysosomal lipids. Annu Rev Cell Dev Biol 21, 81-103. Kong, W., Longaker, M. T., and Lorenz, H. P. (2003). Molecular cloning and expression of keratinocyte proline-rich protein, a novel squamous epithelial marker isolated during skin development. J Biol Chem 278, 22781-22786. Koria, P., and Andreadis, S. T. (2006). Epidermal Morphogenesis: The Transcriptional Program of Human Keratinocytes during Stratification. J Invest Dermatol. Koster, M. I., Kim, S., Mills, A. A., DeMayo, F. J., and Roop, D. R. (2004). p63 is the molecular switch for initiation of an epithelial stratification program. Genes Dev 18, 126-131.

269 Bibliographie

Kottke, M. D., Delva, E., and Kowalczyk, A. P. (2006). The desmosome: cell science lessons from human diseases. J Cell Sci 119, 797-806. Krajewski, S., Krajewska, M., and Reed, J. C. (1996). Immunohistochemical analysis of in vivo patterns of Bak expression, a proapoptotic member of the Bcl-2 protein family. Cancer Res 56, 2849-2855. Krajewski, S., Krajewska, M., Shabaik, A., Miyashita, T., Wang, H. G., and Reed, J. C. (1994). Immunohistochemical determination of in vivo distribution of Bax, a dominant inhibitor of Bcl-2. Am J Pathol 145, 1323-1336. Kumar, S., McDonnell, P. C., Lehr, R., Tierney, L., Tzimas, M. N., Griswold, D. E., Capper, E. A., Tal-Singer, R., Wells, G. I., Doyle, M. L., and Young, P. R. (2000). Identification and initial characterization of four novel members of the interleukin-1 family. J Biol Chem 275, 10308-10314. Kuramoto, N., Takizawa, T., Takizawa, T., Matsuki, M., Morioka, H., Robinson, J. M., and Yamanishi, K. (2002). Development of ichthyosiform skin compensates for defective permeability barrier function in mice lacking transglutaminase 1. J Clin Invest 109, 243- 250. Kurimoto, K., Yabuta, Y., Ohinata, Y., Ono, Y., Uno, K. D., Yamada, R. G., Ueda, H. R., and Saitou, M. (2006). An improved single-cell cDNA amplification method for efficient high-density oligonucleotide microarray analysis. Nucleic Acids Res 34, e42. Kwiatkowski, D. J., Mehl, R., and Yin, H. L. (1988). Genomic organization and biosynthesis of secreted and cytoplasmic forms of gelsolin. J Cell Biol 106, 375-384. Kyte, J., and Doolittle, R. F. (1982). A simple method for displaying the hydropathic character of a protein. J Mol Biol 157, 105-132. LaMarre, J., Wollenberg, G. K., Gonias, S. L., and Hayes, M. A. (1991). Cytokine binding and clearance properties of proteinase-activated alpha 2-macroglobulins. Lab Invest 65, 3-14. Lampe, M. A., Burlingame, A. L., Whitney, J., Williams, M. L., Brown, B. E., Roitman, E., and Elias, P. M. (1983). Human stratum corneum lipids: characterization and regional variations. J Lipid Res 24, 120-130. Lander, E. S., Linton, L. M., Birren, B., Nusbaum, C., Zody, M. C., Baldwin, J., Devon, K., Dewar, K., Doyle, M., FitzHugh, W., et al. (2001). Initial sequencing and analysis of the human genome. Nature 409, 860-921. Langbein, L., Heid, H. W., Moll, I., and Franke, W. W. (1993). Molecular characterization of the body site-specific human epidermal cytokeratin 9: cDNA cloning, amino acid sequence, and tissue specificity of gene expression. Differentiation 55, 57-71. LaPres, J. J., and Hudson, L. G. (1996). Identification of a functional determinant of differentiation-dependent expression in the involucrin gene. J Biol Chem 271, 23154- 23160. Lee, C., and Wang, Q. (2005). Bioinformatics analysis of alternative splicing. Brief Bioinform 6, 23-33. Lee, E. Y., Chang, C. Y., Hu, N., Wang, Y. C., Lai, C. C., Herrup, K., Lee, W. H., and Bradley, A. (1992). Mice deficient for Rb are nonviable and show defects in neurogenesis and haematopoiesis. Nature 359, 288-294. Lee, W. H., Jang, S., Lee, J. S., Lee, Y., Seo, E. Y., You, K. H., Lee, S. C., Nam, K. I., Kim, J. M., Kee, S. H., et al. (2005). Molecular cloning and expression of human keratinocyte proline-rich protein (hKPRP), an epidermal marker isolated from calcium-induced differentiating keratinocytes. J Invest Dermatol 125, 995-1000. Leerkes, M. R., Caballero, O. L., Mackay, A., Torloni, H., O'Hare, M. J., Simpson, A. J., and de Souza, S. J. (2002). In silico comparison of the transcriptome derived from purified

270 Bibliographie

normal breast cells and breast tumor cell lines reveals candidate upregulated genes in breast tumor cells. Genomics 79, 257-265. Lefevre, C., Audebert, S., Jobard, F., Bouadjar, B., Lakhdar, H., Boughdene-Stambouli, O., Blanchet-Bardon, C., Heilig, R., Foglio, M., Weissenbach, J., et al. (2003). Mutations in the transporter ABCA12 are associated with lamellar ichthyosis type 2. Hum Mol Genet 12, 2369-2378. Lessin, S. R., Huebner, K., Isobe, M., Croce, C. M., and Steinert, P. M. (1988). Chromosomal mapping of human keratin genes: evidence of non-linkage. J Invest Dermatol 91, 572- 578. Levy-Nissenbaum, E., Betz, R. C., Frydman, M., Simon, M., Lahat, H., Bakhan, T., Goldman, B., Bygum, A., Pierick, M., Hillmer, A. M., et al. (2003). Hypotrichosis simplex of the scalp is associated with nonsense mutations in CDSN encoding corneodesmosin. Nat Genet 34, 151-153. Levy, L., Broad, S., Diekmann, D., Evans, R. D., and Watt, F. M. (2000). beta1 integrins regulate keratinocyte adhesion and differentiation by distinct mechanisms. Mol Biol Cell 11, 453-466. Levy, V., Lindon, C., Harfe, B. D., and Morgan, B. A. (2005). Distinct stem cell populations regenerate the follicle and interfollicular epidermis. Dev Cell 9, 855-861. Li, A., Pouliot, N., Redvers, R., and Kaur, P. (2004). Extensive tissue-regenerative capacity of neonatal human keratinocyte stem cells and their progeny. J Clin Invest 113, 390-400. Li, A., Simmons, P. J., and Kaur, P. (1998). Identification and isolation of candidate human keratinocyte stem cells based on cell surface phenotype. Proc Natl Acad Sci U S A 95, 3902-3907. Li, Q., Lu, Q., Estepa, G., and Verma, I. M. (2005). Identification of 14-3-3sigma mutation causing cutaneous abnormality in repeated-epilation mutant mouse. Proc Natl Acad Sci U S A 102, 15977-15982. Liang, F., Holt, I., Pertea, G., Karamycheva, S., Salzberg, S. L., and Quackenbush, J. (2000). Gene index analysis of the human genome estimates approximately 120,000 genes. Nat Genet 25, 239-240. Liang, P., Averboukh, L., and Pardee, A. B. (1993). Distribution and cloning of eukaryotic mRNAs by means of differential display: refinements and optimization. Nucleic Acids Res 21, 3269-3275. Liang, P., and Pardee, A. B. (1992). Differential display of eukaryotic messenger RNA by means of the polymerase chain reaction. Science 257, 967-971. Lin, J. C., Wang, W. Y., Chen, K. Y., Wei, Y. H., Liang, W. M., Jan, J. S., and Jiang, R. S. (2004). Quantification of plasma Epstein-Barr virus DNA in patients with advanced nasopharyngeal carcinoma. N Engl J Med 350, 2461-2470. Lioumi, M., Ferguson, C. A., Sharpe, P. T., Freeman, T., Marenholz, I., Mischke, D., Heizmann, C., and Ragoussis, J. (1999). Isolation and characterization of human and mouse ZIRTL, a member of the IRT1 family of transporters, mapping within the epidermal differentiation complex. Genomics 62, 272-280. Lippens, S., Denecker, G., Ovaere, P., Vandenabeele, P., and Declercq, W. (2005). Death penalty for keratinocytes: apoptosis versus cornification. Cell Death Differ 12 Suppl 2, 1497-1508. Lippens, S., Kockx, M., Knaapen, M., Mortier, L., Polakowska, R., Verheyen, A., Garmyn, M., Zwijsen, A., Formstecher, P., Huylebroeck, D., et al. (2000). Epidermal differentiation does not involve the pro-apoptotic executioner caspases, but is associated with caspase-14 induction and processing. Cell Death Differ 7, 1218-1224.

271 Bibliographie

Liu, C., Xu, Z., Gupta, D., and Dziarski, R. (2001a). Peptidoglycan recognition proteins: a novel family of four human innate immunity pattern recognition molecules. J Biol Chem 276, 34686-34694. Liu, L., Roberts, A. A., and Ganz, T. (2003). By IL-1 signaling, monocyte-derived cells dramatically enhance the epidermal antimicrobial response to lipopolysaccharide. J Immunol 170, 575-580. Liu, L. H., Boivin, G. P., Prasad, V., Periasamy, M., and Shull, G. E. (2001b). Squamous cell tumors in mice heterozygous for a null allele of Atp2a2, encoding the sarco(endo)plasmic reticulum Ca2+-ATPase isoform 2 Ca2+ pump. J Biol Chem 276, 26737-26740. Liu, Z., Yang, X., Tan, F., Cullion, K., and Thiele, C. J. (2006). Molecular cloning and characterization of human Castor, a novel human gene upregulated during cell differentiation. Biochem Biophys Res Commun 344, 834-844. Livak, K. J., and Schmittgen, T. D. (2001). Analysis of relative gene expression data using real-time quantitative PCR and the 2(-Delta Delta C(T)) Method. Methods 25, 402-408. Lockhart, D. J., and Winzeler, E. A. (2000). Genomics, gene expression and DNA arrays. Nature 405, 827-836. Lodygin, D., and Hermeking, H. (2005). The role of epigenetic inactivation of 14-3-3sigma in human cancer. Cell Res 15, 237-246. Lu, S., Saydak, M., Gentile, V., Stein, J. P., and Davies, P. J. (1995). Isolation and characterization of the human tissue transglutaminase gene promoter. J Biol Chem 270, 9748-9756. Lu, X., Wang, M., Qi, J., Wang, H., Li, X., Gupta, D., and Dziarski, R. (2005). Peptidoglycan recognition proteins are a new class of human bactericidal proteins. J Biol Chem. Lyle, S., Christofidou-Solomidou, M., Liu, Y., Elder, D. E., Albelda, S., and Cotsarelis, G. (1998). The C8/144B monoclonal antibody recognizes cytokeratin 15 and defines the location of human hair follicle stem cells. J Cell Sci 111 ( Pt 21), 3179-3188. Ma, T., Hara, M., Sougrat, R., Verbavatz, J. M., and Verkman, A. S. (2002). Impaired stratum corneum hydration in mice lacking epidermal water channel aquaporin-3. J Biol Chem 277, 17147-17153. Madison, K. C., Sando, G. N., Howard, E. J., True, C. A., Gilbert, D., Swartzendruber, D. C., and Wertz, P. W. (1998). Lamellar granule biogenesis: a role for ceramide glucosyltransferase, lysosomal enzyme transport, and the Golgi. J Investig Dermatol Symp Proc 3, 80-86. Maestrini, E., Korge, B. P., Ocana-Sierra, J., Calzolari, E., Cambiaghi, S., Scudder, P. M., Hovnanian, A., Monaco, A. P., and Munro, C. S. (1999). A missense mutation in connexin26, D66H, causes mutilating keratoderma with sensorineural deafness (Vohwinkel's syndrome) in three unrelated families. Hum Mol Genet 8, 1237-1243. Maestrini, E., Monaco, A. P., McGrath, J. A., Ishida-Yamamoto, A., Camisa, C., Hovnanian, A., Weeks, D. E., Lathrop, M., Uitto, J., and Christiano, A. M. (1996). A molecular defect in loricrin, the major component of the cornified cell envelope, underlies Vohwinkel's syndrome. Nat Genet 13, 70-77. Magnaldo, T., Fowlis, D., and Darmon, M. (1998). Galectin-7, a marker of all types of stratified epithelia. Differentiation 63, 159-168. Makino, T., Takaishi, M., Morohashi, M., and Huh, N. H. (2001). Hornerin, a novel profilaggrin-like protein and differentiation-specific marker isolated from mouse skin. J Biol Chem 276, 47445-47452. Malminen, M., Koivukangas, V., Peltonen, J., Karvonen, S. L., Oikarinen, A., and Peltonen, S. (2003). Immunohistological distribution of the tight junction components ZO-1 and occludin in regenerating human epidermis. Br J Dermatol 149, 255-260.

272 Bibliographie

Mao-Qiang, M., Feingold, K. R., Jain, M., and Elias, P. M. (1995). Extracellular processing of phospholipids is required for permeability barrier homeostasis. J Lipid Res 36, 1925- 1935. Marchler-Bauer, A., and Bryant, S. H. (2004). CD-Search: protein domain annotations on the fly. Nucleic Acids Res 32, W327-331. Marekov, L. N., and Steinert, P. M. (1998). Ceramides are bound to structural proteins of the human foreskin epidermal cornified cell envelope. J Biol Chem 273, 17763-17770. Marenholz, I., and Heizmann, C. W. (2004). S100A16, a ubiquitously expressed EF-hand protein which is up-regulated in tumors. Biochem Biophys Res Commun 313, 237-244. Marenholz, I., Zirra, M., Fischer, D. F., Backendorf, C., Ziegler, A., and Mischke, D. (2001). Identification of human epidermal differentiation complex (EDC)-encoded genes by subtractive hybridization of entire YACs to a gridded keratinocyte cDNA library. Genome Res 11, 341-355. Margulies, E. H., Kardia, S. L., and Innis, J. W. (2001). Identification and prevention of a GC content bias in SAGE libraries. Nucleic Acids Res 29, E60-60. Marshall, D., Hardman, M. J., Nield, K. M., and Byrne, C. (2001). Differentially expressed late constituents of the epidermal cornified envelope. Proc Natl Acad Sci U S A 98, 13031-13036. Mass, P., Hoffmann, K., Gambichler, T., Altmeyer, P., and Mannherz, H. G. (2003). Premature keratinocyte death and expression of marker proteins of apoptosis in human skin after UVB exposure. Arch Dermatol Res 295, 71-79. Matsui, T., Hayashi-Kisumi, F., Kinoshita, Y., Katahira, S., Morita, K., Miyachi, Y., Ono, Y., Imai, T., Tanigawa, Y., Komiya, T., and Tsukita, S. (2004). Identification of novel keratinocyte-secreted peptides dermokine-alpha/-beta and a new stratified epithelium- secreted protein gene complex on human chromosome 19q13.1. Genomics 84, 384-397. Matsuki, M., Yamashita, F., Ishida-Yamamoto, A., Yamada, K., Kinoshita, C., Fushiki, S., Ueda, E., Morishima, Y., Tabata, K., Yasuno, H., et al. (1998). Defective stratum corneum and early neonatal death in mice lacking the gene for transglutaminase 1 (keratinocyte transglutaminase). Proc Natl Acad Sci U S A 95, 1044-1049. Matsumura, H., Reich, S., Ito, A., Saitoh, H., Kamoun, S., Winter, P., Kahl, G., Reuter, M., Kruger, D. H., and Terauchi, R. (2003). Gene expression analysis of plant host-pathogen interactions by SuperSAGE. Proc Natl Acad Sci U S A 100, 15718-15723. Maytin, E. V., Lin, J. C., Krishnamurthy, R., Batchvarova, N., Ron, D., Mitchell, P. J., and Habener, J. F. (1999). Keratin 10 gene expression during differentiation of mouse epidermis requires transcription factors C/EBP and AP-2. Dev Biol 216, 164-181. McCall, C. A., and Cohen, J. J. (1991). Programmed cell death in terminally differentiating keratinocytes: role of endogenous endonuclease. J Invest Dermatol 97, 111-114. McKinley-Grant, L. J., Idler, W. W., Bernstein, I. A., Parry, D. A., Cannizzaro, L., Croce, C. M., Huebner, K., Lessin, S. R., and Steinert, P. M. (1989). Characterization of a cDNA clone encoding human filaggrin and localization of the gene to chromosome region 1q21. Proc Natl Acad Sci U S A 86, 4848-4852. Meade, J. L., de Wynter, E. A., Brett, P., Sharif, S. M., Woods, C. G., Markham, A. F., and Cook, G. P. (2006). A family with Papillon-Lefevre syndrome reveals a requirement for cathepsin C in granzyme B activation and NK cell cytolytic activity. Blood 107, 3665- 3668. Mehic, D., Bakiri, L., Ghannadan, M., Wagner, E. F., and Tschachler, E. (2005). Fos and jun proteins are specifically expressed during differentiation of human keratinocytes. J Invest Dermatol 124, 212-220.

273 Bibliographie

Mehrel, T., Hohl, D., Rothnagel, J. A., Longley, M. A., Bundman, D., Cheng, C., Lichti, U., Bisher, M. E., Steven, A. C., Steinert, P. M., and et al. (1990). Identification of a major keratinocyte cell envelope protein, loricrin. Cell 61, 1103-1112. Mehul, B., Asselineau, D., Bernard, D., Leclaire, J., Regnier, M., Schmidt, R., and Bernerd, F. (2004). Gene expression profiles of three different models of reconstructed human epidermis and classical cultures of keratinocytes using cDNA arrays. Arch Dermatol Res. Menon, G. K., Elias, P. M., Lee, S. H., and Feingold, K. R. (1992). Localization of calcium in murine epidermis following disruption and repair of the permeability barrier. Cell Tissue Res 270, 503-512. Mischke, D., Korge, B. P., Marenholz, I., Volz, A., and Ziegler, A. (1996). Genes encoding structural proteins of epidermal cornification and S100 calcium-binding proteins form a gene complex ("epidermal differentiation complex") on human chromosome 1q21. J Invest Dermatol 106, 989-992. Miyata, T., Inagi, R., Nangaku, M., Imasawa, T., Sato, M., Izuhara, Y., Suzuki, D., Yoshino, A., Onogi, H., Kimura, M., et al. (2002). Overexpression of the serpin megsin induces progressive mesangial cell proliferation and expansion. J Clin Invest 109, 585-593. Moffatt, P., Salois, P., Gaumond, M. H., St-Amant, N., Godin, E., and Lanctot, C. (2002). Engineered viruses to select genes encoding secreted and membrane-bound proteins in mammalian cells. Nucleic Acids Res 30, 4285-4294. Moffatt, P., Salois, P., St-Amant, N., Gaumond, M. H., and Lanctot, C. (2004). Identification of a conserved cluster of skin-specific genes encoding secreted proteins. Gene 334, 123- 131. Morasso, M. I., Grinberg, A., Robinson, G., Sargent, T. D., and Mahon, K. A. (1999). Placental failure in mice lacking the homeobox gene Dlx3. Proc Natl Acad Sci U S A 96, 162-167. Morasso, M. I., Markova, N. G., and Sargent, T. D. (1996). Regulation of epidermal differentiation by a Distal-less homeodomain gene. J Cell Biol 135, 1879-1887. Morrison, T. B., Weis, J. J., and Wittwer, C. T. (1998). Quantification of low-copy transcripts by continuous SYBR Green I monitoring during amplification. Biotechniques 24, 954- 958, 960, 962. Most, P., Bernotat, J., Ehlermann, P., Pleger, S. T., Reppel, M., Borries, M., Niroomand, F., Pieske, B., Janssen, P. M., Eschenhagen, T., et al. (2001). S100A1: a regulator of myocardial contractility. Proc Natl Acad Sci U S A 98, 13889-13894. Muller, F. B., Muller-Rover, S., Korge, B. P., Kapas, S., Hinson, J. P., and Philpott, M. P. (2003). Adrenomedullin: expression and possible role in human skin and hair growth. Br J Dermatol 148, 30-38. Nayernia, K., Adham, I. M., Burkhardt-Gottges, E., Neesen, J., Rieche, M., Wolf, S., Sancken, U., Kleene, K., and Engel, W. (2002). Asthenozoospermia in mice with targeted deletion of the sperm mitochondrion-associated cysteine-rich protein (Smcp) gene. Mol Cell Biol 22, 3046-3052. Nemes, Z., Marekov, L. N., Fesus, L., and Steinert, P. M. (1999). A novel function for transglutaminase 1: attachment of long-chain omega-hydroxyceramides to involucrin by ester bond formation. Proc Natl Acad Sci U S A 96, 8402-8407. Neto, E. D., Harrop, R., Correa-Oliveira, R., Wilson, R. A., Pena, S. D., and Simpson, A. J. (1997). Minilibraries constructed from cDNA generated by arbitrarily primed RT-PCR: an alternative to normalized libraries for the generation of ESTs from nanogram quantities of mRNA. Gene 186, 135-142.

274 Bibliographie

Niyonsaba, F., Ushio, H., Nagaoka, I., Okumura, K., and Ogawa, H. (2005). The human beta- defensins (-1, -2, -3, -4) and cathelicidin LL-37 induce IL-18 secretion through p38 and ERK MAPK activation in primary human keratinocytes. J Immunol 175, 1776-1784. Nizet, V., Ohtake, T., Lauth, X., Trowbridge, J., Rudisill, J., Dorschner, R. A., Pestonjamasp, V., Piraino, J., Huttner, K., and Gallo, R. L. (2001). Innate antimicrobial peptide protects the skin from invasive bacterial infection. Nature 414, 454-457. Norlen, L. (2001). Skin barrier formation: the membrane folding model. J Invest Dermatol 117, 823-829. Nunes, F. M., Valente, V., Sousa, J. F., Cunha, M. A., Pinheiro, D. G., Maia, R. M., Araujo, D. D., Costa, M. C., Martins, W. K., Carvalho, A. F., et al. (2004). The use of Open Reading frame ESTs (ORESTES) for analysis of the honey bee transcriptome. BMC Genomics 5, 84. Omori, E., Matsumoto, K., Sanjo, H., Sato, S., Akira, S., Smart, R. C., and Ninomiya-Tsuji, J. (2006). TAK1 is a master regulator of epidermal homeostasis involving skin inflammation and apoptosis. J Biol Chem. Oomizu, S., Sahuc, F., Asahina, K., Inamatsu, M., Matsuzaki, T., Sasaki, M., Obara, M., and Yoshizato, K. (2000). Kdap, a novel gene associated with the stratification of the epithelium. Gene 256, 19-27. Oren, A., Ganz, T., Liu, L., and Meerloo, T. (2003). In human epidermis, beta-defensin 2 is packaged in lamellar bodies. Exp Mol Pathol 74, 180-182. Oren, A., Toporik, A., Biton, S., Almogy, N., Eshel, D., Bernstein, J., Savitsky, K., and Rotman, G. (2004). hCHL2, a novel chordin-related gene, displays differential expression and complex alternative splicing in human tissues and during myoblast and osteoblast maturation. Gene 331, 17-31. Oyamada, M., Oyamada, Y., and Takamatsu, T. (2005). Regulation of connexin expression. Biochim Biophys Acta 1719, 6-23. Palmer, C. N., Irvine, A. D., Terron-Kwiatkowski, A., Zhao, Y., Liao, H., Lee, S. P., Goudie, D. R., Sandilands, A., Campbell, L. E., Smith, F. J., et al. (2006). Common loss-of- function variants of the epidermal barrier protein filaggrin are a major predisposing factor for atopic dermatitis. Nat Genet 38, 441-446. Paperna, T., Peoples, R., Wang, Y. K., Kaplan, P., and Francke, U. (1998). Genes for the CPE receptor (CPETR1) and the human homolog of RVP1 (CPETR2) are localized within the Williams-Beuren syndrome deletion. Genomics 54, 453-459. Park, G. T., Lim, S. E., Jang, S. I., and Morasso, M. I. (2002). Suprabasin, a novel epidermal differentiation marker and potential cornified envelope precursor. J Biol Chem 277, 45195-45202. Pascall, J. C., and Brown, K. D. (2004). Intramembrane cleavage of ephrinB3 by the human rhomboid family protease, RHBDL2. Biochem Biophys Res Commun 317, 244-252. Peixoto, A., Monteiro, M., Rocha, B., and Veiga-Fernandes, H. (2004). Quantification of multiple gene expression in individual cells. Genome Res 14, 1938-1947. Pellegrini, G., Dellambra, E., Golisano, O., Martinelli, E., Fantozzi, I., Bondanza, S., Ponzin, D., McKeon, F., and De Luca, M. (2001). p63 identifies keratinocyte stem cells. Proc Natl Acad Sci U S A 98, 3156-3161. Pena, J. C., Fuchs, E., and Thompson, C. B. (1997). Bcl-x expression influences keratinocyte cell survival but not terminal differentiation. Cell Growth Differ 8, 619-629. Pennisi, E. (2003). Human genome. A low number wins the GeneSweep Pool. Science 300, 1484. Perera, R. J., Koo, S., Bennett, C. F., Dean, N. M., Gupta, N., Qin, J. Z., and Nickoloff, B. J. (2006). Defining the transcriptome of accelerated and replicatively senescent

275 Bibliographie

keratinocytes reveals links to differentiation, interferon signaling, and Notch related pathways. J Cell Biochem 98, 394-408. Pesole, G., Liuni, S., Grillo, G., Ippedico, M., Larizza, A., Makalowski, W., and Saccone, C. (1999). UTRdb: a specialized database of 5' and 3' untranslated regions of eukaryotic mRNAs. Nucleic Acids Res 27, 188-191. Pillai, S., Bikle, D. D., Mancianti, M. L., Cline, P., and Hincenbergs, M. (1990). Calcium regulation of growth and differentiation of normal human keratinocytes: modulation of differentiation competence by stages of growth and extracellular calcium. J Cell Physiol 143, 294-302. Platteborze, P. L. (2003). Effects of sulfur mustard on transcription in human epidermal keratinocytes: analysis by mRNA differential display. J Appl Toxicol 23, 249-254. Potten, C. S., and Morris, R. J. (1988). Epithelial stem cells in vivo. J Cell Sci Suppl 10, 45- 62. Presland, R. B., Haydock, P. V., Fleckman, P., Nirunsuksiri, W., and Dale, B. A. (1992). Characterization of the human epidermal profilaggrin gene. Genomic organization and identification of an S-100-like calcium binding domain at the amino terminus. J Biol Chem 267, 23772-23781. Pummi, K., Malminen, M., Aho, H., Karvonen, S. L., Peltonen, J., and Peltonen, S. (2001). Epidermal tight junctions: ZO-1 and occludin are expressed in mature, developing, and affected skin and in vitro differentiating keratinocytes. J Invest Dermatol 117, 1050- 1058. Qin, J. Z., Chaturvedi, V., Denning, M. F., Bacon, P., Panella, J., Choubey, D., and Nickoloff, B. J. (2002). Regulation of apoptosis by p53 in UV-irradiated human epidermis, psoriatic plaques and senescent keratinocytes. Oncogene 21, 2991-3002. Radoja, N., Gazel, A., Banno, T., Yano, S., and Blumenberg, M. (2006). Transcriptional Profiling of Epidermal Differentiation. Physiol Genomics. Rahman, P., Sun, S., Peddle, L., Snelgrove, T., Melay, W., Greenwood, C., and Gladman, D. (2006). Association between the interleukin-1 family gene cluster and psoriatic arthritis. Arthritis Rheum 54, 2321-2325. Rambaldi, A., Carlotti, E., Oldani, E., Della Starza, I., Baccarani, M., Cortelazzo, S., Lauria, F., Arcaini, L., Morra, E., Pulsoni, A., et al. (2005). Quantitative PCR of bone marrow BCL2/IgH positive cells at diagnosis predicts treatment response and long-term outcome in Follicular non Hodgkin's Lymphoma. Blood. Reymond, A., Marigo, V., Yaylaoglu, M. B., Leoni, A., Ucla, C., Scamuffa, N., Caccioppoli, C., Dermitzakis, E. T., Lyle, R., Banfi, S., et al. (2002). Human chromosome 21 gene expression atlas in the mouse. Nature 420, 582-586. Ribe, A., and McNutt, N. S. (2003). S100A protein expression in the distinction between lentigo maligna and pigmented actinic keratosis. Am J Dermatopathol 25, 93-99. Rice, R. H., and Green, H. (1977). The cornified envelope of terminally differentiated human epidermal keratinocytes consists of cross-linked protein. Cell 11, 417-422. Richard, G., Smith, L. E., Bailey, R. A., Itin, P., Hohl, D., Epstein, E. H., Jr., DiGiovanna, J. J., Compton, J. G., and Bale, S. J. (1998a). Mutations in the human connexin gene GJB3 cause erythrokeratodermia variabilis. Nat Genet 20, 366-369. Richard, G., White, T. W., Smith, L. E., Bailey, R. A., Compton, J. G., Paul, D. L., and Bale, S. J. (1998b). Functional defects of Cx26 resulting from a heterozygous missense mutation in a family with dominant deaf-mutism and palmoplantar keratoderma. Hum Genet 103, 393-399. Roberts, D., and Marks, R. (1980). The determination of regional and age variations in the rate of desquamation: a comparison of four techniques. J Invest Dermatol 74, 13-16.

276 Bibliographie

Robinson, J., Waller, M. J., Parham, P., de Groot, N., Bontrop, R., Kennedy, L. J., Stoehr, P., and Marsh, S. G. (2003). IMGT/HLA and IMGT/MHC: sequence databases for the study of the major histocompatibility complex. Nucleic Acids Res 31, 311-314. Rochat, A., Kobayashi, K., and Barrandon, Y. (1994). Location of stem cells of human hair follicles by clonal analysis. Cell 76, 1063-1073. Roepman, P., Wessels, L. F., Kettelarij, N., Kemmeren, P., Miles, A. J., Lijnzaad, P., Tilanus, M. G., Koole, R., Hordijk, G. J., van der Vliet, P. C., et al. (2005). An expression profile for diagnosis of lymph node metastases from primary head and neck squamous cell carcinomas. Nat Genet 37, 182-186. Rogers, G. E., Harding, H. W., and Llewellyn-Smith, I. J. (1977). The origin of citrulline- containing proteins in the hair follicle and the chemical nature of trichohyalin, an intracellular precursor. Biochim Biophys Acta 495, 159-175. Rost, B., and Liu, J. (2003). The PredictProtein server. Nucleic Acids Res 31, 3300-3304. Rothnagel, J. A., and Rogers, G. E. (1986). Trichohyalin, an intermediate filament-associated protein of the hair follicle. J Cell Biol 102, 1419-1429. Ruhrberg, C., Hajibagheri, M. A., Parry, D. A., and Watt, F. M. (1997). Periplakin, a novel component of cornified envelopes and desmosomes that belongs to the plakin family and forms complexes with envoplakin. J Cell Biol 139, 1835-1849. Ruiz, S., Santos, M., Segrelles, C., Leis, H., Jorcano, J. L., Berns, A., Paramio, J. M., and Vooijs, M. (2004). Unique and overlapping functions of pRb and p107 in the control of proliferation and differentiation in epidermis. Development 131, 2737-2748. Ruiz, S., Segrelles, C., Bravo, A., Santos, M., Perez, P., Leis, H., Jorcano, J. L., and Paramio, J. M. (2003). Abnormal epidermal differentiation and impaired epithelial-mesenchymal tissue interactions in mice lacking the retinoblastoma relatives p107 and p130. Development 130, 2341-2353. Rutledge, R. G., and Cote, C. (2003). Mathematics of quantitative kinetic PCR and the application of standard curves. Nucleic Acids Res 31, e93. Sabag, A. D., Dagan, O., and Avraham, K. B. (2005). Connexins in hearing loss: a comprehensive overview. J Basic Clin Physiol Pharmacol 16, 101-116. Saha, S., Sparks, A. B., Rago, C., Akmaev, V., Wang, C. J., Vogelstein, B., Kinzler, K. W., and Velculescu, V. E. (2002). Using the transcriptome to annotate the genome. Nat Biotechnol 20, 508-512. Sakabe, N. J., de Souza, J. E., Galante, P. A., de Oliveira, P. S., Passetti, F., Brentani, H., Osorio, E. C., Zaiats, A. C., Leerkes, M. R., Kitajima, J. P., et al. (2003). ORESTES are enriched in rare exon usage variants affecting the encoded proteins. C R Biol 326, 979- 985. Sakaguchi, M., Miyazaki, M., Takaishi, M., Sakaguchi, Y., Makino, E., Kataoka, N., Yamada, H., Namba, M., and Huh, N. H. (2003). S100C/A11 is a key mediator of Ca(2+)-induced growth inhibition of human epidermal keratinocytes. J Cell Biol 163, 825-835. Salomon, D., Masgrau, E., Vischer, S., Ullrich, S., Dupont, E., Sappino, P., Saurat, J. H., and Meda, P. (1994). Topography of mammalian connexins in human skin. J Invest Dermatol 103, 240-247. Sato, J., Denda, M., Nakanishi, J., Nomura, J., and Koyama, J. (1998). Cholesterol sulfate inhibits proteases that are involved in desquamation of stratum corneum. J Invest Dermatol 111, 189-193. Sayama, K., Hanakawa, Y., Nagai, H., Shirakata, Y., Dai, X., Hirakawa, S., Tokumaru, S., Tohyama, M., Yang, L., Sato, S., et al. (2006). TAK1 is essential for differentiation and the prevention of apoptosis in epidermis. J Biol Chem.

277 Bibliographie

Schalkwijk, J., Chang, A., Janssen, P., De Jongh, G. J., and Mier, P. D. (1990). Skin-derived antileucoproteases (SKALPs): characterization of two new elastase inhibitors from psoriatic epidermis. Br J Dermatol 122, 631-641. Schena, M., Shalon, D., Davis, R. W., and Brown, P. O. (1995). Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science 270, 467-470. Schmidt, A., Langbein, L., Pratzel, S., Rode, M., Rackwitz, H. R., and Franke, W. W. (1999). Plakophilin 3--a novel cell-type-specific desmosomal plaque protein. Differentiation 64, 291-306. Schweizer, J., Bowden, P. E., Coulombe, P. A., Langbein, L., Lane, E. B., Magin, T. M., Maltais, L., Omary, M. B., Parry, D. A., Rogers, M. A., and Wright, M. W. (2006). New consensus nomenclature for mammalian keratins. J Cell Biol 174, 169-174. Scott, I. R., Harding, C. R., and Barrett, J. G. (1982). Histidine-rich protein of the keratohyalin granules. Source of the free amino acids, urocanic acid and pyrrolidone carboxylic acid in the stratum corneum. Biochim Biophys Acta 719, 110-117. Segre, J. A., Bauer, C., and Fuchs, E. (1999). Klf4 is a transcription factor required for establishing the barrier function of the skin. Nat Genet 22, 356-360. Segre, J. A., Nemhauser, J. L., Taylor, B. A., Nadeau, J. H., and Lander, E. S. (1995). Positional cloning of the nude locus: genetic, physical, and transcription maps of the region and mutations in the mouse and rat. Genomics 28, 549-559. Serre, G., Mils, V., Haftek, M., Vincent, C., Croute, F., Reano, A., Ouhayoun, J. P., Bettinger, S., and Soleilhavoup, J. P. (1991). Identification of late differentiation antigens of human cornified epithelia, expressed in re-organized desmosomes and bound to cross- linked envelope. J Invest Dermatol 97, 1061-1072. Serup, J., and Blichmann, C. (1987). Epidermal hydration of psoriasis plaques and the relation to scaling. Measurement of electrical conductance and transepidermal water loss. Acta Derm Venereol 67, 357-359. Silva, A. P., De Souza, J. E., Galante, P. A., Riggins, G. J., De Souza, S. J., and Camargo, A. A. (2004). The impact of SNPs on the interpretation of SAGE and MPSS experimental data. Nucleic Acids Res 32, 6104-6110. Simon, M., Haftek, M., Sebbag, M., Montezin, M., Girbal-Neuhauser, E., Schmitt, D., and Serre, G. (1996). Evidence that filaggrin is a component of cornified cell envelopes in human plantar epidermis. Biochem J 317 ( Pt 1), 173-177. Simon, M., Jonca, N., Guerrin, M., Haftek, M., Bernard, D., Caubet, C., Egelrud, T., Schmidt, R., and Serre, G. (2001a). Refined characterization of corneodesmosin proteolysis during terminal differentiation of human epidermis and its relationship to desquamation. J Biol Chem 276, 20292-20299. Simon, M., Méchin, M., Nachat, R., and Serre, G. (2001b). Filaggrine et facteur naturel d'hydratation. Keratin 4, 6-10. Simon, M., Phillips, M., and Green, H. (1991). Polymorphism due to variable number of repeats in the human involucrin gene. Genomics 9, 576-580. Simon, M., Phillips, M., Green, H., Stroh, H., Glatt, K., Burns, G., and Latt, S. A. (1989). Absence of a single repeat from the coding region of the human involucrin gene leading to RFLP. Am J Hum Genet 45, 910-916. Simpson, A. J., Maxwell, A. I., Govan, J. R., Haslett, C., and Sallenave, J. M. (1999). Elafin (elastase-specific inhibitor) has anti-microbial activity against gram-positive and gram- negative respiratory pathogens. FEBS Lett 452, 309-313. Smith, F. J., Irvine, A. D., Terron-Kwiatkowski, A., Sandilands, A., Campbell, L. E., Zhao, Y., Liao, H., Evans, A. T., Goudie, D. R., Lewis-Jones, S., et al. (2006). Loss-of- function mutations in the gene encoding filaggrin cause ichthyosis vulgaris. Nat Genet 38, 337-342.

278 Bibliographie

Smits, P., Ni, J., Feng, P., Wauters, J., Van Hul, W., Boutaibi, M. E., Dillon, P. J., and Merregaert, J. (1997). The human extracellular matrix gene 1 (ECM1): genomic structure, cDNA cloning, expression pattern, and chromosomal localization. Genomics 45, 487-495. Sorensen, O. E., Thapa, D. R., Rosenthal, A., Liu, L., Roberts, A. A., and Ganz, T. (2005). Differential regulation of beta-defensin expression in human skin by microbial stimuli. J Immunol 174, 4870-4879. Spazierer, D., Fuchs, P., Reipert, S., Fischer, I., Schmuth, M., Lassmann, H., and Wiche, G. (2006). Epiplakin is dispensable for skin barrier function and for integrity of keratin network cytoarchitecture in simple and stratified epithelia. Mol Cell Biol 26, 559-568. Steinert, P. M., Cantieri, J. S., Teller, D. C., Lonsdale-Eccles, J. D., and Dale, B. A. (1981). Characterization of a class of cationic proteins that specifically interact with intermediate filaments. Proc Natl Acad Sci U S A 78, 4097-4101. Steinert, P. M., Kim, S. Y., Chung, S. I., and Marekov, L. N. (1996). The transglutaminase 1 enzyme is variably acylated by myristate and palmitate during differentiation in epidermal keratinocytes. J Biol Chem 271, 26242-26250. Steinert, P. M., Mack, J. W., Korge, B. P., Gan, S. Q., Haynes, S. R., and Steven, A. C. (1991). Glycine loops in proteins: their occurrence in certain intermediate filament chains, loricrins and single-stranded RNA binding proteins. Int J Biol Macromol 13, 130-139. Steinert, P. M., and Marekov, L. N. (1995). The proteins elafin, filaggrin, keratin intermediate filaments, loricrin, and small proline-rich proteins 1 and 2 are isodipeptide cross-linked components of the human epidermal cornified cell envelope. J Biol Chem 270, 17702- 17711. Steinert, P. M., and Marekov, L. N. (1997). Direct evidence that involucrin is a major early isopeptide cross-linked component of the keratinocyte cornified cell envelope. J Biol Chem 272, 2021-2030. Steinert, P. M., Parry, D. A., and Marekov, L. N. (2003). Trichohyalin mechanically strengthens the hair follicle: multiple cross-bridging roles in the inner root shealth. J Biol Chem 278, 41409-41419. Steven, A. C., Bisher, M. E., Roop, D. R., and Steinert, P. M. (1990). Biosynthetic pathways of filaggrin and loricrin--two major proteins expressed by terminally differentiated epidermal keratinocytes. J Struct Biol 104, 150-162. Suga, Y., Jarnik, M., Attar, P. S., Longley, M. A., Bundman, D., Steven, A. C., Koch, P. J., and Roop, D. R. (2000). Transgenic mice expressing a mutant form of loricrin reveal the molecular basis of the skin diseases, Vohwinkel syndrome and progressive symmetric erythrokeratoderma. J Cell Biol 151, 401-412. Sugiura, H., Ebise, H., Tazawa, T., Tanaka, K., Sugiura, Y., Uehara, M., Kikuchi, K., and Kimura, T. (2005). Large-scale DNA microarray analysis of atopic skin lesions shows overexpression of an epidermal differentiation gene cluster in the alternative pathway and lack of protective gene expression in the cornified envelope. Br J Dermatol 152, 146-149. Sun, C., Mathur, P., Dupuis, J., Tizard, R., Ticho, B., Crowell, T., Gardner, H., Bowcock, A. M., and Carulli, J. (2005). Peptidoglycan recognition proteins Pglyrp3 and Pglyrp4 are encoded from the epidermal differentiation complex and are candidate genes for the Psors4 locus on chromosome 1q21. Hum Genet, 1-13. Sutherland, D. R., Watt, S. M., Dowden, G., Karhi, K., Baker, M. A., Greaves, M. F., and Smart, J. E. (1988). Structural and partial amino acid sequence analysis of the human hemopoietic progenitor cell antigen CD34. Leukemia 2, 793-803.

279 Bibliographie

Suzuki, Y., Yoshitomo-Nakagawa, K., Maruyama, K., Suyama, A., and Sugano, S. (1997). Construction and characterization of a full length-enriched and a 5'-end-enriched cDNA library. Gene 200, 149-156. Swartzendruber, D. C., Wertz, P. W., Kitko, D. J., Madison, K. C., and Downing, D. T. (1989). Molecular models of the intercellular lipid lamellae in mammalian stratum corneum. J Invest Dermatol 92, 251-257. Sybert, V. P., Dale, B. A., and Holbrook, K. A. (1985). Ichthyosis vulgaris: identification of a defect in synthesis of filaggrin correlated with an absence of keratohyaline granules. J Invest Dermatol 84, 191-194. Syed, S. E., Trinnaman, B., Martin, S., Major, S., Hutchinson, J., and Magee, A. I. (2002). Molecular interactions between desmosomal cadherins. Biochem J 362, 317-327. Taft, R. A., Denegre, J. M., Pendola, F. L., and Eppig, J. J. (2002). Identification of genes encoding mouse oocyte secretory and transmembrane proteins by a signal sequence trap. Biol Reprod 67, 953-960. Takahashi, H., Aoki, N., Nakamura, S., Asano, K., Ishida-Yamamoto, A., and Iizuka, H. (2000). Cornified cell envelope formation is distinct from apoptosis in epidermal keratinocytes. J Dermatol Sci 23, 161-169. Takaishi, M., Makino, T., Morohashi, M., and Huh, N. H. (2005). Identification of human hornerin and its expression in regenerating and psoriatic skin. J Biol Chem 280, 4696- 4703. Tamiji, S., Beauvillain, J. C., Mortier, L., Jouy, N., Tual, M., Delaporte, E., Formstecher, P., Marchetti, P., and Polakowska, R. (2005). Induction of apoptosis-like mitochondrial impairment triggers antioxidant and Bcl-2-dependent keratinocyte differentiation. J Invest Dermatol 125, 647-658. Tani, H., Morris, R. J., and Kaur, P. (2000). Enrichment for murine keratinocyte stem cells based on cell surface phenotype. Proc Natl Acad Sci U S A 97, 10960-10965. Tashiro, K., Tada, H., Heilker, R., Shirozu, M., Nakano, T., and Honjo, T. (1993). Signal sequence trap: a cloning strategy for secreted proteins and type I membrane proteins. Science 261, 600-603. Taylor, G., Lehrer, M. S., Jensen, P. J., Sun, T. T., and Lavker, R. M. (2000). Involvement of follicular stem cells in forming not only the follicle but also the epidermis. Cell 102, 451-461. Thrash, B. R., Menges, C. W., Pierce, R. H., and McCance, D. J. (2006). AKT1 provides an essential survival signal required for differentiation and stratification of primary human keratinocytes. J Biol Chem 281, 12155-12162. Toulza, E., Galliano, M. F., Jonca, N., Gallinaro, H., Mechin, M. C., Ishida-Yamamoto, A., Serre, G., and Guerrin, M. (2006). The human dermokine gene: description of novel isoforms with different tissue-specific expression and subcellular location. J Invest Dermatol 126, 503-506. Trempus, C. S., Morris, R. J., Bortner, C. D., Cotsarelis, G., Faircloth, R. S., Reece, J. M., and Tennant, R. W. (2003). Enrichment for living murine keratinocytes from the hair follicle bulge with the cell surface marker CD34. J Invest Dermatol 120, 501-511. Tricarico, C., Pinzani, P., Bianchi, S., Paglierani, M., Distante, V., Pazzagli, M., Bustin, S. A., and Orlando, C. (2002). Quantitative real-time reverse transcription polymerase chain reaction: normalization to rRNA or single housekeeping genes is inappropriate for human tissue biopsies. Anal Biochem 309, 293-300. Tsuchida, S., Bonkobara, M., McMillan, J. R., Akiyama, M., Yudate, T., Aragane, Y., Tezuka, T., Shimizu, H., Cruz, P. D., Jr., and Ariizumi, K. (2004). Characterization of Kdap, a protein secreted by keratinocytes. J Invest Dermatol 122, 1225-1234.

280 Bibliographie

Tummala, R., Romano, R. A., Fuchs, E., and Sinha, S. (2003). Molecular cloning and characterization of AP-2 epsilon, a fifth member of the AP-2 family. Gene 321, 93-102. Tyagi, S., and Kramer, F. R. (1996). Molecular beacons: probes that fluoresce upon hybridization. Nat Biotechnol 14, 303-308. Umeda, J., Sano, S., Kogawa, K., Motoyama, N., Yoshikawa, K., Itami, S., Kondoh, G., Watanabe, T., and Takeda, J. (2003). In vivo cooperation between Bcl-xL and the phosphoinositide 3-kinase-Akt signaling pathway for the protection of epidermal keratinocytes from apoptosis. Faseb J 17, 610-620. Uzumcu, A., Norgett, E. E., Dindar, A., Uyguner, O., Nisli, K., Kayserili, H., Sahin, S. E., Dupont, E., Severs, N. J., Leigh, I. M., et al. (2006). Loss of desmoplakin isoform I causes early onset cardiomyopathy and heart failure in a Naxos-like syndrome. J Med Genet 43, e5. Vaglio, P., Lamesch, P., Reboul, J., Rual, J. F., Martinez, M., Hill, D., and Vidal, M. (2003). WorfDB: the Caenorhabditis elegans ORFeome Database. Nucleic Acids Res 31, 237- 240. van Ruissen, F., Jansen, B. J., de Jongh, G. J., van Vlijmen-Willems, I. M., and Schalkwijk, J. (2002a). Differential gene expression in premalignant human epidermis revealed by cluster analysis of serial analysis of gene expression (SAGE) libraries. Faseb J 16, 246- 248. van Ruissen, F., Jansen, B. J., de Jongh, G. J., Zeeuwen, P. L., and Schalkwijk, J. (2002b). A partial transcriptome of human epidermis. Genomics 79, 671-678. Vandesompele, J., De Preter, K., Pattyn, F., Poppe, B., Van Roy, N., De Paepe, A., and Speleman, F. (2002). Accurate normalization of real-time quantitative RT-PCR data by geometric averaging of multiple internal control genes. Genome Biol 3, RESEARCH0034. Vasioukhin, V., Bauer, C., Degenstein, L., Wise, B., and Fuchs, E. (2001a). Hyperproliferation and defects in epithelial polarity upon conditional ablation of alpha- catenin in skin. Cell 104, 605-617. Vasioukhin, V., Bowers, E., Bauer, C., Degenstein, L., and Fuchs, E. (2001b). Desmoplakin is essential in epidermal sheet formation. Nat Cell Biol 3, 1076-1085. Velculescu, V. E., Zhang, L., Vogelstein, B., and Kinzler, K. W. (1995). Serial analysis of gene expression. Science 270, 484-487. Venter, J. C., Adams, M. D., Myers, E. W., Li, P. W., Mural, R. J., Sutton, G. G., Smith, H. O., Yandell, M., Evans, C. A., Holt, R. A., et al. (2001). The sequence of the human genome. Science 291, 1304-1351. Vinckenbosch, N., Dupanloup, I., and Kaessmann, H. (2006). Evolutionary fate of retroposed gene copies in the human genome. Proc Natl Acad Sci U S A 103, 3220-3225. Volz, A., Korge, B. P., Compton, J. G., Ziegler, A., Steinert, P. M., and Mischke, D. (1993). Physical mapping of a functional cluster of epidermal differentiation genes on chromosome 1q21. Genomics 18, 92-99. Weinberg, R. A. (1995). The retinoblastoma protein and cell cycle control. Cell 81, 323-330. Welter, J. F., and Eckert, R. L. (1995). Differential expression of the fos and jun family members c-fos, fosB, Fra-1, Fra-2, c-jun, junB and junD during human epidermal keratinocyte differentiation. Oncogene 11, 2681-2687. Wheeler, D. L., Barrett, T., Benson, D. A., Bryant, S. H., Canese, K., Chetvernin, V., Church, D. M., DiCuccio, M., Edgar, R., Federhen, S., et al. (2006). Database resources of the National Center for Biotechnology Information. Nucleic Acids Res 34, D173-180. Wiedow, O., Schroder, J. M., Gregory, H., Young, J. A., and Christophers, E. (1990). Elafin: an elastase-specific inhibitor of human skin. Purification, characterization, and complete amino acid sequence. J Biol Chem 265, 14791-14795.

281 Bibliographie

Wittwer, C. T., Herrmann, M. G., Moss, A. A., and Rasmussen, R. P. (1997a). Continuous fluorescence monitoring of rapid cycle DNA amplification. Biotechniques 22, 130-131, 134-138. Wittwer, C. T., Ririe, K. M., Andrew, R. V., David, D. A., Gundry, R. A., and Balis, U. J. (1997b). The LightCycler: a microvolume multisample fluorimeter with rapid temperature control. Biotechniques 22, 176-181. Wrone-Smith, T., and Nickoloff, B. J. (1996). Dermal injection of immunocytes induces psoriasis. J Clin Invest 98, 1878-1887. Wu, Y. Y., and Rees, J. L. (2000). Variation in epidermal housekeeping gene expression in different pathological states. Acta Derm Venereol 80, 2-3. Yang, D., Chertov, O., Bykovskaia, S. N., Chen, Q., Buffo, M. J., Shogan, J., Anderson, M., Schroder, J. M., Wang, J. M., Howard, O. M., and Oppenheim, J. J. (1999). Beta- defensins: linking innate and adaptive immunity through dendritic and T cell CCR6. Science 286, 525-528. Yang, T., Liang, D., Koch, P. J., Hohl, D., Kheradmand, F., and Overbeek, P. A. (2004). Epidermal detachment, desmosomal dissociation, and destabilization of corneodesmosin in Spink5-/- mice. Genes Dev 18, 2354-2358. Yoneda, K., Hohl, D., McBride, O. W., Wang, M., Cehrs, K. U., Idler, W. W., and Steinert, P. M. (1992). The human loricrin gene. J Biol Chem 267, 18060-18066. Yuen, T., Wurmbach, E., Pfeffer, R. L., Ebersole, B. J., and Sealfon, S. C. (2002). Accuracy and calibration of commercial oligonucleotide and custom cDNA microarrays. Nucleic Acids Res 30, e48. Zaltash, S., and Johansson, J. (1998). Secondary structure and limited proteolysis give experimental evidence that the precursor of pulmonary surfactant protein B contains three saposin-like domains. FEBS Lett 423, 1-4. Zeeuwen, P. L. (2004). Epidermal differentiation: the role of proteases and their inhibitors. Eur J Cell Biol 83, 761-773. Zeeuwen, P. L., van Vlijmen-Willems, I. M., Olthuis, D., Johansen, H. T., Hitomi, K., Hara- Nishimura, I., Powers, J. C., James, K. E., op den Camp, H. J., Lemmens, R., and Schalkwijk, J. (2004). Evidence that unrestricted legumain activity is involved in disturbed epidermal cornification in cystatin M/E deficient mice. Hum Mol Genet 13, 1069-1079. Zhang, T., Haws, P., and Wu, Q. (2004). Multiple variable first exons: a mechanism for cell- and tissue-specific gene regulation. Genome Res 14, 79-89. Zhao, X. P., and Elder, J. T. (1997). Positional cloning of novel skin-specific genes from the human epidermal differentiation complex. Genomics 45, 250-258. Zhao, X. S., Shin, D. M., Liu, L. H., Shull, G. E., and Muallem, S. (2001). Plasticity and adaptation of Ca2+ signaling and Ca2+-dependent exocytosis in SERCA2(+/-) mice. Embo J 20, 2680-2689.

282