P ÍRODOV DECKÁ FAKULTA
Dizertační práce
MARKÉTA WAYHELOVÁ Brno 2019
P ÍRODOV DECKÁ FAKULTA
Analýza patogenních genetických variant u d tí s mentálními retardacemi pomocí metod komparativní genomové hybridizace na mikročipech (array-CGH) a sekvenování "nové generace" (NGS)
Dizertační práce
MARKÉTA WAYHELOVÁ
Vedoucí práce: doc. RNDr. Petr Kuglík, CSc.
Ústav experimentální biologie
Brno 2019
1
Bibliografický záznam
Autorka: Markéta Wayhelová Přírodovědecká fakulta, Masarykova univerzita Ústav experimentální biologie
Název práce: Analýza patogenních genetických variant u dětí s mentálními retardacemi pomocí metod komparativní genomové hybridizace na mikročipech (array-CGH) a sekvenování "nové generace" (NGS)
Studijní program: Molekulární a buněčná biologie a genetika
Vedoucí práce: doc. RNDr. Petr Kuglík, CSc.
Akademický rok: 2019/2020
Počet stran: 164 + 19
Klíčová slova: Poruchy intelektuálního vývoje; array-CGH; varianty v počtu kopií; sekvenování „nové generace“; sekvenční varianty
2
Bibliographic entry
Author: Markéta Wayhelová Faculty of Science, Masaryk University Department of Experimental Biology
Název práce: The analysis of pathogenic genetic variants in children with disorders of intellectual development using methods of array-based comparative genomic hybridization (array-CGH) and „next-generation“ sequencing (NGS)
Degree programme: Molecular and cell biology and genetics
Supervisor: doc. RNDr. Petr Kuglík, CSc.
Academic Year: 2019/2020
Number of pages: 164 + 19
Keywords: Disorders of intellectual development; array-CGH; copy-number variations; „next-generation“ sequencing; sequence variants
3
Abstrakt
Poruchy intelektuálního vývoje (disorders of intellectual development, DID) se svojí průměrnou prevalencí u 1-3 % populace představují jedno z nejzávažnějších témat v oblasti zdravotní péče a každodenního života lidské společnosti. DID zahrnují soubor geneticky a fenotypově různorodých onemocnění s nástupem obvykle již v raném dětském věku, jež negativně ovlivňují život postiženého jedince ve všech aspektech života. I přes rozvinutý systém zdravotní a sociální péče o postižené jedince a jejich rodiny dosud ve většině případů zůstává neobjasněna příčina manifestace DID a asociovaných onemocnění. Celogenomové analýzy u jedinců s DID prokázaly klíčový význam genetických variant v v patogenezi DID a dalších neurovývojových onemocnění. Identifikace genetických příčin DID je podmíněna vývojem efektivního molekulárně diagnostického algoritmu, jež v sobě zahrnuje cytogenetické, molekulárně cytogenetické a molekulárně genetické metody. Metoda komparativní genomové hybridzace na DNA mikročipech (array-CGH) představuje současný „zlatý standard“ pro identifikaci patogenních submikroskopických přestaveb chromosomů (copy-number variations, CNVs). Do studie bylo vybráno 724 dětí s DID a dalšími neurovývojovými poruchami vyšetřených na Oddělení lékařské genetiky Fakultní nemocnice Brno bylo v letech 2011-2018. Metodou array-CGH byla objasněna genetická příčina uvedených patologií u 17,3 % dětí ve formě patogenních přestaveb chromosomů různého rozsahu. V 5,9 % případů byl upřesněn cytogenetický nález a u 12,3 % dětí s normálním karyotypem či s karyotypem s nálezem balancované chromosomové přestavby byla detekována alespoň 1 patogenní/pravděpodobně patogenní CNV (32 případů rekurentních mikrodelecí, 13 případů rekurentních mikroduplikací, 24 non-rekurentních mikrodelecí a 7 non-rekurentních mikroduplikací, 8 nálezů dvou klinicky významných CNVs). Dále byly v 5 % případů identifikovány varianty s nejasným vlivem na fenotyp a v 7,7 % případů byly nalezené strukturní varianty chromosomů klasifikovány jako pravděpodobně benigní. Jednotlivé varianty v daných skupinách byly dále charakterizovány z hlediska jejich původu, rozsahu a genového obsahu a získaná data byla statisticky zpracována. Byly prokázány významné rozdíly mezi velikostmi variant jednotlivých klasifikačních skupin. Další analýzou patogenních/pravděpodobně patogenních CNVs byla zjištěna vyšší četnost mikrodelecí oproti mikroduplikacím a také vyšší četnost de novo mikrodelecí oproti de novo mikroduplikacím, avšak nebyl nalezen významný rozdíl mezi jejich velikostmi. Na základě výsledků vyšetření karyotypu a array-CGH bylo v letech 2015-2018 vyšetřeno metodou cíleného sekvenování „nové generace“ (NGS) 35 dětí bez nálezu 4 patogenních přestaveb chromosomů, přičemž v rámci volby optimálního vyšetřovacího postupu byli současně s 19 dětmi vyšetřeni i jejich rodiče (trio-based NGS) a ve zbylých 16 případech bylo zvoleno Sangerovo sekvenování pro přímou verifikaci patogenní/pravděpodobně patogenních sekvenčních variant u rodičů. Pro strategii cíleného NGS byl vybrán komerční design ClearSeq Inherited Disease (Agilent Technologies, Santa Clara, CA, USA) pokrývající převážně kódující oblasti 2742 genů popsaných v patogenezi lidských vrozených onemocnění. Přístupem cíleného NGS byla identifikována příčina manifestace DID a asociovaných patologií u 25,7 % dětí (9/35), přičemž byly detekovány patogenní/pravděpodobně patogenní sekvenční varianty původu de novo v genech MED13L, ASXL3, SCN2A, TUBB3, ve stavu složené heterozygotnosti v genech TSEN54, SLC6A19 a familiální X-vázaná sekvenční varianta v genu IQSEC2 a homozygotní sekvenční varianta v genu BTD. Výsledky vyšetření metodami array-CGH, NGS a příslušných verifikací byly korelovány s fenotypem daných jedinců a předány ošetřujícícm lékařům pro účely genetického poradenství. V průběhu řešení disertační práce byla prokázána efektivita molekulárně diagnostického algoritmu a návaznost použitých metodik. Současně však s nárůstem detekce nových genetických variant jsou spojeny vyšší nároky na erudovanost kvalifikovaných pracovníků a vývoj bioinformatických sérií programů. V neposlední řadě je oblast genomických analýz spojena s právními a etickými aspekty, jež je třeba uvažovat v souladu s efektivním využití získaných informací, jejich interpretací vyšetřovaným jedincům a ochranou genomických dat před zneužitím.
5
Abstract
Disorders of intellectual development and their average worldwide prevalence 1-3 % represent one of the most serious topics in the field of healthcare and everyday life of human society. They encompass a group of genetically and phenotypically heterogeneous diseases with an early onset, which negatively impact the quality of life of affected individuals. Despite the developed system of healthcare and social care for affected individuals and their families most of them do not obtain the molecular diagnosis to elucidate the cause of manifestation of DID and associated diseases. Genomic analyses in individuals with DID proved the key impact of genetic variants in the pathogenesis of DID and other neurodevelopmental disorders. The identification of genetic causes of DID is conditioned by the development of effective molecular diagnostic algorithm, including cytogenetic, molecular-cytogenetic and molecular-genetic approaches. The method of comparative genomic hybridisation on DNA microarrays (array-CGH) represents a current „gold standard“ for the identification of causative chromosomal copy- number variations (CNVs). Our study included 724 children with DID and other neurodevelopmental disorders examined at the Department of Medical Genetics of University Hospital Brno in the period from 2011 to 2018. We identified the genetic cause of mentioned pathologies in 17.3% of children in the form of chromosomal rearrangements of various sizes. In 5.9% of cases the karyotype abnormalities were specified and in 12.3% of children with normal karyotype or with karyotype carrying balanced chromosomal rearrangements we identified at least 1 causative CNV (32 cases of recurrent microdeletions, 13 cases of recurrent microduplications, 24 cases of non-recurrent microdeletions, 7 cases of non- recurrent microduplications and 8 findings of two clinically relevant CNVs). We also detected variants of unclear significance in 5% of cases and the structural chromosomal variants were classified as likely benign in 7.7% of cases. The particular variants in the classification groups were subsequently characterized in aspects of their origin, size and gene content and the data were statistically evaluated. We proved the significant differences between the CNV sizes of particular classification groups. Further analysis of causative CNVs showed the higher frequency of microdeletions than microduplications and higher frequency of de novo microdeletions than de novo microduplications. Nevertheless the significant differences between their sizes were not found.
6
Based on the results of analyses of karyotype and array-CGH 35 children without pathogenic chromosomal rearrangements were examined using targeted „next-generation“ sequencing (NGS) in the period from 2015 to 2018. To find the optimal strategy, trio-based NGS with 19 children and their parents was selected as an approach for one part of the project. The remaining 16 children were examined using targeted NGS and causative sequence variants were verified in them and their parents by Sanger sequencing. We used commercial capture design ClearSeq Inherited Disease (Agilent Technologies, Santa Clara, CA, USA) targeted to predominantly coding regions of 2742 genes involved in the pathogenesis of human inherited diseases. We identified the genetic cause of the pathological phenotype of DID and associated pathologies in 25.7% of children (9/35). We detected causative sequence variants of de novo origin in the MED13L, ASXL3, SCN2A, TUBB3 genes, compound heterozygous variants in the TSEN54 and SLC6A19 genes and finally, familial X- linked sequence variant in the IQSEC2 gene and homozygous sequence variant in the BTD gene were identified. The results of array-CGH, NGS and verification analyses were correlated with the pathological phenotypes of given individuals and presented to attending physicians for the purpose of genetic counselling. In the course of this thesis solution we proved the efficiency of the molecular diagnostic algorithm and the link-up of utilized methods. The increase of detection of novel genetic variants is linked together with the higher requirements to the research experts and the development of effective bioinformatic pipelines. Last but not least the field of genomic analyses is linked to judical and ethical aspects which are required to be considered for the optimal and effective utility of information and their interpretation to tested individuals and their families and to prevent the misuse of genomic data.
7
Poděkování Na tomto místě bych ráda poděkovala svému školiteli, doc. RNDr. Petru Kuglíkovi, CSc., za odborné vedení mojí vědecké práce a její odborné konzultace během mého studia na Přírodovědecké fakultě Masarykovy univerzity. Dále bych chtěla poděkovat všem svým současným a bývalým kolegům z Integrovaných laboratoří molekulární cytogenetiky a Oddělení lékařské genetiky Fakultní nemocnice Brno za příjemnou spolupráci, vytvoření motivující atmosféry a přátelského pracovního prostředí a za poskytnutí možnosti profesního rozvoje. Zde bych rovněž ráda vyjádřila své díky Mgr. Janu Oppeltovi, Ph.D. (toho času CEITEC MU) za precizní bioinformatické zpracování sekvenačních dat, cenné rady pro jejich analýzu a pomoc se sepsáním a korekturou části týkající se zpracování NGS dat, Mgr. Filipu Pardymu za pomoc s obsluhou přístrojů na pracovišti Core Facility Genomics (CEITEC MU) a doc. Mgr. Janu Lochmanovi, Ph.D. (Ústav biochemie PřF MU) za provedení kapilární elektroforézy na přístroji ABI 3130 firmy Elisabeth Pharmacon. Poděkování patří rovněž mé rodině a přátelům za veškerou podporu během mých studií, čímž významně přispěli k jejich zdárnému dokončení.
Tato disertační práce byla podpořena čtyřmi projekty institucionální podpory Fakultní nemocnice Brno v letech 2015-2017 (FNBr 65269705) a pěti programy Grantové agentury Masarykovy univerzity – Specifický výzkum – Studentské výzkumné projekty „Podpora výzkumné činnosti studentů molekulární biologie a genetiky“ (MUNI/A/1394/2014, MUNI/A/0967/2015, MUNI/A/0877/2016, MUNI/A/0824/2017, MUNI/A/0958/2018)
8
Prohlášení
Prohlašuji, že jsem svou disertační práci vypracovala samostatně s využitím informačních zdrojů, které jsou v práci citovány. Text práce jsem vypracovala podle pravidel a zodpovídám za jeho jazykovou správnost.
Brno, 17. 9. 2019 ......
Markéta Wayhelová
© Markéta Wayhelová, Masarykova univerzita, 2019 9
Originální publikace a vymezení podílu autora dizertační práce
Práce vychází ze dvou publikací autorky dizertace (Markéta Wayhelová, MW).
Článek 1 (Annex 1 k této dizertační práci)
Wayhelova M, Oppelt J, Smetana J, Hladilkova E, Filkova H, Makaturova E, Nikolova P, Beharka R, Gaillyova R, Kuglik P. Novel de novo frameshift variant in the ASXL3 gene in a child with microcephaly and global developmental delay. Mol Med Rep. 2019, vol. 20, no. 1, pp. 505-12. ISSN 1791-2997. doi: 10.3892/mmr.2019.10303.
IF (2018) = 1,851 Autorský podíl 70 %
MW se podílela na přípravě designu experimentů, laboratorním zpracování vzorků a analýze dat popsaných v uvedené práci. Připravila draft rukopisu a zfinalizovala text po připomínkách spoluautorů.
Článek 2 (Annex 2 k této dizertační práci)
Wayhelova M, Smetana J, Vallova V, Hladilkova E, Filkova H, Hanakova M, Vilemova M, Nikolova P, Gromesova B, Gaillyova R, Kuglik P. The clinical benefit of array-based comparative genomic hybridization for detection of copy number variants in Czech children with intellectual disability and developmental delay. BMC Med Genomics. 2019, vol. 12, no. 1, 99:111. ISSN 1755-8794. doi: 10.1186/s12920-019-0559-7.
IF (2018) = 2,568 Autorský podíl 70 %
MW samostatně připravila designu experimentu, podílela se na laboratorním zpracování vzorků a analýze dat popsaných v uvedené práci. Podílela se na přípravě draftu rukopisu a zfinalizovala text po připomínkách spoluautorů.
Další prvoautorské publikace v časopise s IF, nevztahující se k obsahu dizertační práce
Wayhelova M, Mikulasova A, Smetana J, Vallova V, Blazkova D, Filkova H, Moukova L, Kuglik P. Detection of oncogenic mutations in cervical carcinoma using method High Resolution Melting (HRM). Neoplasma. 2016, vol. 63, no. 5, pp. 779-88. doi: 10.4149/neo_2016_516. Autorský podíl 70 % IF (2018) = 1,771
MW se podílela na přípravě designu experimentu, podílela se na laboratorním zpracování vzorků a analýze dat popsaných v uvedené práci. Podílela se na přípravě draftu rukopisu a zfinalizovala text po připomínkách spoluautorů.
10
Obsah
Úvod ...... 16 1. Přehled problematiky ...... 17 1.1. Epidemiologie ...... 19 1.2. Příčiny DID ...... 20 1.2.1. Negenetické faktory...... 20 1.2.2. Genetické faktory ...... 21 1.2.2.1. Variabilita v počtu kopií ...... 22 1.2.2.2. Změny primární struktury DNA ...... 27 1.2.2.3. Nemendelistická dědičnost ...... 31 1.3. Metodické přístupy analýzy genomu jedinců s DID ...... 35 1.3.1. Cytogenetické vyšetření ...... 35 1.3.2. Metody molekulární cytogenetiky ...... 36 1.3.3. Metoda sekvenování „nové generace“ (NGS) ...... 40 2. Cíle disertační práce ...... 49 3. Soubor pacientů a metody ...... 50 3.1. Klinická charakteristika pacientů ...... 50 3.2. Metody ...... 52 4. Výsledky ...... 59 4.1. Identifikace vzácných submikroskopických přestaveb chromosomů (CNVs) metodou komparativní genomové hybridizace na DNA mikročipech (array-CGH) a stanovení jejich klinického významu v souboru 724 dětských pacientů s DID, PAS a asociovanými onemocněními vyšetřených na OLG FN Brno v letech 2011-2018 ..... 59 4.2. Analýza detekovaných CNVs u dětí s DID, PAS a asociovanými onemocněními ...... 75 4.3. Identifikace vzácných sekvenčních variant v souboru 35 dětských pacientů s DID, PAS a asociovanými VVV metodou cíleného sekvenování „nové generace“ (NGS) vyšetřených na OLG FN Brno v letech 2015-2018 ...... 80 4.3.1. Kvalitativní analýza dat ...... 84 4.3.2. Statistika sekvenčních variant ...... 85 4.4. Analýza patogenních sekvenčních variant detekovaných metodou cíleného NGS a stanovení jejich významu v patogenezi DID, PAS a asociovaných onemocnění .... 86 4.4.1. Další nálezy sekvenčních variant s potenciálním klinickým významem ...... 99 4.4.1.1. Sekvenční varianty nejasného významu ...... 99
11
4.4.1.2. Identifikace patogenních variant v heterozygotním stavu spojených s AR onemocněními pomocí „trio-based“ NGS ...... 100 5. Diskuze ...... 102 Závěr ...... 127 Přehled literatury ...... 128 Seznam obrázků ...... 157 Seznam tabulek ...... 159 Seznam publikací a konferenčních příspěvků ...... 160 Seznam příloh ...... 164
12
Seznam zkratek
AAIDD American Association on Intellectual and Developmental Disabilities; Americká asociace pro intelektuální a vývojová postižení ACMG American College of Medical Genetics and Genomics; Americká společnost lékařské genetiky a genomiky AD autosomálně dominantní ADHD attention deficit hyperactivity disorder; porucha pozornosti s hyperaktivitou AMK aminokyselina AR autosomálně recesivní ARF ADP ribosylation factor; adenosin-difosfát-ribosylační faktor array-CGH array-comparative genomic hybridization; komparativní genomová hybridizace na DNA mikročipech BQSR Base Quality Score Recalibration; rekalibrace hodnoty kvality báze BRS Bainbridge-Ropers syndrome; Bainbridge-Ropersův syndrom cnnLOH copy-number neutral loss of heterozygosity; ztráta heterozygotnosti bez ztráty počtu kopií CNS centrální nervová soustava CNV copy-number variation; varianta v počtu kopií
Ct cycle threshold; cyklus, v němž došlo k překročení prahové hodnoty dbSNP Single Nucleotide Polymorphism Database; databáze jednonukleotidových polymorfismů DECIPHER DatabasE of Chromosomal Imbalance and Phenotype in Humans using Ensembl Resources (databáze genomických variant) DGS DiGeorge syndrome; DiGeorgův syndrom DID disorders of intellectual development; poruchy intelektuálního vývoje DNA deoxyribonucleic acid; deoxyribonukleotidová kyselina DSM Diagnostic and Statistical manual Of Mental Disorders; Diagnostický a statistický manuál duševních poruch ERH enhancer of rudimentary homolog („housekeepingový“ gen) ExAc The Exome Aggegation Consortium; databáze společenství shromažďující a harmonizující výstupy exomových sekvenačních dat FISH fluorescence in situ hybridization; fluorescenční in situ hybridizace FoSTeS fork stalling and template switching; blokování replikační vidlice a změna templátového vlákna 13
GATK GenomeAnalysisToolKit (bioinformatický nástroj pro zpracování sekvenačních dat) GEF guanine nucleotide exchange factor; faktor pro výměnu guaninu GoF gain-of-function; zisk funkce GWAS genome-wide association study; celogenomová asociační studie HGVS Human Genome Variation Society; Společnost variability lidského genomu ICD International classification of disease and related health problems; Mezinárodní klasifikace nemocí a souvisejících zdravotních problémů IGV Integrative Genomics Viewer; prohlížeč genomických dat LCR low-copy repeats; repetice o nízkém počtu kopií LoF loss-of-function; ztráta funkce MLPA multiplex ligation-dependent probe amplification MRI magnetic resonance imaging; zobrazovací metoda magnetické resonance mtDNA mitochondrial DNA; mitochondriální deoxyribonukleotidová kyselina MZ monozygotický NAHR non-allelic homologous recombination; nealelická homologní rekombinace NGS „next-generation“ sequencing; sekvenování „nové generace“ NHEJ non-homologous end joining; nehomologické spojování konců NMD nonsense-mediated mRNA decay; degradace molekul mRNA obsahujících předčasně zařazený terminační kodon OLG Oddělení lékařské genetiky OMIM Online Mendelian Inheritance in Man (databáze) PAS poruchy autistického spektra PCH pontocerebellar hypoplasia; pontocerebellární hypoplázie PolyPhen-2 Polymorphism Phenotyping v2; fenotypování polymorfismů (in silico predikce vlivu substitucí aminokyselin na funkci proteinu) PROVEAN Protein Variation Effect Analyzer; analyzátor efektu proteinových variant PTC premature terminantion codon; předčasné zařezení terminačního kodonu PTV protein-truncation variant; varianta zkracující délku proteinu QF-PCR quantitative fluorescence polymerase chain reaction; kvantitativní fluorescenční polymerázová řetězová reakce qPCR quatitative polymerase chain reaction; relativní kvantifikace pomocí polymerázové řetězové reakce RNA ribonucleic acid; ribonukleotidová kyselina
14
RV replikační vidlice SIFT sorting intolerant from tolerant; třídění netolerovaných variant od tolerovaných (in silico predikce vlivu substituce aminokyselin na funkci proteinu) SNP single-nucleotide polymorphism; jednodukleotidový polymorfismus SNV single-nucleotide variant; jednonukleotidová varianta TAD topologically associated domain; topologicky asociovaná doména TNR trinukleotidové repetice VCFS velo-cardio-facial syndrome; velokardiofaciální syndrom VOUS variant of unclear signifikance; varianta nejasného významu VSV vrozená srdeční vada VVV vrozené vývojové vady WGS whole-genome sequencing; celogenomové sekvenování WES whole-exome sequencing; celoexomové sekvenování XCI X chromosome inactivation; inaktivace chromosomu X XL-DID X-linked disorder of intellectual development; X-vázaná porucha intelektuálních funkcí
15
Úvod Život jedince s neurovývojovou poruchou je výrazně omezen ve všech svých aspektech, zahrnující schopnosti vzdělávat se, učit se novým dovednostem, navazovat a udržovat mezilidské vztahy. Vzhledem ke svému časnému nástupu v raném dětství tato onemocnění významně ovlivňují celý individuální vývoj pacienta, jeho rodiny a tím nepřímo rovněž fungování celé společnosti. I přes neustálý pokrok ve výzkumu a vývoji léčebných a podpůrných prostředků neurovývojová onemocnění provázejí celý život jedince a poskytovaná pomoc pouze zmírňuje jejich negativní dopady. Současné trendy výzkumu jsou zaměřeny na prohloubení znalostí o etiopatogenezi neurovývojových poruch, zejména rozpoznání a pochopení molekulárních mechanismů daných onemocnění. Moderní metody analýzy genomu zcela zásadně přispěly k identifikaci genetických variant na různých úrovních genetické informace a odhalily nové cesty vedoucí k vývoji nových terapeutických prostředků. Stejně jako v mnoha dalších výzkumných oblastech zabývajících se strukturní a sekvenční variabilitou lidského genomu ve vztahu k patologiím, i zde množství a komplexita získaných informací předčily současné limity lidského poznání v dané oblasti a přinesly s sebou nejen mnoho odpovědí, ale snad i více otázek a nových podnětů k dalšímu výzkumu. Je proto tedy jisté, že pro budoucnost výzkumu etiologie neurovývojových onemocnění je nezbytná multioborová spolupráce lékařských specialistů, výzkumných pracovníků, bioinformatických týmů a svou nezastupitelnou roli zde budou mít jistě i odborníci analyzující právní a etické aspekty biomedicínského výzkumu. Potenciál základního a aplikovaného výzkumu spočívá ve vývoji efektivních terapeutik a léčebných strategií. Efektivní využití moderních genomických analýz a navazující intenzivní spolupráce uvedených odborníků proto přispívají ke zvýšení kvality života jedince s neurovývojovou poruchou či jiným onemocněním s nepříznivou prognózou a jeho rodiny.
16
1. Přehled problematiky Inteligence je duševní charakteristika jedince, která zahrnuje schopnost porozumění a řešení problémů, abstraktní myšlení, pochopení komplexních představ, schopnosti efektivního učení a učení na základě zkušenosti (Shogren and Turnbull, 2010). Starší definice charakterizují intelektuální opoždění jako stav významného snížení kognitivních funkcí, který je možné stanovit na základě standardizovaného měření inteligence, a rovněž stav významného snížení funkčních a adaptivních schopností, jež zahrnují vykonávání každodenních činností přiměřených věku jedince. Míru intelektuálního opoždění lze klasifikovat podle několika různých systémů, v nichž jsou zohledněna různá kritéria. Stavy intelektuálního opoždění byly zahrnuty v Mezinárodní klasifikaci nemocí a souvisejících zdravotních problémů (International Classification of Disease and Related Health Problems, ICD) a v Diagnostickém a statistickém manuálu duševních poruch (Diagnostic and Statistical manual Of Mental Disorders, DSM) již od jejich prvních vydání. Oba systémy klasifikují intelektuální opoždění do několika stupňů závažnosti dle míry podpory od okolí, která je vyžadována v každodenním životě postiženého jedince. Během let doznaly označení, definice a klasifikace jednotlivých stupňů mnoha změn, až se ustálily do současných podob v systémech ICD-11 a DSM-5. V současném vydání ICD-11 bylo dřívější označení „mentální retardace“ nahrazeno označením „poruchy intelektuálního vývoje“ (disorders of intellectual development, DID). DID jsou zde rovněž uvažovány více v pojetí zdravotního stavu než neschopnosti. Dle definice představují skupinu etiologicky heterogenních stavů, které mají svůj původ ve vývojovém období života jedince. Jejich základní charakteristikou je významné snížení intelektuálních funkcí a adaptivního chování pod hranicí dvou či více směrodatných odchylek od průměru, který byl stanoven na základě standardizovaných testů. V případě absence těchto testů diagnóza DID vyžaduje vysokou spolehlivost klinického vyšetření vycházejících z objektivních a vhodných ukazatelů chování (Tassé et al., 2013; Girimaji and Pradeep, 2018). Systém DSM-5 definuje DID jako poruchy nervového vývoje, které začínají v dětství a jež jsou charakterizovány poruchami intelektu a obtížemi v mezilidských vztazích, společenských a praktických oblastech života. Pro diagnózu DID musí být přitom splněna následující tři kritéria: 1) deficity v intelektuálních funkcích potvrzené klinickým vyšetřením a individualizovaným standardním IQ testem; 2) deficity v adaptivních funkcích, které vybočují z vývojových a sociokulturních standardů pro dosažení nezávislosti jedince a ze schopnosti společenské odpovědnosti; 3) nástup těchto deficitů během dětství. 17
Na základě klinické manifestace jsou stupně závažnosti DID klasifikovány do čtyř skupin, přičemž se nyní posuzují spíše dovednosti jedince než hodnota IQ (tab. 1).
kategorie p ibližné kritéria kritéria DSM-V kritéria AAIDD * závažnosti zastoupení DSM-IV (dle samostatnosti (dle míry p ípadů DID (dle IQ) v denních aktivitách) samostatnosti) mírná 85 % IQ 50-69 nezávislý život s minimální občasná pomoc během pomocí stavů nejistoty st edn 10 % IQ 36-49 nezávislý život možný pouze omezená podpora závažná s větší mírou pomoci (např. v každodenních pečovatelské skupiny) činnostech t žká 3 % IQ 20-35 denní asistence při významná pomoc sebeobsluze, dohled nad v každodenních bezpečností činnostech hluboká 1,5 % IQ < 20 nepřetržitá péče trvalá pomoc ve všech aspektech každodenního života
Tabulka 1: Klasifikace závažnosti DID podle různých klasifikačních kritérií. Zpracováno dle https://www.ncbi.nlm.nih.gov/books/NBK332877/. * AAIDD = American Association on Intellectual and Developmental Disabilities
Kromě klasifikace DID na základě výše uvedených kritérií lze rozlišit nesyndromické a syndromické formy DID, přičemž syndromické formy DID se obvykle nemanifestují jako jediná patotogie ve fenotypu pacientů, ale často se vyskytují v kombinaci s poruchami autistického spektra (PAS), senzorickými poruchami či dalšími neurovývojovými či neuropsychiatrickými poruchami, vrozenými vývojovými vadami (VVV) či faciální stigmatizací (Matson and Cervantes, 2013; Lee et al., 2018). PAS se řadí mezi vývojové poruchy, jež se projevují změnami v sociálních interakcích a komunikaci a restriktivními, repetitivními zájmy a stereotypiemi v chování (Lipsker et al., 2018). Do diagnostických kritérií se dle recentních studií rovněž zahrnují pozměněné senzorické vnímání a senzorické schopnosti (Doernberg and Hollander, 2016). Na základě epidemiologických studií lze pozorovat vzrůstající trend prevalence PAS. Tento jev lze vysvětlit lepší úrovní klinické diagnostiky a odborné edukace specialistů, kdy dětští pacienti s PAS nejsou již řazeni do skupin DID či jiných skupin neurovývojových poruch (Shattuck, 2006). Dalším faktorem přispívajícím k celosvětovému nárůstu prevalence PAS je obecně větší povědomí o této problematice v populaci (King and Bearman, 2009). Na základě současných studií je prevalence PAS odhadována na přibližně 1,5-2 % v populaci osmiletých dětí, neboť nejlépe odráží celkovou prevalenci PAS mezi dětmi různého věku (Durkin et al.,
18
2015). Ve skupině dětí s DID je pozorována vyšší prevalence dětí s PAS (4-60 %). Překryv prevalence DID a PAS a PAS a senzorických poruch je vysvětlován stejnými či podobnými molekulárními mechanismy, nebo podobnými fenotypovými projevy zakládajícími se na odlišných molekulárních mechanismech (Matson and Shoemaker, 2009).
1.1. Epidemiologie Obecně se prevalence DID udává mezi 1-3 %, avšak byly pozorovány významné rozdíly v různých geografických oblastech (Battaglia and Carey, 2003; Olusanya et al., 2018). Na spodní hranici prevalence se nachází převážně ekonomicky vyspělé země, kdežto vyšší prevalence byla pozorována v zemích jihozápadní a jižní Asie a na většině území Afriky s výjimkou zemí jižní Afriky (obr. 1). Významná variabilita v prevalenci je pozorována zejména v případech mírné DID, zatímco prevalence těžké a hluboké DID dosahuje celosvětově srovnatelných hodnot do 0,5 % (Maulik et al., 2011; Olusanya et al., 2018).
Obrázek 1: Světová prevalence DID na 100 000 dětí mladších 5 let. Barevně jsou odlišeny oblasti s nízkou prevalencí DID (modrá až světle zelená) od oblastí s vysokou prevalencí DID (žlutá až červená) (Olusanya et al., 2018; upraveno).
19
1.2. Příčiny DID
Etiologie DID a asociovaných onemocnění se významně odráží v heterogenitě a závažnosti klinických příznaků. Stanovení příčiny DID u každého postiženého jedince je základním předpokladem pro podpůrnou léčbu kompenzující zdravotní potíže pacienta, pro genetické poradenství v případě plánovaného rodičovství, stejně tak pro základní přehled o zdravotním stavu obyvatelstva a zavedení a vhodné uplatňování preventivních programů. K hlavním rizikovým negenetickým faktorům pro DID a asociované poruchy vývoje patří faktory přímo související s postiženým jedincem: mužské pohlaví, věk matky nad 30 let, vícečetná gravidita, vyšší parita, nízká porodní hmotnost, malý obvod hlavy, předčasný porod, deficit stopových prvků během gravidity, poranění mozku a podvýživa. Nepřímé faktory zvyšující riziko vývojových poruch zahrnují nízkou vzdělanost rodičů, špatný psychický stav matky, nízký socioekonomický status a nepřiměřenou stimulaci jedince během raného vývoje. Působení negenetických rizikových faktorů je tedy vždy nutné zohlednit při hledání příčin DID.
1.2.1. Negenetické faktory Mnoho rizikových negenetických faktorů může být při jejich včasné identifikaci eliminováno a kompenzováno. Patří sem zejména prenatální rizika ovlivňující fyziologický průběh gravidity, perinatální rizika spojena s průběhem porodu a postnatální poranění centrální nervové soustavy (CNS). Metaanalýzou rizikových faktorů byly jako významné rizikové faktory pro DID vyhodnoceny pokročilý věk matky nad 35 let, příslušnost matky k afroamerické a africké populaci, nízká úroveň vzdělání matky, třetí a vyšší parita, abusus alkoholu matky v graviditě, epilepsie matky, předčasný porod, mužské pohlaví a nízká porodní hmotnost (Huang et al., 2016). Plod je během intrauterinního vývoje vystaven četným změnám zdravotního stavu matky a její expozici environmentálním faktorům, přičemž významný negativní vliv na vývoj nervového systému byl prokázán při expozici toxickým látkám (tabák, alkohol) a také v případě metabolického onemocnění matky (diabetes). Kromě pozitivní korelace pokročilého věku matky v době početí nelze zanedbat rovněž vliv pokročilého věku otce. Recentní studie prokázaly pozitivní korelace mezi rostoucím věkem rodičů v době početí a rizikem rozvoje DID, PAS a psychiatrických onemocnění (Janecka et al., 2017). Z perinatálních rizikových faktorů pro DID byl vyhodnocen jako významný předčasný porod před ukončeným 37. týdnem gravidity a nejnovější studie také poukazují na nepříznivý vliv gravidity trvající déle než 42 týdnů (Heuvelman et al., 2018). S předčasným porodem rovněž souvisí vyšší pravděpodobnost nezralosti novorozence a jeho nízká porodní
20 hmotnost jako významný rizikový faktor v neonatálním období vývoje. DID je diagnostikována v přibližně 30 % případů častěji u chlapců než u dívek, avšak tento poměr klesá s rostoucí závažností DID (Lai et al., 2013; Friedman et al., 2018), v případě PAS je tento rozdíl významnější, přibližně 4:1 s převažujícím podílem chlapců (Baio et al., 2018). V rámci uvedené multicentrické studie se rovněž ukázala souvislost mezi PAS a DID, přibližně u 30 % chlapců a 35 % dívek byl prokázán současný výskyt těchto vývojových poruch. Souhrnná data zaznamenala celkově 31 % dětí s PAS a DID (IQ < 70) a dalších 25 % dětí s PAS se z hlediska intelektuálních funkcí pohybovalo na rozhraní normy a DID (IQ 71- 85).
1.2.2. Genetické faktory Genetické faktory představují hlavní příčinu manifestace klinických příznaků DID až u 60 % případů DID, přičemž proporce případů s genetickou podstatou DID narůstá se závažností manifestace klinických příznaků, respektive se stupněm DID (Kaufman et al., 2010; Gilissen et al., 2014). Současné studie prokazují významnou genetickou heterogenitu v patogenezi DID, která zahrnuje široké spektrum početních i strukturních změn chromosomů detekovatelných metodami klasické cytogenetiky, variant v počtu kopií (copy-number variations, CNVs), změn v sekvenci DNA či poruch regulace genové exprese. Vrozené chromosomové aberace byly detekovány u pacientů s DID s vysokou heterogenitou v prevalenci a typech jednotlivých aberací. Frekvence chromosomových aberací se výrazně mění v závislosti na vývojovém období jedince. V prenatálním období představují vrozené chromosomové aberace příčinu 50-60 % předčasně ukončených gravidit v prvním trimestru, avšak u živě narozených dětí se tento počet snižuje pod 1 % (Nielsen and Sillesen, 1975; Mau et al., 1997). Trisomie autosomů slučitelné s postnatálním životem jedince a aneuploidie gonosomů se téměř vždy manifestují určitým poklesem v intelektuálních schopnostech jedince. Trisomie chromosomu 21 je nejčastější genetickou příčinou DID, je detekována u přibližně 10 % všech jedinců s DID (Dolk et al., 2005; Rauch et al., 2006; Rodrigues et al., 2019). Při vyloučení aneuploidií chromosomů lze cytogenetickým vyšetřením karyotypu jedinců s DID stanovit kauzální chromosomovou přestavbu přibližně ve 3 % případů (Shevell et al., 2003; Miller et al., 2010). Již v 30. letech 20. století byla prokázána jasná korelace mezi trisomií chromosomu 21 a vyššího věku matky (Penrose, 2009). Obecné riziko výskytu aneuploidií u klinicky rozpoznaných gravidit významně vzrůstá s věkem matky až k více než 30% riziku u žen starších 40 let (Hassold and Hunt, 2001; Kutteh, 2015). Aneuploidie chromosomů jsou přímým následkem poruchy jejich segregace vlivem změněné dynamiky mikrotubulů dělicího 21 vřeténka během meiózy. Většina aneuploidií chromosomů je spojena s letalitou plodu, avšak i u většiny viabilních jedinců s trisomiemi lze pozorovat závažné DID a asociované VVV (Chiang et al., 2012). I přes existující důkazy o tvorbě gamet disomických pro určité chromosomy (1, 9, 18, 21, X a Y) u mužů vyššího věku nebyla dosud jednoznačně nalezena korelace mezi vyšším věkem otců a vyšším rizikem aneuploidií u jejich potomků (Fonseka and Griffin, 2011; Donate et al., 2016). Klíčový pokrok v identifikaci strukturních genomových variant významných v patogenezi DID a asociovaných abnormalit byl zaznamenán zejména s nástupem metod molekulární cytogenetiky. Tyto technologie vedly k rozšíření poznatků o etiopatogenezi DID na molekulární úrovni a k identifikaci strukturních variant genomu, zejména kryptických mikrodelecí a mikroduplikací, jako zdroje přirozené variability v populaci a genetické diverzity mezi jedinci či jako zdroje klinické manifestace odchylek nad rámec přirozené fenotypové variability.
1.2.2.1. Variabilita v počtu kopií
Varianty v počtu kopií (CNVs) představují oblasti zisků a ztrát genetického materiálu genomu u jedinců v populaci a jsou zastoupeny segmenty DNA většími než 1 kb, jež jsou přítomny ve změněném počtu kopií oproti referenčnímu genomu (Redon et al., 2006). Mohou mít jednoduchou strukturu (tandemové duplikace), nebo naopak mohou zahrnovat komplexní kvantitativní změny homologních sekvencí na mnoha místech genomu. Rozvoj nových technologií analýzy genomu, zejména celogenomového sekvenování (WGS), je spojen se zvýšením citlivosti detekce CNVs menšího rozsahu. Současné definice proto specifikují CNVs jako segmenty DNA větší než 50 bp (Nowakowska, 2017). V lidském genomu se v důsledku jeho specifické architektury vyskytuje přibližně 1500 „hotspot“ oblasti CNVs > 1kb, pokrývající přibližně 12 % jeho velikosti (celkově 360 Mb) (Redon et al., 2006). CNVs zahrnují stovky genů, oblasti asociované s onemocněními, funkční elementy a oblasti repetitivních sekvencí o nízkém počtu kopií (low-copy repeats, LCR), označované také jako segmentální duplikace. CNVs běžně segregují v populaci, avšak u konkrétního jedince mohou také vznikat de novo. Rozsáhlé CNVs vznikají velmi vzácně (0,01-0,02 událostí na jednu generaci), avšak poté se významně podílejí na patogenezi závažných neurovývojových poruch a vývojových vad s časným nástupem v důsledku abnormálního počtu kopií genů a změn v genové expresi. Přítomnost CNVs s klinickým významem je příčinou tzv. „genomových onemocnění“ („genomic disorders“) (Acuna- Hidalgo et al., 2016; Harel and Lupski, 2018). Jejich molekulární patogeneze spočívá
22 zejména v přestavbách genomu v důsledku specifické architektury genomu, jež vede k jeho nestabilitě (Lupski, 2009).
Mechanismy vzniku CNVs Dle mechanismu vzniku lze rozlišit dvě skupiny CNVs: rekurentní a non-rekurentní. Rekurentní CNVs primárně vznikají mechanismem nealelické homologní rekombinace (NAHR) během meiózy mezi LCR v přímé orientaci, které jsou paralogními segmenty se sekvenční identitou > 95 % a délce 10-400 kb (Stankiewicz and Lupski, 2002; Hastings et al., 2009). Pro každou takovou oblast mohou vznikat reciproké přestavby, tedy mikrodelece a mikroduplikace zasahující stejnou oblast genomu. Tento model je prokázán přítomností míst zlomu ve stejné či podobné oblasti genomu u skupin pacientů s rekurentními CNVs pomocí celogenomových analýz s vysokým rozlišením (array-CGH, WGS) (Ritz et al., 2011). Oproti tomu non-rekurentní CNVs se vyskytují v oblastech genomu s velmi nízkým stupněm homologie (2-15 bp), který není dostatečný pro procesy homologní rekombinace, a proto se zde uplatňují procesy zejména nehohomologického spojování konců (non-homologous end joining, NHEJ) či procesy blokování replikační vidlice a změny templátového vlákna během replikace DNA (fork stalling and template switching, FoSTeS) (Lee et al., 2007; Gu et al., 2008; Hastings et al., 2009; Liu et al., 2012). Vznikající přestavby chromosomů mají typicky komplexní charakter a vyznačují se krátkými inzertovanými sekvencemi na místě spojů. V oblastech non-rekurentních CNVs můžeme vzhledem k jejich komplexitě nacházet duplikované či triplikované sekvence, inverze a delece. Vzhledem k obecné vysoké komplexitě lidského genomu a výskytu fragilních míst se mohou mechanismy NHEJ a FoSTes dle Weise et al. (2012) vzácně podílet rovněž na vzniku rekurentních přestaveb. Srovnání základních mechanismů vzniku CNVs je schematicky znázorněno na obr. 2 (Gu et al., 2008; upraveno).
23
Obrázek 2: Srovnání základních mechanismů vzniku CNVs. Zleva: intrachromatidová NAHR mezi LCRs přímé orientace, vedoucí k deleci/duplikaci částí LCRs a sekvenci mezi nimi. Uprostřed: Dvouřetězcové zlomy DNA mezi dvěma nehomologickými sekvencemi. Mechanismem NHEJ jsou upraveny a znovuspojeny konce zlomů, což vede k deleci úseku DNA mezi místy zlomů. Vpravo: Komplexní delece dvou oblastí DNA v důsledku mechanismu FoSTeS. Prázdné trojúhelníky označují oblasti mikrohomologie (2-5 bp) mezi modře a červeně značenou sekvencí DNA. Černé trojúhelníky označují oblasti mikrohomologie mezi červeně a zeleně značenou sekvencí DNA. Replikační vidlice (RV) ze dvou sousedících sekvencí jsou znázorněny stejnou barvou jako výchozí sekvence. RV se vmezeří do sousedící sekvence prostřednictvím mikrohomologie a replikační vidlici v dané sekvenci použije jako templát. Následkem jsou delece fragmentů, které jsou obklopené oblastmi mikrohomologie (Gu et al., 2008; upraveno).
Celogenomové analýzy zaznamenaly poněkud kontroverzní a ne zcela jednoznačné závěry z hlediska parentálního původu de novo CNVs. Studie Ma et al. (2017) prokázala významný rozdíl v distribuci de novo CNVs z hlediska jejich parentálního původu a typu CNVs, kdy byl zaznamenán významně vyšší podíl de novo mikrodelecí lokalizovaných na paternálním chromosomu, kdežto de novo mikroduplikace se významně častěji týkaly lokusů na chromosomech maternálního původu. V této studii byly však významně méně zastoupeny mikroduplikace pravděpodobně kvůli nekompletní penetranci a variabilní expresivitě. Dřívější studie Hehir-Kwa et al. (2011) lokalizovala většinu de novo CNVs na paternální chromosom, a to navíc bez ohledu na jejich typ či velikost. Další analýza v rámci uvedené studie prokázala souvislost vyššího věku otců a výskytem non-rekurentních CNVs. Tento fakt lze vysvětlit vyšším počtem buněčných dělení spermatogonií, což zvyšuje riziko chyb a jejich nedostatečné reparace během replikace DNA. V případech zděděných CNVs byla pozorována 2x vyšší frekvence CNVs maternálního původu bez ohledu na jejich typ (Liehr et al., 2018).
24
Klinický význam CNV a efekt genové dávky Citlivost jednotlivých genů k počtu svých kopií je významným kritériem určujícím míru patogenity dané CNV. Klinicky významné CNVs obvykle obsahují geny citlivé na počet svých kopií, respektive velký počet těchto genů. Geny citlivé na počet svých kopií jsou obvykle evolučně konzervované z hlediska počtu svých kopií a primární struktury a podílí se na vývojových procesech. CNVs bez klinického významu obvykle jsou chudé na geny nebo obsahují geny s variabilním počtem kopií a nízkou evoluční konzervovaností (Rice and McLysaght, 2017). S tímto faktem lze také korelovat velikost CNV a míru její patogenity. Identifikace rozsáhlé CNV je obvykle spojena s patogenním vlivem na fenotyp jedince z důvodu větší pravděpodobnosti výskytu genů citlivých na počet svých kopií, respektive vyššího počtu těchto genů v dané CNV. Citlivost na genovou dávku lze klasifikovat do několika skupin podle efektu, který vyvolá abnormální počet kopií daného genu. Haploinsuficience charakterizuje situaci, kdy jedna funkční alela genu (hemizygotní stav) není schopna zajistit dostatečné množství genového produktu (Veitia, 2002). Dle výsledků studií genetické variability bylo identifikováno více než 3000 lidských genů, které vykazují haploinsuficienci při ztrátě jedné alely, tzv. „geny netolerující ztrátu funkce“ (loss-of- function-intolerant genes, LoF-intolerant genes), přičemž více než 70 % z nich nebylo do té doby identifikováno v souvislosti s lidskými onemocněními (Lek et al, 2016). Heterozygotní varianta spojená s LoF tedy nemusí vždy korelovat s letalitou či patologickými stavy, avšak může přinášet například reprodukční nevýhodu. Oproti tomu nadbytečná kopie genu je vzácněji spojena s patologickými stavy. V důsledku nadbytečné kopie genu může nadbytečné množství genového produktu agregovat nebo interagovat s nesprávnými biomolekulami s nižší afinitou než v případě normálního stavu počtu kopií (Ross and Poirier, 2004; Vavouri et al., 2009). Triplosenzitivita není jediným vysvětlením patogenního efektu duplikací, resp. mikroduplikací. Duplikace většího rozsahu a větší počet genů v dané oblasti duplikace korelují s mírou patogenity, stejně tak patogenita duplikací může spočívat v poruchách genové exprese či disrupce genů v místech zlomů DNA. Míra patogenity může být rovněž ovlivněna orientací duplikovaného segmentu a jeho lokalizací v genomu (Newman et al., 2015). Většina mikroduplikací (> 80 %) vykazuje tandemovou organizaci a přímou orientaci, v menší míře bývají zastoupeny komplexní přestavby zahrnující triplikace, obrácené duplikace, inzerční translokace a další duplikace neznámé struktury. Místa zlomů jsou obvykle unikátní pro každého jedince s danou CNV, identitu míst zlomů u nepříbuzných jedinců lze pozorovat v případě CNVs představujících populační polymorfismy.
25
Z hlediska klinické praxe každá CNV vyžaduje interpretaci vedoucí k posouzení genotypově-fenotypové korelace. V procesu stanovení klinického významu daných CNVs by měla být zohledněna klasifikační kritéria klinického významu CNVs dle doporučení Buysse et al. (2009), která v sobě zahrnují: 1) identifikaci známých CNVs spojených s rekurentními mikrodelečními a mikroduplikačními syndromy na základě informací v databázích genomických variant (např. DECIPHER - Firth et al., 2009) a identifikaci známých oblastí spojených s DID a asociovanými VVV dle charakteru genů lokalizovaných v CNVs (databáze OMIM - Hamosh et al., 2002), 2) odlišení běžných polymorfních CNVs od vzácných CNVs na základě informací z databází genomových variant či interní databáze dané laboratoře, 3) stanovení původu nepolymorfních CNVs na základě vyšetření rodičů daného pacienta. S ohledem na interpretaci CNVs ve smyslu korelace genotypu s fenotypem jedince je nezbytné posuzovat míru patogenity dané CNV s informacemi o jejich původu. CNVs mohou být u vyšetřovaného jedince původu de novo, nebo mohou být zděděny od rodiče. Při potvrzení familiální segregace CNV je třeba znát osobní anamnézu rodiče, eventuálně širší rodinnou anamnézu v případě výskytu CNV u dalších příbuzných. Při zohlednění výše uvedených kritérií a dle doporučení pro systematickou klasifikaci jsou poté CNVs zařazeny do klasifikačních skupin dle svého klinického významu. Dle výsledků rozsáhlých studií bylo publikováno několik systémů klasifikace do různého počtu tříd, přičemž se vychází z modelu navrženého ve studii Buysse et al. (2009). V roce 2019 byla vydána „European guidelines for constitutional cytogenomic analysis“, kde je navržena klasifikace CNVs do pěti skupin na základě rozdílů v četnosti jejich výskytu v populaci a postiženými jedinci (Nowakowska, 2017; Silva et al., 2019):
1) Benigní CNVs: frekvence daných CNVs u jedinců s patologickým fenotypem se shoduje s populační frekvencí, jsou opakovaně detekovány u jedinců s normálním fenotypem 2) Pravděpodobně benigní CNVs: neobsahují geny, ale jejich velikost překračuje hodnotu pro reportování 3) Varianty nejasného významu (variant of unclear significance, VOUS): obsahují geny s neznámou citlivostí na počet kopií („dosage sensitivity“), není zcela objasněn jejich funkční význam. CNVs klasifikovány jako VOUS mohou být přeřazeny do kategorií benigní či patogenní s ohledem na aktuální informace z relevantní vědecké literatury (Vermeesch et al., 2012; Westerfield et al., 2014).
26
4) Pravděpodobně patogenní CNVs: daná CNV byla detekována u pacienta s podobným fenotypem, nebo gen lokalizovaný uvnitř CNV kóduje produkt s funkcí vztahující se k fenotypu vyšetřovaného jedince 5) Patogenní CNVs: patogenita CNV je doložena její přítomností u jedinců s patologickým fenotypem. Patří sem rovněž CNVs s neúplnou penetrancí a variabilní expresivitou.
Rozsáhlé studie prokázaly přibližně 15-20% podíl klinicky významných CNVs na patogenezi DID a asociovaných VVV (Miller et al., 2010). Intepretace nálezu CNVs by vždy měla probíhat dle výše uvedených kritérií. S rostoucími poznatky je doporučeno informace o vzácných CNVs zpřístupnit prostřednictvím veřejných databází genomových variant (Nowakowska, 2017).
1.2.2.2. Změny primární struktury DNA
Významný zdroj variability lidského genomu mezi jednotlivci v populaci představují změny na úrovni sekvence DNA. V genetické informaci přenášené napříč generacemi skrze gamety vznikají během gametogeneze nebo postzygoticky během embryogeneze nové varianty měnící sekvenci DNA, z nichž některé mají potenciál měnit strukturu a funkci genových produktů či genovou expresi. Sekvenční varianty vznikající v buňkách zárodečných tkání mohou být přeneseny do dalších generací. Nové sekvenční varianty v DNA somatických buněk mohou být příčinou vzácných onemocnění postihujících specifické tkáně či se podílet na nádorové transformaci (Erickson, 2003; Luzzatto, 2011). Projekt 1000 Genomes charakterizoval variabilitu lidského genomu prostřednictvím WGS, WES a genotypizace pomocí mikročipů analýzou DNA více než 2 500 jedinců z 26 populací (1000 Genomes Project Consortium et al., 2015). Bylo popsáno více než 88 milionů variant, zahrnující 84,7 milionů jednonukleotidových polymorfismů (single-nucleotide polymorphism, SNP), 3,6 milionů krátkých insercí či delecí (indel) a 60 000 strukturních variant. Průměrný lidský genom se odlišuje až na 5 milionech nukleotidových pozicích oproti referenční sekvenci. Většina této variability má charakter polymorfismů a je sdílena s více než 0,5 % jedinců v populaci. Avšak v lidském genomu se rovněž nachází průměrně až 200 000 vzácných variant s frekvencí výskytu menší než 0,5 % v populaci. Frekvence vzniku de novo jednonukleotidových variant (single-nucleotide variant, SNV) je odhadována na 1-1,8×10-8 na nukleotid a jednu generaci, což v přepočtu znamená 44-82 de novo SNVs v genomu každého jedince, z toho 1 až 2 SNVs zasahují kódující
27 sekvence (Acuna-Hidalgo et al., 2016; Goldmann et al., 2016). Varianty v sekvenci DNA, jež se projeví příznivým působením na fenotyp jedince, se propagují přenosem napříč generacemi, kdežto varianty se škodlivým vlivem na zdraví či reprodukci podstupují purifikující selekci, čímž je omezen jejich přenos do další generace potomstva (Hurst, 2009; Fu and Akey, 2013). Zisk či ztráta určité vlastnosti znaku u jedince se může projevit formou patologie, avšak na úrovni populací je hnací silou evoluce druhů. Přínos celogenomových „trio-based“ analýz (jedinec s DID a jeho rodiče) spočívá rovněž v bližší charakteristice de novo variant, zejména ve stanovení rodičovského původu (lokalizace na maternální, či paternální alele), resp. zárodečného či postzygotického původu. Přibližně 80 % zárodečných variant je lokalizováno na alele paternálního původu, přičemž jako hlavní rizikový faktor pro zvýšený počet de novo patogenních sekvenčních variant u potomstva je považován vyšší věk otce při početí (Neale et al., 2012; Acuna-Hidalgo et al., 2016). Spermatogonie podstupují buněčná dělení v průběhu celého života, tím dochází k progresivní akumulaci patogenních sekvenčních variant během replikace DNA a současně klesá efektivita mechanismů opravujících nereplikativní poškození DNA. Studie 78 islandských rodin navíc prokázala, že se vzrůstajícím věkem otce se každoročně lineárně zvyšuje počet o 2 de novo patogenní sekvenční varianty u nově počatých dětí, respektive se zdvojnásobuje počet de novo patogenních sekvenčních variant paternálního původu každých 16,5 roku (Kong et al., 2012). Další studie tyto poznatky potvrdily analýzou věkově odlišných skupin rodičů. Bylo prokázáno, že děti otců starších 40 let v době početí nesou ve svém genomu skoro dvojnásobný počet de novo patogenních sekvenčních variant paternálního původu než děti otců mladších o 20 let. Studie Wong et al. (2016) a Girard et al. (2016) tyto korelace rozšířily o menší, avšak rovněž významný vliv vyššího věku matky při početí potomka. Výskyt de novo patogenních sekvenčních variant maternálního původu vykazuje spíše exponenciální růst se vzrůstajícím věkem matky. Tento jev může být dle závěrů studie Wong et al. (2016) následkem vyšší citlivosti maternálních zárodečných buněk k akumulaci spontánních patogenních sekvenčních variant během života, rovněž zygoty pocházející ze zárodečných buněk matek vyššího věku mohou vykazovat vyšší rychlost tvorby nových variant. Předchozím studiem myších oocytů byl také prokázán vyšší počet buněčných dělení během oogeneze až do tvorby zygoty u starších matek (Reizel et al., 2012). Recentní komplexní studie Gao et al. (2019) odhalila, že významný podíl zárodečných patogenních sekvenčních variant není důsledkem pouze poruch replikace při spermatogenezi, ale také metabolických procesů při buněčném dělení a neopravených lézí DNA. Daná studie zabývající se vznikem de novo patogenních sekvenčních variant též prokázala nevýznamný
28 efekt reprodukčního věku na poměr variant paternálního či maternálního původu a na jejich vzrůstající počty. Také navíc naznačila vliv věku matky na počet patogenních sekvenčních variant postzygotického původu v obou rodičovských genomech. Na základě poznatků v dané studii lze uvažovat vliv věku matky na mutagenezi během raného embryonálního vývoje potomka. Tyto poznatky se významně odlišují od vlivu vyššího věku rodičů na vyšší riziko přítomnosti aneuploidií a vzácných CNVs u potomstva pravděpodobně z důvodu jiného mechanismu vzniku. Recentní studie dokumentují rostoucí význam sekvenčních variant postzygotického původu v patogenezi PAS (Pieras et al., 2011; Alonso-Gonzalez et al., 2018). Vznikají během mitotických dělení buněk embrya a v těle jedince určitý podíl buněk poté nese danou sekvenční variantu (Biesecker and Spinner, 2013), přičemž vývojové období a zasažené buněčné linie mohou implikovat závažnost postižení. Význam mosaicistních sekvenčních variant byl rovněž prokázán v patogenezi dalších neurovývojových poruch (epilepsie, malformace mozkové kůry, RASopatie) (Alonso-Gonzalez et al., 2018).
Mechanismy vzniku sekvenčních variant Oproti vzniku CNVs během meiózy vlivem procesů NAHR, NHEJ či během replikace DNA procesem FoSTeS je původ většiny SNVs či indelů (insercí/delecí) následkem chyb během replikace DNA a nedostatečné kapacity opravných mechanismů. Replikace DNA je katalyzována DNA polymerázami a s vysokou přesností jedné chyby na 104-105 bp (Ségurel et al., 2014), přičemž korektorská aktivita („proofreading“) obou enzymů kontroluje správnost zařazení jednotlivých bází dle komplementarity. Chyby v replikaci DNA jsou opravovány vysoce efektivním procesem „mismatch“ reparací, což vysvětluje nízkou frekvenci výskytu de novo sekvenčních variant (1-1,8×10-8/nukleotid/generace) oproti uvedené chybovosti procesu replikace DNA. Na vzniku de novo sekvenčních variant se také podílí zařazení poškozených nukleotidů během replikace s následným chybným párováním a substitucemi bází (Maki, 2002). Během života je lidský organismus vystaven působení agens s mutagenním potenciálem. Vznikající patogenní sekvenční varianty jsou opravovány odlišnými procesy před samotnou replikací DNA, a to zejména mechanismy nukleotidové a bázové excizní reparace. V případě nedostatečné reparace mohou jednotlivé buňky podléhat buněčné smrti (Gao et al., 2016). Přesnost procesů reparace a replikace DNA je nižší v oblastech genomu s vyšší diversitou a navíc byly sekvenční varianty detekovány v oblastech s místy zlomu typickými pro CNVs, což poukazuje na potenciál sekvenčních variant výrazně ovlivňovat a
29 kumulovat vznik dalších variant na úrovni sekvence DNA či variant měnících strukturu chromosomů (Conrad et al., 2010).
Klinický význam sekvenčních variant DNA v patogenezi DID a PAS Přístupy celogenomových analýz (WGS, array-CGH) a celoexomového sekvenování (WES) bylo identifikováno více než 2000 genů s významem v patogenezi DID a asociovaných VVV, přičemž jsou zde zahrnuty geny s prokázaným významem v patogenezi DID a rovněž kandidátní geny. Komplexní informace o genech popsaných v patogenezi DID jsou integrovány v databázích, například v databázi SysID, jež je spravována nizozemským výzkumným univerzitním centrem Radboudumc a jeho odděleními CMBI a Human Genetics Nijmegen a výzkumným konsorciem GENCODYS (https://sysid.cmbi.umcn.nl/, Kochinke et al., 2016). Dle aktualizace ze dne 5. srpna 2019 je v této databázi uvedeno 1257 genů popsaných v patogenezi DID a 1141 kandidátních genů. Jedná se o protein-kódující geny, geny pro nekódující RNA (miRNA a RNA složky endonukleázy uplatňující se v biogenezi mitochondriální RNA) a pro mitochondriální tRNA. Jejich funkční kategorizace a objasnění procesů, v nichž jsou zapojeny, poskytuje zásadní informace pro identifikaci a popis buněčných a molekulárních mechanismů nejen u genů se známých významem v patogenezi DID, ale rovněž u kandidátních genů. Bylo popsáno několik tříd biomolekul účastnících se různých esenciálních buněčných procesů, jimiž je řízena a regulována morfologie neuronů a jejich vzájemná komunikace a interakce. Biomolekulární komplexy jsou lokalizovány na synapsích a z hlediska jejich funkce a podle procesů, jichž se účastní, je lze rozdělit do tříd: 1) morfologie neuronů, synaptická plasticita a kognitivní poruchy, 2) regulace dynamiky cytoskeletu, 3) cyklování presynaptických veziklů a exocytóza, 4) regulace translace, degradace proteinů a turnover, 5) molekuly buněčných adhezí v procesech signalizace přes synapse (Srivastava and Schwartz, 2014). Geny s klinickým významem v patogenezi DID a PAS jsou zapojeny v mnoha fyziologických procesech vývoje CNS a jejích efektorových funkcích. Mnohé rovněž propojují jednotlivé signální dráhy, což může modifikovat jednotlivé neuronální funkce. Porozumění uvedeným drahám a z nich se odvíjejícím buněčným a molekulárním mechanismům vývoje a funkce CNS může představovat první krok ve vývoji potenciálních terapeutických přístupů zlepšujících kvalitu života pacientů s DID a asociovanými VVV, což nastínily nedávné studie na modelových systémech (Picker and Walsh, 2013).
30
1.2.2.3. Nemendelistická dědičnost
Nemendelistická segregace onemocnění v rodinách a různá míra klinické manifestace fenotypových projevů spolu s jejich variabilitou představují komplikace v klinické i molekulární diagnostice DID. Klinickou interpretaci asociovaných genetických variant ve vztahu k fenotypu jedince komplikují zejména model multifaktoriální dědičnosti, mitochondriální dědičnost, genomový imprinting a expanze trinukleotidových repetic.
Model multifaktoriální dědičnosti Částečné vysvětlení nemendelistické segregace onemocnění v rodinách s sebou přinesl model „dvou zásahů“, respektive model „více zásahů“, který uvažuje vlivy nekompletní penetrance a variabilní expresivity detekovaných variant a fenotypový projev onemocnění podmiňuje přítomností nejméně dvou událostí. Tyto události mohou mít charakter genetických variant i environmentálních faktorů (Girirajan et al., 2010; Girirajan and Eichler, 2010; Girirajan et al., 2012; Karaca et al., 2018). V souvislosti s uvedeným modelem byla identifikována skupina rekurentních CNVs označována jako rizikové lokusy („susceptibility locus“ nebo „risk locus“). Vyznačují se nízkou mírou penetrance a pro jejich klinickou manifestaci ve formě pozměněných intelektuálních funkcí či chování u daného jedince je nutná přítomnost minimálně jednoho dalšího zásahu ve formě rozsáhlé CNV (> 500 kb) či sekvenční varianty v genu vztahujícím se k fenotypu jedince nebo environmentálního vlivu působícího na fenotyp. Fenotypová variabilita jedinců nesoucí rekurentní CNVs může být vysvětlena nejméně dalšími třemi modely: 1) fenotypový projev recesivní patogenní sekvenční varianty v lokusu s mikrodelecí, 2) SNV v regulační oblasti CNV ovlivňující expresi genů uvnitř daného lokusu, 3) různé velikosti CNVs vedoucí k odlišným fenotypovým projevům, 4) genomový imprinting v oblasti mikrodelece (obr. 3).
31
Obrázek 3: Příčiny fenotypové variability u jedinců s rekurentními patogenními CNVs. A) Přítomnost recesivní sekvenční varianty na druhé alele v lokusu s mikrodelecí, B) sekvenční varianta v regulační oblasti genu uvnitř CNV (zde mikrodelece), C) různá velikost CNVs s různými fenotypovými projevy, D) genomový imprinting v oblasti mikrodelece, e) klasický model dvou zásahů (Girirajan and Eichler, 2010; upraveno).
Mitochondriální onemocnění Aktivita mitochondrií hraje hlavní úlohu v neurogenezi a synaptické plasticitě, kdy představují hlavní zdroj energie za spotřeby kyslíku. Energie ve formě ATP je spotřebována na tvorbu aktinového cytoskeletu při tvorbě růstového konusu u axonů, při sestavování presynaptických kompartmentů, tvorbě membránového potenciálu, recyklaci synaptických vezikulů, endocytóze a mnoha dalších buněčných procesech. Deficit energie a oxidativní stres, tj. produkce reaktivních kyslíkových radikálů, s dopadem na intelektuální funkce jedince patří k významným příčinám neurovývojových poruch včetně DID (Valenti et al., 2014). Mimo snížení intelektuální funkcí se nedostatek energie vlivem dysfunkce mitochondrií projevuje rovněž hypotonií, poruchami koordinace pohybu, kardiomyopatiemi či laktátovou acidózou. Z tkání jsou postiženy zejména tkáně s vysokou spotřebou kyslíku a vysokou metabolickou aktivitou (CNS, srdce, svalstvo, ledviny). Kvantitativní molekulárně genetické analýzy prokázaly abnormální počet kopií mitochondriální DNA (mtDNA) u jedinců s DID a PAS. Pomocí přístupu hlubokého NGS cíleného na mtDNA byly detekovány putativní patogenní sekvenční varianty u více než 25 %
32 jedinců s PAS a více než 30 % jedinců s DID při úrovni heteroplazmie vyšší než 60 % (Valiente-Pallejà et al., 2018). Recentní studie na experimentálních modelech prokázaly silnou asociaci mitochondriálních dysfunkcí s patogenezí Downova syndromu (Helguera et al., 2013). Jsou spojeny zejména s vysokým oxidativním stresem v důsledku nadprodukce reaktivních kyslíkových radikálů (Valenti et al., 2011). Význam dysfunkce mitochondriálních aktivit byl rovněž prokázán v patogenezi Rettova syndromu, syndromu fragilního X a u PAS. Etiologie PAS se vyznačuje výraznou mírou heterogenity na úrovni genetických variant a s tím související variabilitou manifestace klinických příznaků. U některých jedinců s PAS byly pozorovány metabolické poruchy v důsledku dysfunkce mitochondrií, související s abnormálními hladinami laktátu, pyruvátu, alaninu či kyseliny močové. Identifikace podskupin pacientů PAS s kombinovaným postižením je zásadní pro volbu optimální terapie v rámci diferenciální diagnostiky (Frye et al., 2013).
Genomový imprinting Genomový imprinting představuje unikátní způsob epigenetické regulace u živočichů a vyšších rostlin. Svými mechanismy vede k preferenční parentálně-specifické monoalelické expresi genů během vývoje CNS a jejich funkcí v postnatálním období života. V postnatálním období života se genomový imprinting uplatňuje v základních procesech přenosu signálu přes synapse, v synaptické plasticitě, řízení energetické rovnováhy a metabolismu a také ve vyšších funkcích CNS zahrnujících emoční a sociální chování a kognitivní funkce (Perez et al., 2016). Z hlediska vyšších funkcí se produkty genů exprimované ze své paternální alely dále účastní procesů regulace dospívání, reprodukčního a mateřského chování, kdežto genové produkty exprimované z maternální alely hrají klíčovou úlohu v pozitivní a negativní regulaci emočního chování či kognitivních schopností. Dysregulace exprese genů podléhajících genomovému imprintingu jsou následkem absence funkční neimprintované kopie genu, duplikací imprintované oblasti, uniparentální disomie či změn v epigenetických značkách (Eggermann et al., 2015). V současnosti je známo jen kolem deseti syndromických poruch imprintingu spojených s DID, avšak již více než 200 známých či kandidátních genů, jejichž exprese je regulována genomovým imprintingem (Mayo et al., 2015). Pro svoji významnou klinickou závažnost jsou dané neurovývojové poruchy předmětem vývoje terapeutických postupů ve smyslu reaktivace exprese reprimované alely (Perez et al., 2016).
33
Expanze trinukleotidových repetic Přítomnost nestabilních trinukleotidových repetic (TNR) spojená s jejich abnormální expanzí je popisována jako kauzální genetická varianta více než 20 neurologických onemocnění či vývojových poruch. Jako první onemocnění v této kategorii byl popsán syndrom fragilního X. Jeho frekvence je odhadována kolem 1:4000-1:5000 u mužů a po trisomii chromosomu 21 je u nich druhou nejčastější příčinou DID (Hunter et al., 2014). Expanze TNR spojené s patologiemi se vyskytují v kódujících i nekódujících oblastech kauzálních genů a narušují regulaci jejich genové exprese. Počet TNR se dynamicky mění v závislosti na lokalizaci vně či uvnitř kódující oblasti (McMurray, 2010). TNR uvnitř kódujících sekvencí se stávají nestabilními při počtu kolem 29-35 a jejich počet se mění o méně než 10 TNR v další generaci do stavu premutace či plné mutace. Familiální přenos TNR v nekódujících oblastech genu je iniciován od stavu premutace TNR a narůstá až o 100-10 000 TNR za generaci. Po překročení mezní hodnoty narůstá pravděpodobnost expanze a další nestability. V případě dynamického přenosu TNR do další generace asociovaná onemocnění vykazují dřívější a závažnejší klinickou manifestaci, tzv. genetickou anticipaci (Wells, 1996). Na funkční úrovni se TNR poté projevují ziskem či ztrátou funkce daných proteinů (Budworth and McMurray, 2013; Nelson et al., 2013).
34
1.3. Metodické přístupy analýzy genomu jedinců s DID
Metody genetické analýzy se staly standardním přístupem pro vyšetření dětí s idiopatickými DID a asociovanými VVV. Identifikace příčinné souvislosti mezi genetickým založením jedince a jeho fenotypem vykazujícím patologické znaky umožňuje stanovení diagnózy na molekulární úrovni až u 50-60 % jedinců s DID. Současné studie prokazují významnou genetickou heterogenitu v patogenezi DID, která zahrnuje široké spektrum početních i strukturních změn chromosomů detekovatelných metodami klasické cytogenetiky, submikroskopických přestaveb chromosomů typu CNVs, změn na úrovni sekvence DNA či poruch regulace genové exprese (Durkin, 2002). Před nástupem metod pro komplexní analýzu genomu existovaly značné rozdíly v epidemiologických datech, které byly způsobeny variabilitou zkoumaných populací, metodami klinické diagnostiky a klasifikace, dostupností technologií pro analýzu genomu a jejich vhodným využitím. Postižení jedinci obvykle podstupují široké spektrum klinických vyšetření na úrovni multioborové spolupráce.
1.3.1. Cytogenetické vyšetření
Pro pacienty s klinickým obrazem, který odpovídá specifickému syndromu spojenému se známou chromosomovou abnormalitou, se metody klasické cytogenetiky či analýzy přestaveb chromosomů metodami fluorescenční in situ hybridizace (fluorescence in situ hydridization, FISH) a MLPA (multiplex ligation-dependent probe amplification) staly základním genetickým vyšetřením. Cytogenetické vyšetření karyotypu metodou G-pruhování s citlivostí přibližně 5-10 Mb umožňuje vizualizaci chromosomů za účelem detekce změn v počtu a struktuře chromosomů. Před nástupem technologií celogenomového screeningu nebalancovaných submikroskopických chromosomových přestaveb představovalo vyšetření karyotypu po několik desítek let test první volby, avšak s nízkým diagnostickým záchytem 3-4 % při vyloučení známých syndromů spojenými s aneuploidemi chromosomů (Miller et al., 2010). Dle doporučení uvedeného v uvedené studii by vyšetření karyotypu mělo být vyhrazeno primárně pro pacienty s vysoce suspektními syndromy spojenými s aneuploidiemi chromosomů, dále pro pacienty s familiálním výskytem přestaveb chromosomů a s anamnézou opakovaných abortů.
35
1.3.2. Metody molekulární cytogenetiky
1.3.2.1. Metoda FISH Metoda FISH je založena na principu hybridizace fluorescenčně značené DNA sondy k cílovému místu na cytogenetickém preparátu (Volpi and Bridger, 2008). Pro tento účel se používají komerčně dostupné sondy pro rutinní diagnostiku či sondy vyráběné dle specifikace. Sondu zde představuje oblast DNA komplementární k cílovému místu na cytogenetickém preparátu, které je značena fluorescenční značkou. Vyšetřovaným materiálem jsou interfázní jádra nebo chromosomy v metafázi na cytogenetickém preparátu. Uplatnění metody FISH v molekulární diagnostice DID spočívá v potvrzení či vyloučení diagnosy suspektního rekurentního mikrodelečního syndromu a k detekci submikroskopických přestaveb subtelomerických oblastí chromosomů. Oblasti subtelomer se vyznačují vysokou hustotou genů, jejich submikroskopické přestavby se vyskytují přibližně u 7-10 % jedinců s DID a asociovanými abnormalitami (Dawson et al., 2002). V návaznosti na cytogenetické vyšetření karyotypu se metoda FISH rutinně využívá k potvrzení či upřesnění cytogenetických nálezů strukturních či početních změn chromosomů (translokací a aneuploidií) a v neposlední řadě pro určení stupně mozaicismu pro danou chromosomovou aberaci (Ratan et al., 2017). Kromě potvrzení cytogenetických nálezů ji lze použít pro potvrzení nálezů aneuploidií detekovaných metodou kvantitativní fluorescenční polymerázové řetězové reakce (quantitative fluorescence polymerase chain reaction; QF-PCR), zejména v případech selhání kultivace buněk pro cytogenetické vyšetření karyotypu nebo při časové tísni. Výhoda metody FISH spočívá v rychlosti vyšetření, kdy výsledek vyšetření může být znám již za několik hodin od přijetí požadavku, a v jednoduchém hodnocení nálezů při standardní kvalitě cytogenetických preparátů. Mezi hlavní nevýhody se řadí omezené využití pouze pro definované případy kryptických přestaveb chromosomů, nemožnost detekce tandemových mikroduplikací a v případě strukturních změn chromosomů nemožnost přesného určení jejich rozsahu spolu se zasaženými geny. Metoda celochromosomové FISH je limitována velikostí přestaveb (> 5-10 Mb) a také využitelností pouze na metafázních chromosomech.
1.3.2.2. Metoda MLPA Metoda MLPA je semikvantitativní metoda vycházející z principu PCR. Její princip spočívá v ligaci dvou těsně přiléhajících sond a jejich následné amplifikaci. Nejčastěji nachází své uplatnění v detekci rekurentních mikrodelečních a mikroduplikačních syndromů, CNVs v subtelomerických oblastech chromosomů a při stanovení metylačního stavu u onemocnění
36 spojených s poruchou genomového imprintingu, v detekci aneuploidií a SNPs (Kirchhoff et al., 2007). Pro každou aplikaci je nyní dostupných několik sad podle požadovaných vyšetření. Při standardní kvalitě výstupů analýzy musí být následně všechny výsledky hodnoceny vzhledem ke kontrolním vzorkům a vzájemně mezi sebou pro vyloučení variability v rámci jedné analýzy. Výhodou analýz metodou MLPA je rychlý screening vybraných oblastí genomu vyžadující malé množství DNA. Vzhledem k omezenému množství sond v rámci jedné analýzy nelze v případě verifikace CNV určit její přesný rozsah ani zasažené geny. Metodou MLPA rovněž nelze detekovat změny mimo oblasti vymezené sondami, balancované přestavby ani mozaicismus. Spolehlivost výsledků metody MLPA snižují vzorky DNA o nízké kvalitě a jejich nepřesná kvantifikace, nevhodné kontrolní vzorky a technologické artefakty. Samotnými analýzami subtelomerických oblastí metodami FISH či MLPA jako metodami první volby lze objasnit genetickou příčinu DID a asociovaných VVV u přibližně 5-6 % dětí (Kirchhoff et al. 2007), při kombinací vyšetření karyotypu a cíleného screeningu specifických oblastí chromosomů metodami molekulární cytogenetiky lze identifikovat chromosomové abnormality u přibližně 8-10 % dětí s DID (De Vries et al., 2003; Lam et al., 2006).
1.3.2.3. Metoda array-CGH Využití metody array-CGH pro celogenomový screening nebalancovaných submikroskopických přestaveb chromosomů znamenalo revoluční krok v molekulárně diagnostickém algoritmu pro vyšetřování dětí s idiopatickými DID (Solinas-Toldo et al., 1997; Thuresson et al., 2007). V současnosti představuje metodu první volby a v mnoha laboratořích již zcela nahradila cytogenetické vyšetření karyotypu (Battaglia et al., 2013). Zavedení technologie array-CGH způsobilo přelom v molekulární diagnostice pacientů s DID a přispělo k identifikaci širokého spektra patogenních mikrodelecí a mikroduplikací (Di Gregorio et al., 2014). Metoda array-CGH je založena na kvantitativním srovnání dvou odlišně značených vzorků genomové DNA vyšetřovaných buněk a referenční genomové DNA. Oba vzorky DNA jsou kohybridizovány na pevný podklad mikročipu. Mikročip představuje obvykle mikroskopické sklo se speciální povrchovou úpravou, na němž jsou imobilizovány DNA fragmenty. Současné technologie výroby DNA mikročipů využívají zejména oligonukleotidové fragmenty (Lucito et al., 2003). Rozlišení mikročipu je dáno pouze velikostí daných fragmentů DNA a hustotou pokrytí genomu těmito fragmenty. Dle „European guidelines for constitutional cytogenomic analysis“ (Silva et al., 2019) je doporučeno využívat DNA mikročipové platformy s rozlišením 200-400 kb pro účely 37 postnatální diagnostiky, respektive 400-600 kb pro účely prenatální cytogenetiky. Tyto požadavky splňují DNA mikročipy pokryté nejméně 60 000 oligonukleotidovými sondami. Rozvoj technologie obohatil DNA mikročipové platformy o detekci oblastí genomu se ztrátou heterozygotnosti bez ztráty počtu kopií (copy-number neutral loss of heterozygosity, cnnLOH). Pro detekci cnnLOH se využívá přítomnosti SNPs v konkrétních oblastech genomu. Informace o genotypu daných SNPs v testované DNA jsou následně vyhodnoceny v rámci softwarového zpracování dat společně s informacemi o CNVs. Detekce cnnLOH nachází uplatnění při screeningu uniparentální disomie celých chromosomomů nebo jejich částí. V případech SNP analýzy pacienta a jeho rodičů lze rovněž identifikovat parentální původ de novo CNV. Znalost o oblastech cnnLOH v případech familiálního výskytu příbuzenských svazků umožňuje vytipovat geny spojené s autosomálně recesivními onemocněními pro další molekulárně genetické analýzy sloužící k identifikaci patogenní sekvenční varianty. Dle uvedených doporučení a studií by měl být nález cnnLOH reportován v případě velikosti 5-10 Mb nebo pokud oblast cnnLOH zasahuje více než 1 % genomu vyjma gonosomů (de Leeuw et al., 2011; D’Amours et al., 2014; Silva et al., 2019). Další výhoda array-CGH spočívá v detekci mozaicismu až na úroveň 10% zastoupení CNVs ve vzorku testované DNA (Hoang et al., 2011). Současná detekce nebalancovaných CNVs a oblastí cnnLOH v rámci jedné analýzy celého genomu objasnila klinický význam mnoha chromosomových přestaveb, což podtrhuje její význam v identifikaci nových kandidátních lokusů významných v patogenezi DID. Rozsáhlé multicentrické studie prokazují významné zvýšení diagnostického záchytu na 10-25 % u dětí s DID s normálním karyotypem (Thuresson et al., 2007; Miller et al, 2010; Schaaf et al., 2011). V mnoha ohledech metoda array-CGH předčila rovněž cílené molekulárně cytogenetické metody FISH a MLPA a stala se metodou první volby pro vyšetření dětských pacientů s normálním karyotypem a konfirmační metodou u dětských pacientů s abnormálním karyotypem s nebalancovanými přestavbami chromosomů, která splňuje požadavky na robustnost, finanční výhody a diagnostickou efektivitu. Přes značný pokrok v rozvoji citlivých analýz genomu a jejich zavedení do molekulární diagnostiky přibližně u 50 % případů dětí s DID zůstává neobjasněna jejich genetická podstata (Leonard and Wen, 2002; Kaufman et al., 2010). Tato skutečnost znamená velkou výzvu a příležitost pro výzkum genetických příčin DID na úrovni sekvence DNA a hledání kandidátních lokusů významných v patogenezi těchto onemocnění. Pomocí metody WES byla objasněna molekulární podstata u přibližně 50 % dětí se závažnou DID
38 prostřednictvím identifikace de novo variant ve známých či kandidátních genech pro tyto patologické stavy (Wieczorek, 2018; Wright et al., 2018). Nezbytný krok v molekulárně diagnostickém algoritmu představují konfirmační analýzy nálezů daných submikroskopických chromosomových přestaveb u pacienta a jeho rodičů, které potvrzují diagnózu na molekulární úrovni a upřesňují její kauzalitu. V tomto kroku nachází své uplatnění cílené metody fluorescenční in situ hybridizace (FISH), MLPA a metoda relativní kvantifikace pomocí polymerázové řetězové reakce (quantitative polymerase chain reaction, qPCR). V návaznosti na vyšetření metodou array-CGH je využití metody FISH omezeno na případy cytogeneticky detekovatelných či kryptických translokací chromosomů, rekurentních mikrodelečních syndromů, respektivě obecně spektrem dostupných sond pro dané chromosomové přestavby. V případě metody MLPA jako konfirmační metody pro detekci CNV u pacienta a jeho rodičů je vyšetření omezeno na oblasti genomu, pro nějž jsou k dispozici diagnostické sady. Metoda qPCR překonává svými možnostmi limitace metod FISH a MLPA spočívající v omezeném spektru CNVs, které mohou být těmito metodami verifikovány, a současně představuje jejich časově a finančně efektivní alternativu (Yu et al., 2009; Wang et al., 2013). Oproti metodě FISH nevyžaduje přípravu cytogenetických preparátů a překonává její omezení kvantitativní analýzy tandemových mikroduplikací. Ve srovnání s metodou MLPA jsou jejími přednostmi zejména finanční nenáročnost. Metoda qPCR je založena na semikvantitvní analýze vybraných oblastí genomu vymezených DNA primery dle specifické lokalizace verifikovaných CNVs. V průběhu exponenciální amplifikace molekul produktu PCR jsou do nich interkalovány molekuly fluorescenčního cyaninového barviva SYBR Green, čímž narůstá míra fluorescence, která je detekována pomocí optických čidel v reálném čase.
Z průběhu amplifikačních křivek a hodnot threshold cyklů (cycle threshold, Ct) je vypočítána hodnota R a dle jejích hodnot je stanovena ztráta sekvence DNA (< 0,7), resp. zisk sekvence DNA (> 1,3) v oblasti vymezené DNA primery. Přednosti této metody ji předurčují k rutinnímu využití v rámci verifikace nálezů CNVs a stanovení jejich původu.
39
1.3.3. Metoda sekvenování „nové generace“ (NGS) Od svých počátků na přelomu 20. a 21. století znamenal rozvoj metod sekvenování „nové generace“ (Next Generation Sequencing, NGS) zásadní pokrok ve studiu variability lidského genomu a brzy nato metody NGS rozšířily molekulárně diagnostický algoritmus vyšetřování dětí s DID o paralelní analýzu sekvence DNA mnoha oblastí genomu v rámci jednoho vyšetření. Technologický a diagnostický pokrok metod NGS spočívá v detekci variant na úrovni sekvence DNA při rozlišení až na jeden nukleotid, což mimo jiné vedlo ke změně pojetí definice CNVs jako strukturních změn genomu větších než 50 bp (Hehir-Kwa et al., 2015; Nowakowska, 2017). Právě v omezené spolehlivosti detekce CNVs menších než 50 bp tkví jedna z hlavních limitací využití NGS jako technologie pro univerzální komplexní analýzu genomu, a proto je doporučováno využití dalších molekulárně genetických metod, čímž rostou finanční, časové a personální požadavky (Kerkhof et al., 2017). Zmíněné pokroky znamenaly významné rozšíření poznatků o molekulární patogenezi DID, neboť přispěly k identifikaci nových kandidátních genů či oblastí nekódující DNA s potenciálním klinickým významem. Současné studie popisují více než 650 genů spojených s autosomálně dominantní (AD) DID a recentní odhady uvažují ještě minimálně o dalších 350 genech (Wieczorek, 2018). Významnou část již identifikovaných genů tvoří geny popsané v patogenezi syndromických forem DID, avšak pomocí přístupů NGS byly identifikovány rovněž v případech mírné a nesyndromické DID. V případech autosomálně recesivní (AR) DID je počet známých a kandidátních genů odhadován na přibližně 2000 (Jamra, 2018). Klíčovou strategii pro identifikaci genů asociovaných s AR DID představuje WES u populací s vysokou četností příbuzenských svazků, jež jsou frekventované v zejména zemích jihozápadní a jižní Asie (Mir and Kuchay, 2019). Recentní „trio-based“ analýza metodou WES (trio-WES) realizovaná u 100 rodin s příbuzenskými sňatky potvrdila uvedené poznatky o epidemiologii a etiologii AR DID (Kahrizi et al., 2019). Patogenní sekvenční varianty byly detekovány v 61 % případů včetně detekce variant v genech dosud nepopsaných v patogenezi DID, z toho 72 % patogenních variant bylo identifikováno v homozygotní, respektive hemizygotní sestavě pro X-vázanou DID (X-linked DID, XL-DID) a u 28 % z nich byl prokázán původ de novo. Uvedená studie rovněž prokázala, že s rostoucí proporcí příbuzenských svazků v populaci stoupá riziko DID s genetickou příčinou až na trojnásobek oproti riziku DID v populacích s nízkou frekvencí konsanguinity. V patogenezi XL-DID bylo dosud popsáno 141 genů (Wieczorek, 2018; Jamra, 2018). Identifikace nových kandidátních genů s XL-DID je podmíněna precizní diferenciální
40 diagnostikou syndromů při primární genetické konzultaci u chlapců s DID bez ohledu na rodinnou anamnézu a familiální výskyt DID, neboť většina XL-DID a asociovaných VVV se vyskytují jako vzácné a izolované případy (Neri et al., 2018). Uvedená recentní studie rovněž poukazuje na význam duplikací X-vázaných genů v patogenezi DID. Fenotypový projev přitom může být stejný či velmi podobný jako v případech jejich delecí, nebo naopak zcela odlišný. Ve vzácných případech lze rovněž pozorovat pouze částečnou podobnost s fenotypovými projevy delecí daných genů nebo genové duplikace známých XL-DID genů nemusí být příčinou DID.
1.3.3.1. Přístupy NGS Princip technologie NGS využívá jednotlivé či klonálně amplifikované molekuly DNA, která jsou paralelně sekvenovány na vysokokapacitních sekvenátorech. V klinické diagnostice se uplatňují tři různé přístupy pro identifikaci sekvenčních variant, resp. CNVs: cílené NGS specifických panelů genů asociovaných s patologiemi, WES a WGS. Pro výzkumné účely se rovněž uplatňují přístupy sekvenování „třetí generace“ využívající technologie PacBio či Nanopore, založených na dlouhých čteních, a technologie Bionano mapping (van Dijk et al., 2018). Účelem NGS panelů genů je identifikace patogenních variant v genech s klinickým významem v patogenezi daného onemocnění, pro něž je panel genů navržen. Jeho omezená velikost umožňuje hlubší hloubku čtení a tím vyšší analytickou senzitivitu a specificitu. Hlubší pokrytí současně zvyšuje spolehlivost analýzy a pravděpodobnost detekce mosaicismu, resp. heterogenity za účelem detekce patogenních variant v mtDNA či ve vzorcích nádorových buněk (Gajecka, 2018). Cílené NGS genů s klinickým významem v daném onemocnění rovněž usnadňuje interpretaci variant ve vztahu genotypově-fenotypové korelace. Z technického hlediska lze díky omezené, definované velikosti panelu realizovat paralelní analýzu více vzorků současně na stolních sekvenátorech a zpracování a uložení dat rovněž nevyžaduje velkou výpočetní kapacitu. WES umožňuje detekci sekvenčních variant v kódujících oblastech genomu. Kódující oblasti reprezentují jen 1-2 % velikosti genomu, avšak je v nich kumulováno přibližně 85 % všech známých patogenních sekvenčních variant (Majewski et al., 2011). Pomocí současných technologických postupů přípravy knihoven DNA fragmentů je možné dosáhnout pokrytí přibližně 95 % velikosti exomu, oblasti s vysokou komplexitou stále nedosahují pokrytí dostatečného pro sekvenaci a spolehlivou identifikaci variant (Cirulli et al., 2010). WES je rovněž vhodným přístupem pro identifikaci nových kandidátních genů s potenciálním klinickým významem v patogenezi geneticky heterogenních onemocnění, kam se řadí i DID. 41
Klinická interpretace variant detekovaných WES vyžaduje spolupráci mezi výzkumnými a diagnostickými laboratořemi (Rehm et al., 2013). Oproti NGS panelů genů dosahuje WES obvykle také nižší hloubky pokrytí, a proto je v případě neoptimálního pokrytí vhodné použít Sangerovo sekvenování k eliminaci falešně pozitivních nálezů variant. Přínos WGS spočívá v identifikaci sekvenčních i strukturních variant genomu v jeho kódujících i nekódujících oblastech. Kvůli komplexitě lidského genomu a nedostatku informací o klinickém významu variant v nekódujících oblastech většiny genomu jsou obvykle prioritně analyzovány a interpretovány varianty v kódujících oblastech a následně v oblastech regulující expresi klinicky významných genů (Rehm et al., 2013). Kromě detekce sekvenčních variant lze spolehlivě detekovat strukturní varianty či CNVs. Vzhledem k vysokým finančním nákladům, náročnosti na pokročilou bioinformatickou analýzu dat a interpretaci variant se však WGS využívá v rámci molekulární diagnostiky jen velmi sporadicky a zatím zůstává technologií uplatňující se převážně v oblasti výzkumu (Chrystoja and Diamandis, 2014).
42
1.3.3.2. NGS v molekulární diagnostice DID V návaznosti na znalost genů asociovaných s DID se proto nabízí vývoj panelů genů pro cílené NGS s předpokladem vysoké diagnostické efektivity jako první diagnostický test, přesto se však nyní mnohem více uplatňuje přístup trio-WES s diagnostickým záchytem de novo patogenních sekvenčních variant mezi 20 až 60 % (Wieczorek, 2018). Cílený design pro detekci variant v exomech společně s NGS založeném na čtení fragmentů < 300 bp při pokrytí > 30x oblastí zájmu předurčuje WES k rutinnímu a finančně efektivnímu využití v molekulární diagnostice. V současnosti brání jejímu rutinnímu využití vysoké finanční náklady a požadavky komplexní bioinformatické analýzy dat (Pfundt et al., 2017). Pro zavedení NGS do klinické praxe byla navržena kritéria kvality NGS dat týkající se mapování, analýzy pokrytí (coverage) a vyvolání variant a posléze vypracována doporučení vzhledem k reportování a interpretaci variant (Matthijs et al., 2016). Implementace metod NGS do rutinní molekulární diagnostiky s sebou přináší možnost snížení množství analýz genomu nezbytných k potvrzení diagnózy na molekulární úrovni, a tím zjednodušení a zefektivnění molekulárně diagnostického algoritmu. Na Oddělení lékařské genetiky Fakultní nemocnice Brno (OLG FN Brno) bylo v rámci výzkumných studií molekuární podstaty DID, PAS a asociovaných VVV zařazeno cílené NGS jako nový molekulárně diagnostický přístup po vyšetření metodou array-CGH (obr. 4).
Obrázek 4: Diagnostický algoritmus vyšetření dětí s DID, PAS a asociovanými VVV na OLG FN Brno. Schéma prezentuje návaznost jednotlivých vyšetření, rovněž jsou uvedeny diagnostické záchyty daných metod na základě relevantní literatury.
43
1.3.3.3. Interpretace sekvenčních variant Spolehlivá interpretace sekvenčních variant by měla být vždy podpořena správnou laboratorní praxí z hlediska praktických zkušeností s metodami NGS a spolupráci s klinickými genetiky, jež spočívá v kritickém zhodnocení korelace detekované sekvenční varianty s fenotypem jedince. V roce 2013 vydala American College of Medical Genetics and Genomics (ACMG) klinické laboratorní standardy pro NGS (Rehm et al., 2013). Všechny varianty v genech asociovaných s patologiemi by měly být vyhodnoceny a klasifikovány podle standardů vydaných ACMG (Richards et al., 2015). Uvedená doporučení zajišťují transparentnost a konzistenci v interpretaci variant. Popisují detailní algoritmus hodnocení variant prostřednictvím dvou sad kritérií, zvlášť pro patogenní či pravděpodobně patogenní varianty (tab. 2) a pro benigní či pravděpodobně benigní varianty (tab. 3). Každé kritérium patogenity je hodnoceno podle svého významu jako „velmi silné“, „silné“, „středně silné“ nebo „podpůrné“ a každé kritérium pro benigní varianty je klasifikováno jako „nezávislé“, „silné“ nebo „podpůrné“. Mezi kritéria pro klasifikaci variant patří populační frekvence, počítačové analýzy a in silico predikce, funkční analýzy, segregace varianty s onemocněním, původ de novo, alelismus a další kritéria zahrnující informace z databází či literatury. Dle jejich vzájemné kombinace lze jednotlivé sekvenční varianty klasifikovat do skupin „patogenní“, „pravděpodobně patogenní“, „benigní“ a „pravděpodobně benigní“ (tab. 4). Pravidla a jejich kombinace se vztahují ke všem typům dat, zahrnující výzkumná data, data publikovaná ve vědecké literatuře, data z veřejných databází (např. ClinVar - Landrum et al., 2016) či z interní databáze dané laboratoře. Rovněž je přípustná flexibilita v rámci klinické intrepretace variant, která je však podmíněna kritickým komplexním hodnocením jednotlivých důkazů patogenity či benigního vlivu.
44
Kritéria klasifika e patoge í h varia t Vel i sil é důkaz patoge it Pathoge i Ver Stro g, PVS PVS1 ulová va ia ta v genu, kde LoF je z á ý e ha is e o e o ě í Sil é důkaz patoge it Pathoge i Stro g, PS PS1 stej á zá ě a a i ok seli popsá a jako patoge í, ez ohledu a zá ě u ukleotidů PS2 de novo va ia ta u pa ie ta, jed á se o izolova ý případ v odi ě potvrzena maternita i paternita) PS3 in vitro nebo in vivo studie potv zují patoge í efekt a ge e o jeho p odukt PS4 p evale e va ia t u postiže ý h jedi ů je výz a ě zvýše a op oti p evale i u kontrol Relativ í iziko e o odds atio > Velmi vzá é va ia t se v sk tují u epří uz ý h jedi ů se stej ý fe ot pe a ev sk tují se u ko t ol ož é uvažovat také jako PM Střed ě sil é důkaz patoge it Pathoge i Moderate, PM PM1 u ístě í v utač í „hotspot“ a/nebo v do é ě s klíčový fu kč í výz a e apř. aktiv í ísto e z u ez e ig í va ia t PM2 e í příto a u ko t ol v případě e esiv í va ia t v ízké f ekve i v data ází h Exome Sequencing Project, 1000 Genomes nebo ExAc PM3 p o e esiv í va ia t je ut á příto ost in trans s patoge í va ia tou PM4 z ě a délk p otei u ez z ě čte ího á e v oblasti bez repetic nebo varianta „stop-loss“ PM5 ová „ isse se“ va ia ta v pozi i a i ok seli , kde již la dříve popsá a patoge í „ isse se“ va ia ta PM6 varianta deteková a de novo, ez potv ze í pa e tit Podpůr é důkaz patoge it Pathoge i suPporti g, PP PP1 segregace s o e o ě í u ví e postiže ý h jedi ů v odi ě, ge je popisová v souvislosti s o e o ě í S a ůstají í počte postiže ý h jedi ů lze uvažovat jako PM PP2 „ isse se“ va ia ta v genu s ízkou f ekve í e ig í h „ isse se“ va ia t, „ isse se“ va ia t jsou z á ý e ha is e o e o ě í PP3 oho počítačový h a alýz a in silico p edikč í h p og a ů potv zuje škodlivý efekt a ge či jeho p odukt PP4 fe ot p pa ie ta e o odi ý výsk t je vel i spe ifi ký p o o e o ě í s jed ou ge eti kou příči ou PP5 data áze či lite atu a potv zují va ia tu jako patoge í, ale la o ato í a alýz eu ožňují posk t out ezávislý o jektiv í důkaz
Tabulka 2: Soubor kritérií pro klasifikaci patogenních variant. Číslování u jednotlivých skupin důkazů neznamená vzestupný či sestupný význam pro klasifikaci analyzované varianty (Richards et al., 2015; upraveno).
45
Kritéria klasifika e e ig í h varia t Nezávislé důkaz e ig ího vlivu Be ig Alo e, BA BA1 frekvence alely je > 5% v data ází h E o e Se ue i g P oje t, Ge o es e o ExAc Sil é důkaz e ig ího vlivu Be ig Stro g, BS BS1 f ekve e alel je v šší ež očekáva á v případě e o i BS2 varianta pozo ová a u zd avého dospělého jedi e v případě AR ho oz got í sestava , AD hete oz got í sestava či X-váza é he iz got í stav e o i, kd je da á alela pl ě pe et a t í v a é o do í života BS3 in vitro nebo in vivo studie ep okázal patoge í efekt a fu k i p otei u e o sestřih ge u BS4 e í pozo ová a seg ega e u postiže ý h čle ů odi Podpůr é důkaz e ig ího vliv Be ig suPporti g, BP BP1 „ isse se“ va ia ta v ge u, kde jsou za patoge í považová p i á ě va ia t ovlivňují í délku p otei u BP2 deteková a v aleli ké fázi trans s patoge í va ia tou p o pl ě pe et a t í do i a t í o e o ě í deteková a v aleli ké fázi cis s patoge í va ia tou ez ohledu a původ BP3 z ě a délk p otei u ez z ě čte ího á e v oblasti repeti ez z á é fu k e BP4 oho počítačový h a alýz a in silico p edikč í h p og a ů epotv zuje škodlivý efekt a ge či jeho p odukt BP5 varianta nalezena v případě s alte ativ í olekulá í podstatou o e o ě í BP6 data áze či lite atu a potv zují va ia tu jako e ig í, ale la o ato í a alýz eu ožňují posk t out ezávislý o jektiv í důkaz BP7 s o í va ia ta v případě, že p edikč í p og a ep okázal vliv a ko se zuál í sestřihovou sekve i, ev tváří se ové sestřihové ísto a da á nukleotidová pozi e e í evoluč ě ko ze vova á
Tabulka 3: Soubor kritérií pro klasifikaci benigních variant. Číslování u jednotlivých skupin důkazů neznamená vzestupný či sestupný význam pro klasifikaci analyzované varianty (Richards et al., 2015; upraveno).
46
Pravidla ko i a e kritérií pro klasifika i sekve č í h varia t Patoge í 1. PVS1 a ≥ PS PS –PS4) nebo ≥ PM PM –PM6) nebo 1 PM (PM1–PM6) a 1 PP (PP1–PP5) nebo ≥ PP PP –PP5) 2. ≥ PS PS –PS4) nebo 3. PS (PS1–PS4) a a. ≥ PM PM –PM6) nebo b. 2 PM (PM1–PM6) a ≥ PP PP –PP5) nebo c. 1 PM (PM1–PM6) a ≥ PP PP –PP5) Pravděpodo ě patoge í 1. 1 PVS (PVS1) a 1 PM (PM1–PM6) nebo 2. 1 PS (PS1–PS4) a 1–2 PM (PM1–PM6) nebo 3. 1 PS (PS1–PS4) a ≥ PP PP –PP5) nebo 4. ≥ PM PM –PM6) nebo 5. 2 PM (PM1–PM6) a ≥ PP PP –PP5) nebo 6. 1 PM (PM1–PM6) a ≥ PP PP –PP5) Be ig í 1. 1 BA (BA1) nebo 2. ≥ BS BS –BS4) Pravděpodo ě e ig í 1. 1 BS (BS1–BS4) a 1 BP (BP1–BP7) nebo 2. ≥ BP BP –BP7)
Tabulka 4: Pravidla kombinace kritérií pro klasifikaci sekvenčních variant. Kombinace daných kritérií vychází z kritérií pro klasifikaci patogenních, respektive benigních variant. Richards et al., 2015; upraveno.
Pokud varianta nesplňuje kritéria pro klasifikaci do jedné z uvedených čtyř skupin, poté spadá do kategorie VOUS. Přítomnost VOUS by neměla být relevantní při interpretaci klinickým genetikem a v následném genetickém poradenství. S narůstajícími znalostmi o patogenezi daného onemocnění, počtem detekovaných variant a populačními studiemi frekvencí variant je přípustná reanalýza variant, zejména kategorie VOUS a případné upřesnění klasifikace (Wenger et al., 2017). Uvedené kroky vyžadují kooperaci mezi laboratorními pracovníky a indikujícími lékaři a vždy je nezbytná informovanost vyšetřovaných jedinců o této skutečnosti. Kromě již zmíněných vysokých finančních nároků a nutnosti pokročilých bioinformatických algoritmů pro zpracování dat s sebou nesou technologie WES a WGS možnost detekce náhodných variant, které mohou být ve formě heterozygotních variant pro onemocnění s AR dědičností, nebo se mohou vztahovat k onemocněním s pozdním nástupem fenotypových projevů či se může jednat o varianty bez relevance k primární indikaci (Di Resta et al., 2018). V těchto případech je nutno tyto varianty posuzovat vždy vzhledem 47 k rodinné anamnéze, jejich frekvenci v populaci a přínosu informace o jejich přítomnosti pro testovaného jedince. Interpretace náhodných variant by měla být vždy realizována v rámci genetického poradenství dle doporučení pro interpretaci náhodných variant (Green et al., 2013; Kalia et al., 2017).
48
2. Cíle disertační práce
1) Identifikace vzácných submikroskopických přestaveb chromosomů (CNVs) metodou komparativní genomové hybridizace na DNA mikročipech (array-CGH) a stanovení jejich klinického významu v souboru 724 dětských pacientů s DID, PAS a asociovanými onemocněními vyšetřených na OLG FN Brno v letech 2011-2018
2) Analýza detekovaných CNVs u dětí s DID, PAS a asociovanými onemocněními
3) Identifikace vzácných sekvenčních variant v souboru 35 dětských pacientů s DID, PAS a asociovanými VVV metodou cíleného sekvenování „nové generace“ (NGS) vyšetřených na OLG FN Brno v letech 2015-2018
4) Analýza patogenních sekvenčních variant detekovaných metodou cíleného NGS a stanovení jejich významu v patogenezi DID, PAS a asociovaných onemocnění
49
3. Soubor pacientů a metody 3.1. Klinická charakteristika pacientů Do naší studie bylo zahrnuto 724 dětských pacientů (293 dívek a 431 chlapců) s DID a PAS a asociovanými VVV, zahrnující celkové vývojové opoždění, vrozené srdeční vady, epilepsii a další vývojové vady včetně faciální stigmatizace, kteří byli vyšetřeni v průběhu osmi let (2011-2018) na Oddělení lékařské genetiky Fakultní nemocnice Brno (tab. 5). Pacienti podstoupili vyšetření karyotypu metodou G-pruhování. V případech normálního karyotypu, karyotypu s balancovanou přestavbou de novo či v případech nebalancových přestaveb chromosomů bylo indikováno vyšetření metodou array-CGH.
vrozené vrozené vývojové pohlaví počet DID PAS vývojové srdeční epilepsie opožd ní vady vady 65,5 % 21,1 % 87,7 % 78,5 % 18,8 % 17,4 % dívky 293 (192/293) (62/293) (257/293) (230/293) (55/293) (51/293)
61,7 % 37,4 % 86,1 % 72,9 % 12,3 % 15,5 % chlapci 431 (266/431) (161/431) (371/431) (314/431) (53/431) (67/431)
63,3 % 30,8 % 86,7 % 75,1 % 14,9 % 16,3 % celkem 724 (458/724) (223/724) (628/724) (544/724) (108/724) (118/724)
Tabulka 5: Klinická charakteristika souboru 724 dětí s DID a asociovanými VVV.
Průměrný věk dětských pacientů v době vyšetření metodou array-CGH dosahoval 5,8 let (0-18 let). Věkové rozložení dětských pacientů v době vyšetření metodou array-CGH je uvedeno na obr. 5.
8,4% 4,8% 9,0% 23,6%
28,9%
25,3%