MASARYKOVA UNIVERZITA Přírodovědecká fakulta Ústav experimentální biologie Oddělení funkční genomiky a proteomiky

Klasické a moderní metody molekulární biologie při studiu repetitivních oblastí eukaryotického genomu

Brno 2011 Roman Gogela

PODĚKOVÁNÍ

Na tomto místě bych rád poděkoval své školitelce Mgr. Miloslavě Fojtové, CSc. a konzultantovi Mgr. Vratislavu Peškovi za čas, který mi ochotně věnovali a za cenné rady a připomínky, kterými přispěli k úspěšnému dokončení této práce.

2

OBSAH

1 ÚVOD ...... 5 2 REPETITIVNÍ SEKVENCE ...... 6 2.1 OBECNÁ CHARAKTERISTIKA REPETITIVNÍCH SEKVENCÍ ...... 6 2.2 VÝZNAM REPETITIVNÍCH SEKVENCÍ ...... 7 2.3 KLASIFIKACE REPETITIVNÍCH SEKVENCÍ ...... 9 2.3.1 TANDEMOVÉ REPETICE ...... 9 2.3.2 ROZPTÝLENÉ REPETICE ...... 10 3 KLASICKÉ BIOFYZIKÁLNÍ METODY NA POČÁTKU POZNÁVÁNÍ REPETITIVNÍ DNA...... 13 3.1 CENTRIFUGACE V HUSTOTNÍM GRADIENTU ...... 13 3.1.1 PRINCIP A POSTUP ...... 13 3.1.2 VYUŢITÍ CENTRIUGACE V HUSTOTNÍM GRADIENTU PŘI OBJEVOVÁNÍ A STUDIU TANDEMOVÝCH REPETIC ...... 14

3.2 ANALÝZA C0t FRAKCÍ ...... 16 3.2.1 STRUKTURNÍ A FYZIKÁLNÍ PODSTATA RENATURACE DNA ...... 16 3.2.2 STANOVENÍ TEPLOTY TÁNÍ – HYPERCHROMNÍ EFEKT ...... 17 3.2.3 APLIKACE RENATURAČNÍ KINETIKY PŘI STUDIU REPETIC ...... 18 3.3 KLASICKÉ METODY VYUŢÍVAJÍCÍ NUKLEÁZY ...... 20 3.3.1 IZOLACE SATELITŮ ŠTĚPENÍM GENOMOVÉ DNA RESTRIKČNÍMI ENDONUKLEÁZAMI ...... 20 3.3.2 ANALÝZA TERMINÁLNÍCH RESTRIKČNÍCH FRAGMENTŮ (TRF) ...... 20 3.3.3 EXONUKLEÁZOVÁ ANALÝZA TERMINÁLNÍCH SEKVENCÍ ENZYMEM BAL31 ...... 21 4 METODY POUŢÍVANÉ OD 70. LET 20. STOLETÍ DODNES ...... 23 4.1 HYBRIDIZAČNÍ TECHNIKY ...... 23 4.1.1 POČÁTKY HYBRIDIZAČNÍCH METOD ...... 23 4.1.2 PRINCIP HYBRIDIZAČNÍCH METOD ...... 23 4.1.3 HYBRIDIZAČNÍ SONDY ...... 24 4.1.4 PŘÍKLADY VYUŢITÍ HYBRIDIZAČNÍCH METOD PRO ANALÝZU REPETITIVNÍCH SEKVENCÍ ...... 27 4.2 PCR – POLYMERÁZOVÁ ŘETĚZOVÁ REAKCE ...... 34 4.2.1 HISTORIE PCR ...... 34 4.2.2 PRINCIP PCR ...... 34 3

4.2.3 VARIANTY PCR PRO ANALÝZU REPETITIVNÍCH SEKVENCÍ ...... 36 4.3 SEKVENOVÁNÍ...... 39 4.3.1 POČÁTKY SEKVENOVÁNÍ ...... 39 4.3.2 SEKVENAČNÍ METODY NOVÉ GENERACE A JEJICH APLIKACE PŘI VÝZKUMU REPETITIVNÍCH SEKVENCÍ ...... 40 5 ZÁVĚR ...... 47 6 LITERATURA...... 48

4

1 ÚVOD Repetitivní sekvence jsou nedílnou součástí genomové výbavy prokaryot i eukaryot a můţeme je nalézt jak v jaderné tak i v mimojaderné DNA. Přestoţe byly dříve tyto úseky povaţovány pouze za jakousi „vycpávkovou“ či „odpadní“ a genetického hlediska nezajímavou oblast genomu, dnes jiţ víme, ţe jejich role je nenahraditelná nejen pro genom, ale v konečném důsledku i pro celou buňku a vyšší organismus. Proto je jim v současnosti vědeckou obcí věnována široká pozornost. Jiţ od konce 30. let 20. století byly (bez znalosti bliţších informací o jejich stavbě) popisovány některé typy repetitivních sekvencí a chromozomové struktury jimi tvořené. V roce 1938 byla poprvé popsána telomerová oblast na chromozomech Drosophila melanogaster (Muller, 1938) a o dva roky později také u Zea mays (McClintock, 1941). Na přelomu 40. a 50. let byl poloţen první, i kdyţ pouze teoretický, předpoklad existence transponovatelných elementů vycházející z pozorování na úrovni fenotypu (McClintock, 1951). K podrobnějšímu zkoumání repetitivních sekvencí mohlo dojít aţ s objevem struktury DNA (Watson a Crick, 1953) a rozvojem technik umoţňujících jejich detekci, cílenou izolaci, popis a srovnávání. Cílem této práce je shrnout vybrané metody vyuţívané při studiu repetitivních sekvencí. Do své práce jsem chronologicky zařadil nejdéle vyuţívané metody – klasické biofyzikální postupy centrifugace a denaturace DNA, dále pak techniky molekulární biologie zaloţené na vyuţití restrikčních enzymů a hybridizačních postupů a nakonec sekvenační protokoly, které v masivním, paralelním provedení otevírají novou dimezi genomových studií. Kromě popisu principu fungování jednotlivých technik, případně variant některých obecných postupů (PCR, hybridizace) spojených s repeticemi, budou uváděny i příklady jejich vyuţití v praxi.

5

2 REPETITIVNÍ SEKVENCE

2.1 OBECNÁ CHARAKTERISTIKA REPETITIVNÍCH SEKVENCÍ

Repetitivní sekvence DNA představují významnou strukturní i funkční součást genomu všech ţivých organismů. Jsou to úseky DNA tvořené opakováním sekvenčního motivu, který se nazývá jednotka repetice. Podle toho, zda jsou jednotky dané repetice všechny stejné nebo se liší, rozeznáváme repetice dokonalé nebo degenerované. V případě potřeby se degenerované repetice zapisují pomocí konsenzuální sekvence. Například telomery Lycopersicon esculentum jsou tvořeny degenerovanou verzí typické rostlinné telomerové sekvence, od které se liší tím, ţe v G-bohatém vlakně je adenin na čtvrté pozici střídán tyminem - 5´-(TTT(A/T)GGG)-3´ (Ganal et al., 1991). Velikosti jednotek repetic se pohybují od jednotek nukleotidů (mono-, di-, tri-, a vícenukleotidové repetitivní jednotky) aţ po stovky párů bazí nebo dokonce několik kilobází, jako je tomu v případě retrotranspozonů. Repetice mohou být uspořádány v řadě za sebou (tzv. tandemové repetice), nebo se můţe jednat o sekvence, u kterých se jejich jednotky vyskytují na různých místech v genomu samostatně (tzv. rozptýlené repetice). Kromě jednosměrného uspořádání u přímých repetic, označovaného téţ jako „hlava k patě“ z anglického označení „head-to-tail“, můţeme v genomu nalézt i sekvence, které mají shodnou nukleotidovou stavbu, ale na řetězci jsou orientovány v opačném směru. Jedná se obrácené repetice a tomuto postavení se někdy také říká „hlava k hlavě“, z anglického „head to head“. Nejméně časté, ale o to zajímavější, jsou palindromatické repetice. Ty jsou tvořeny sekvencí, která má na obou řetězcích ve směru od 5´-konce ke 3´-konci stejné pořadí nukleotidů a zároveň je sama se sebou komplementární. Příkladem mohou být cílová místa některých restrikčních endonukleáz, jako je EcoRI pocházející z bakterie Escherichia coli, která štěpí sekvenci 5´-GAATTC-3´ mezi bázemi GA (Woodhead a Malcolm, 1980). Neobvykle vysoký počet palindromů se nalézá v mitochondriální DNA Lubomirskia baicalensis, zástupce skupiny Porifera. Mitochondriální genom tohoto druhu je tvořen necelými dvaceti devíti tisíci páry bazí (28 958 bp). Mezigenové oblasti představují asi 34 % a obsahují 160 různých palindromů, z nichţ 55 je unikátních a zbývajících 105 jsou repetice patřící do 8 rodin H1 aţ H8 (Lavrov, 2010). Kromě skupiny Porifera byly palindromatické repetice prokázány i v mitochondriích rostlin (Nakazono et al., 1994), kvasinek (Weiller et al., 1989) nebo řas (Boer a Gray, 1991). Obsah repetic v genomu je velmi rozdílný. U Z. mays tvoří repetitivní sekvence 77 % genetické výbavy buňky (Meyers et al., 2001), zatímco u Fugu rubripes je to jen 15 % (Aparicio et al., 2002). Zastoupení repetic v genomu se můţe značně lišit nejen mezidruhově, ale i uvnitř 6 jednoho druhu. Například u Oryza sativa tvoří repetitivní sekvence 42 % genomu poddruhu O. sativa indica a 45 % genomu poddruhu O. sativa japonica. Tento poměr nemá přímou souvislost s celkovou velikostí jejich genomů, neboť poddruh O. sativa indica má genom o přibliţně 44 Mb větší (Goff et al., 2002; Yu et al., 2002). V lidském genomu jsou repetitivní sekvence zastoupeny přibliţně padesáti procenty (Venter et al., 2001).

2.2 VÝZNAM REPETITIVNÍCH SEKVENCÍ

Původně nebyl repetitivním oblastem genomu přikládán velký význam. Hovořilo se o nich jako o nadbytečné, nebo téţ odpadní („junk“), DNA. Postupem času se ovšem ukázalo, ţe jsou nepostradatelné. Je známo, ţe se podílí na formování vyšších nukleoproteinových struktur, jako jsou telomery nebo centromery. Z posledních studií rovněţ vyplývá, ţe ideální sekvencí pro vazbu DNA na histonový skelet nukleozomu je tandemová repetice s repetitivní jednotkou o délce 14 bází (Trifonov, 2010), která je ovšem pouze teoretická a přirozeně se nevyskytuje. Svou roli repetice sehrávají taktéţ při chromozomových přestavbách, mají vliv na regulaci genové exprese při procesu zvaném RNA interference, zajišťují ochranu konců lineárních chromozomů, řídí správný průběh mitotického i meiotického dělení buňky a jsou neopomenutelnou součástí evolučních procesů na genové i genomové úrovni. Podle definice v nejšírším slova smyslu se mezi repetitivní sekvence řadí i některé funkční geny a pseudogeny. Příkladem je pseudogen cytochromu C, který se v lidském genomu vyskytuje celkem ve čtyřiceti devíti kopiích (Zhang a Gerstein, 2003). Nejznámější genové repetice jsou ribozomální DNA (rDNA) a geny pro transferovou RNA (t-RNA). Ţivočišné genomy mohou obsahovat aţ 19 000 jednotek veškeré rDNA a rostlinné aţ 26 000 jednotek, organizovaných do tandemově uspořádaných klastrů. Bylo odhaleno, ţe počet kopií rDNA je přímo úměrný velikosti genomu (Prokopowich et al., 2003). Počet kopií genů pro všechny typy tRNA, včetně pseudogenů, je v lidském haploidním genomu okolo 1 200 (Hatlen a Attardi, 1971). Přestoţe repetitivní sekvence hrají díky svým regulačním a organizačním funkcím převáţně kladnou roli, mohou v buňce způsobovat také fatální poruchy. Náhlé a rozsáhlé změny v počtu kopií jsou odrazem genomové nestability a předstvaují váţné nebezpečí v případě sníţení počtu repetic (nebo úplné ztráty, např. telomerová DNA) i navýšení jejich počtu (např. trinukleotidové expanze, viz níţe). Například, pokud jsou telomery zkráceny pod kritickou úroveň (u člověka se uvádí kritická délka senescentních fibrobrastů v rozmezí 2 aţ 2,8 kb (Allsopp a Harley, 1995)) nebo dojde k jejich úplné ztrátě, dochází k poškození chromozomů v důsledku koncových fúzí a následných

7 zlomů. Závaţné jsou i ztráty či mutace pseudogenů spojených s regulací genové exprese procesem RNA interference. Velmi dobře je tato problematika prozkoumána u vývoje oocytů myší (Mus musculus) (Tam et al., 2008). Expanzivní potenciál repetitivní DNA je příčinou několika lidských onemocnění spojených s nárůstem počtu trinukleotidových repetic. Tyto trinukleotidy mohou zvyšovat svůj počet a narušovat tím čtecí rámec genu, ve kterém jsou obsaţeny, a jejichţ výsledné produkty jsou nefunkční. V roce 1996 bylo známo celkem třináct dědičných neurodegenerativních onemocnění, které jsou způsobeny právě expanzí trinukleotidových repetic (Timchenko a Caskey, 1996). V současnosti se udává počet vyšší, hlavně kvůli rozeznání několika typů spinocerebelární ataxie. Klasickým příkladem těchto onemocnění je Huntingtonova choroba, při níţ dochází ke zvýšení počtu trinukleotidové repetice CAG v genu IT15 (huntingtin), nacházejícím se na krátkém raménku 4. chromozomu (MacDonald et al., 1993). U zdravého člověka je počet repetitivních jednotek od jedenácti do třiceti čtyř, u jedinců trpících tímto degenerativním onemocněním bývá těchto repetic více neţ třicet šest (často i okolo stovky jednotek). Stav, kdy počet repetic leţí mezi normální a mutantní hladinou (třicet aţ třicet pět repetic v sekvenci), se nazývá „premutační“ (Goldberg et al., 1993). Premutační stav rodičů můţe vést k vypuknutí nemoci u potomků, protoţe tyto mutace jsou nestabilní a počet trinukleotidů v repetici můţe kolísat mezigeneračně (Watanabe et al., 2000) a dokonce i v rámci jednoho organismu. Většinou zde dochází k nárůstu počtu repetic, coţ má za následek zhoršování projevů choroby a urychlení jejího nástupu během ontogeneze. Tento jev se nazývá anticipace (Ranen et al., 1995). Příčina a mechanismus vzniku trinukleotidových expanzí není zatím přesně popsán. Z hlediska poškození genetické informace, tedy vzniku mutací a svým způsobem vlastně i vzniku genetické variability, jsou zajímavé mobilní repetitivní elementy se schopností začleňovat se různými mechanismy na téměř libovolná místa v genomu. Transpozony, retrotranspozony a jiné mobilní elementy vyvolávají inzerční mutace, které vyřazují z funkce přerušené geny. Schopnost mobilního elementu přeskakovat nebo šířit se v rámci genomu z místa na místo bývá evolučně potlačována a připomíná soutěţ hostitele s parazitem. Řada významných objevů v genetice je spojena s mutacemi způsobenými transpozony. Kupříkladu hranatý tvar semen hrachu, coţ je jeden ze znaků, které sledoval J. G. Mendel ve své práci, je způsoben přerušením genu pro enzym SBEI podílejícího se na větvení škrobu inzertem o velikosti 0,8 kb. Tento inzert vykazuje velkou podobnost s transpozony rodiny Ac/Ds nacházejícími se v genomu Z. mays (Bhattacharyya et al., 1990).

8

2.3 KLASIFIKACE REPETITIVNÍCH SEKVENCÍ

Repetice charakterizujeme podle toho, jak jsou v genomu uspořádány a orientovány, podle jejich funkce, délky repetitivní jednotky a případně podle způsobu, jakým jsou schopny se v genomu přemisťovat (viz tab. 1). Nejzákladnější je rozlišení repetic na tandemové a rozptýlené.

2.3.1 TANDEMOVÉ REPETICE Tandemové repetice byly poprvé pozorovány při centrifugaci eukaryotické DNA v hustotním gradientu chloridu cesného jako oddělená frakce s odlišnou vznášivou hustotou neţ ostatní většinová genomová DNA. Odtud pochází jejich název „satelitní DNA“ (z latinského satelles, coţ v češtině znamená „průvodce“, nebo „doprovázející“), který se začal přeneseně pouţívat pro tandemové repetice obecně. Podle celkové délky satelitu a délky jeho repetitivní jednotky rozlišujeme satelity, minisatelity a mikrosatelity (viz tab. 1). Satelity jsou úseky DNA o délce řádově stovek kilobází a repetitivní jednotkou sloţenou ze stovek nukleotidů. Nejznámějším satelitem je tzv. α-satelit, který se nachází v oblasti centromer a je jejich důleţitou stavební součástí. U člověka je α-satelit tvořen kopiemi repetitivní jednotky o délce 171 bp a celkové velikosti 0,1 aţ 4 Mb (Mehta et al., 2010). Mezi další satelitní sekvence lidského genomu patří β-satelit s repetitivní jednotkou o velikosti 68 bp, přítomný na chromozomech 1, 9, 13, 14, 15, 21, 22 a Y v centromerové oblasti i mimo ni (Waye a Willard, 1989; Tenhagen a Cohen, 1993). Stavba centromery je obecně velmi rozmanitá, ale vţdy je spojena s repetitivními sekvencemi. U rodu Drosophila je například 420 kb dlouhá centromerická oblast tvořena bloky sekvencí AATAT a TTCTC, přerušovaných v oblasti AATAT transpozony (Mehta et al., 2010), u Z. mays je hlavní součástí centromery repetice CentC doplněná o centromerické retroelementy (Jiang et al., 2003). Minisatelity jsou vysoce polymorfní úseky DNA s podobnou strukturou jako satelity, ale délka klastru je do 25 kb a repetitivní jednotka je sloţena z několika desítek nukleotidů (Vergnaud a Denoeud, 2000). Mezi nejznámější minisatelity patří telomery a ve velké míře se minisatelity nacházejí i v subtelomerické oblasti chromozomů. Právě díky vysoké variabilitě se staly nejen nástrojem pro identifikaci pomocí srovnávání DNA vzorků (Jeffreys et al., 1985), ale také pro mapování na základě vazby genů (Nakamura et al., 1987). Mikrosatelity se velikostně pohybují v desítkách aţ stovkách párů bazí (typicky kolem 150 bp) a repetitivními jednotkami do velikosti šesti párů bazí (Li et al., 2002). Mikrosatelity jsou vlastně nejmenšími tandemovými repeticemi. Obvykle se bohatě vyskytují napříč celým 9 genomem. Bylo zjištěno, ţe počty mikrosatelitních repetic se výrazně liší nejen mezidruhově, ale i vnitrodruhově. Díky tomu se pouţívají jako poziční markery při konstrukci genových map, genetické profilaci, populačních studiích, klinické a forenzní praxi (Blouin et al., 1996; Schneider, 1997).

2.3.2 ROZPTÝLENÉ REPETICE Druhou velkou skupinou repetitivních segmentů DNA jsou rozptýlené repetice. Základní dělení rozptýlených repetic souvisí s jejich schopností přesouvat se (transponovat se) v rámci genomu. Podle způsobu přenosu rozlišujeme DNA-transpozony, které během transpozice nevyuţívají přepisu do RNA, a retrotranspozony (RNA-transpozony), u kterých je naopak přepis do RNA a následná zpětná transkripce nezbytná pro přenos. DNA-transpozony se dále dělí na konzervativní a replikativní podle toho, zda se při přepisu počet kopií zvyšuje nebo se nemění. Při retrotranspozici dochází vţdy k nárůstu počtu kopií v genomu. V současné době se v zahraniční literatuře také pouţívá rozdělení na tři skupiny transpozonů: (a) transpozony „cut and paste“ (konzervativní transpozony), (b) replikativní transpozony a (c) retrotranspozony. Konzervativní transpozony - „cut and paste“ - získali své jméno („vystřihni a vloţ“) díky mechanismu svého přenosu. Tyto transpozony jsou po vyštěpení ze svého místa v DNA vloţeny na jiné místo na stejném nebo jiném chromozomu. Na konci 40. a začátku 50. let 20. století byly transponovatelné elementy poprvé predikovány Barbarou McClintock (McClintock, 1951). Její práce ovšem nalezla uznání aţ o mnoho let později, kdy byly její předpoklady o transponovatelnosti elementů dokázány, jednotlivé elementy izolovány a popsány. Mezi významné skupiny těchto elementů patří bakteriální IS-elementy (téţ zvané inzerční sekvence) a sloţené transpozony, označované v názvu písmeny Tn (neplést s Tn-3). Vzájemně se liší svou stavbou, velikostí a tím, ţe sloţené transpozony obsahují kromě genů pro transkripci i další genetický materiál. Mezi eukaryotní konzervativní transpozony patří p-elementy, nebo mariner-elementy. Tn-3 elementy, nazývané také replikativní transpozony se vyskytují pouze u prokaryotických organizmů. Jsou přenášeny plazmidy a na plazmidech se i transponují. Působením transponázy vznikne spojením donorového (obsahuje transpozon) a recipientního (původně bez transpozonu) plazmidu útvar zvaný kointegrát. Právě během jeho formování se transpozon replikuje, takţe v konečném důsledku jsou na kointegrátu jeho dvě kopie. Nakonec se kointegrát působením enzymu resolvázy, který je taktéţ kódován transpozonem, rozpadne a vzniknou dva plazmidy obsahující daný transpozon (Kilbride et al., 1999).

10

Retrotranspozony mají ve srovnání s DNA-transpozony mnohem sloţitější mechanismus přenosu. Nová jednotka je nejdříve přepsána do sekvence RNA, která je následně reverzní transkriptázou přepsána zpět do DNA. Takto vzniklá repetitivní jednotka je schopna začlenit se do téměř libovolného místa genomu. Podle toho, jestli retrotranspozon nese nebo nenese všechny geny pro svůj přenos (hlavně pro reverzní transkriptázu), rozlišujeme autonomní a neautonomní elementy (Arkhipova, 2001). Dalším ukazatelem, slouţícím k rozlišení skupin retrotranspozonů, je přítomnost dlouhých koncových repetic LTR („long terminal repeats“) v jejich stavbě. LTR jsou ve skutečnosti repeticemi uvnitř repetic a slouţí při zabudovávání retrotranspozonů zpět do genomové DNA. Kvůli LTR bývají tyto retrotranspozony někdy označovány také jako endogenní retroviry a jedním ze zátupců této skupiny je rodina Ty3/gypsy, kterou můţeme nalézt v centromerické a subcentromerické oblasti rostliných chromozomů (Neumann et al. 2011). V rámci non-LTR retrotranspozonů (retropozonů) rozlišujeme skupiny LINE („long interspersed nuclear element“), SINE („short interspersed nuclear element“) a také tři telomerově-specifické retropozony Het-A, TART a TAHRE, které nahrazují funkci telomer u D. melanogaster (Pardue a DeBaryshe, 2008). LINE transpozony, konkrétně LINE-1 (6 kb), tvoří 17 % lidského genomu. Z toho 3 aţ 5 tisíc kopií je kompletních a odhadem 500 tisíc kopií je zkrácených na 5´-konci (Rangwala et al., 2009). LINE mají ve své struktuře geny pro enzymy zajišťující celý proces reverzní transkripce. Oproti tomu SINE tyto geny nemají a musí vyuţívat produkty jiných retropozonů. Patří sem například Alu-inzerce tvořená dvěma podjednotkami o délce 120 bp, z nichţ jedna ještě navíc obsahuje inzert o velikosti 30 bp (Economou-Pachnis et al., 1985). Počet opakování dosahuje počtu 700 tisíc kopií na haploidní genom, coţ je přibliţně 11 % celého lidského genomu. Dalšími SINE jsou elementy B2 a ID (Roy et al., 2000). Původ SINE sekvencí je spojován s RNA geny, konkrétně jiţ zmíněné Alu-inzerce s 7SL RNA. U jiných eukaryot je moţné nalézt SINE nejpravděpodobněji odvozené od různých t-RNA nebo 5S RNA (Matsutani, 2006).

11

Tabulka 1. Rozdělení sekvencí v lidském genomu podle základních kritérií (kódující a nekódující sekvence, rozloţení na chromozomu, velikost a schopnost transpozice) a srovnání jejich zastoupení. Převzato z (BROWN, T. Genomes).

12

3 KLASICKÉ BIOFYZIKÁLNÍ METODY NA POČÁTKU POZNÁVÁNÍ REPETITIVNÍ DNA

3.1 CENTRIFUGACE V HUSTOTNÍM GRADIENTU

Centrifugace má pro molekulární biologii zvláštní význam. Vyuţívá se jiţ několik desítek let v celé řadě izolačních postupů a stála i u počátku studia repetitivních sekvencí, konkrétně satelitů. Ze tří základních typů centrifugace (diferenciální, zonální a izopyknické) je právě izopyknická, téţ zvaná hustotní, tou nejvhodnější pro tento typ výzkumu. Umoţňuje citlivou separaci fragmentů DNA na základě jejich odlišné hustoty a výsledkem jsou frakce DNA o vysoké čistotě. Zpočátku byly jednotlivé satelity rozlišovány na základně různé hustoty. Příkladem jsou satelity Th-α a Th-β Thomomys bottae, Ca-α, Ca-β a Ca-γ Cavia porcellus nebo Am-α, Am-β a Am-γ Ammospermophilus harrisi (Mazrimas a Hatch, 1977). Pro dnešní účely je centrifugace vyuţívána uţ jen příleţitostně jako separační prostředek při identifikaci a izolaci repetitivní genomové frakce. Následná charakterizace vychází především ze znalosti sekvence cílové repetice a vzhledem k rozmachu sekvenačních metod se zdá, ţe klasické metody v tomto smyslu nahradí.

3.1.1 PRINCIP A POSTUP Mechanismus izopyknické centrifugace spočívá ve vytvoření sloupce média, který bude mít v různých vrstvách různou hustotu. Částice nacházející se v takto upraveném médiu mají tendenci rozmístit se v něm tak, aby jejich hustota odpovídala hustotě okolního prostředí. Kromě rovnováţných hustotních gradientů, které rozdělují segmenty DNA podle jejich hustoty, se vyuţívají i rychlostní gradienty hustoty (nejčastěji sacharózové), které separují DNA a jiné makromolekuly na základě jejich odlišné sedimentační rychlosti. Jako média se vyuţívají roztoky látek, které hustotní gradient samy při centrifugaci vytvářejí. Někdy je hustotní gradient vytvořen uměle vrstvením roztoků o různé koncentraci na sebe. Podle toho, zda je přechod mezi jednotlivými vrstvami plynulý nebo skokový, rozlišujeme gradient kontinuální a diskontinuální. Osvědčenou látkou pro tvorbu hustotních gradientů je glukóza, ovšem soli cesia (chlorid cesný - CsCl a síran cesný - Cs2SO4) umoţňují aţ dvojnásobně širší rozsah gradientu (1,0 - 1,9 g/ml místo 1,0 - 1,3 g/ml). Další látkou, která našla uplatnění při tvorbě hustotních gradientů, je metrizamid, coţ je triviální název pro

13

2-(3-acetamido-S-N-methylacetamido-2,4,6-triiodobenzamido)-2-deoxy-D-glukózu (Monahan a Hall, 1974). Samotná separace komponent DNA podle její hustoty probíhá tak, ţe DNA je nejprve sonikací (ultrazvukem), vysokorychlostním mícháním nebo enzymaticky štěpena na fragmenty o délce několika set párů bází. V případě roztoků solí cesia se hustotní gradient tvoří samotnou centrifugací a DNA je v tomto roztoku uţ rozpuštěna. V případě koncentračního sloupce vytvořeného metodou vrstvení je DNA nanášena jako poslední vrstva. Po ultracentrifugaci, která můţe, v závislosti na přetíţení, trvat i několik desítek hodin (jeden z protokolů uvádí šedesát hodin při 57 500 g), se vytvoří tenké vrstvy DNA, rozdělené v gradientu dle specifické hustoty (viz obr. 1). Opatrným odpipetování nebo vypuštěním z kyvety lze jednotlivé frakce odebrat a připravit pro další zpracování. Kromě analytické centrifugace pouţívané pro přesnější stanovení hustoty jsou nejčastějšími následnými metodami hybridizace nebo sekvenování, případně klonování do vektoru či PCR.

Obrázek 1. Rozloţení jednotlivých frakcí DNA v průběhu hustotní centrifugace je dáno jejich vznášivou hustotou, spojenou s obsahem GC/AT párů bází. Homogenní roztok DNA je centrifugován tak dlouho, dokud se nevytvoří hustotní gradient a neoddělí se jednotlivé frakce. Převzato z (http://www.umanitoba.ca/afs/plant_science/courses/PLNT3140/l14/l14.html).

3.1.2 VYUŢITÍ CENTRIUGACE V HUSTOTNÍM GRADIENTU PŘI OBJEVOVÁNÍ A STUDIU TANDEMOVÝCH REPETIC Jak jiţ bylo zmíněno výše, centrifugace sehrála zásadní roli při objevení tandemových repetic. Původní analytické vyuţití centrifugace spočívalo ve stanovení hustoty vzorku DNA, z níţ bylo moţné odhadnout poměrné zastoupení GC a AT párů bází podle vzorce

14

, kde je hustota vzorku. Při těchto pokusech byly ve vzorcích pozorovány frakce DNA, které měly odlišnou hustotu neţ hlavní frakce. Podle této vlastnosti získaly i své jméno – satelity. Nejprve jim nebyl přikládán větší význam, ale při bliţším studiu bylo zjištěno, ţe se jedná o úseky DNA tvořené mnohonásobným opakování téţe sekvence. To s sebou nese i změnu v poměru GC/AT párů ve srovnání se zbytkem genomové DNA. Vyšší koncentrace GC párů má za následek zvýšení hustoty daného satelitu oproti zbytku DNA, kdeţto změna ve prospěch AT párů vede k jejímu sníţení. S postupným poznáváním významu tandemových repetic získala centrifugace v hustotním gradientu nové uplatnění. Postupně byly protokoly upravovány tak, aby se zvýšila citlivost separace a bylo moţné oddělit satelity s velmi podobnou, nebo dokonce stejnou hustotou.

K tomu se vyuţívají gradienty převáţně Cs2SO4 (CsCl se pouţívá hlavně pro následnou analýzu jednotlivých frakcí) s přídavkem iontů, které se specificky váţou na AT nebo GC bohaté úseky DNA. Tím dojde ke zvýšení hustoty fragmentů, které je obsahují, a změní se jejich rozvrstvení při centrifugaci. Mezi nejčastěji pouţívané látky patří stříbro, které se váţe na úseky s vysokou koncentrací guaninu, zatímco pro rtuť a některé její sloučeniny, jako je například 3,6- bis(acetatomercurimethyl) dioxan, je specifická vazba na oblasti bohaté na thymin (Bunemann a Dattagupta, 1973). Další moţnost, jak oddělit dva satelity s velmi podobnou hustotou, spočívá ve změně pH gradientu. Například rozborem satelitních sekvencí HS-alfa, Hs-beta a MS u devíti druhů řádu Rodentia (konkrétně Dipodomys ordii, D. compactus, D. microps, D. panamintinus, D. heermanni, D. merriami, D. ingens, D. agilis a D. stephensi) bylo zjištěno, ţe satelity HS-alfa i HS-beta vykazují u všech druhů shodné vlastnosti jak v neutrálním, tak v zásaditém gradientu CsCl. Oproti tomu satelit MS vykazuje druhově specifickou odlišnost v zásaditém gradientu CsCl (Mazrimas a Hatch, 1972; 1977).

15

3.2 ANALÝZA C0t FRAKCÍ

3.2.1 STRUKTURNÍ A FYZIKÁLNÍ PODSTATA RENATURACE DNA Denaturace a renaturace DNA byla intenzivně zkoumána od konce padesátých let dvacátého století a výsledky tohoto výzkumu jsou dodnes vyuţívány nejen při analýze C0t frakcí, ale i v hybridizačních metodách, kterým bude věnována samostatná kapitola. Jiţ v roce 1961 přinesl C. Schildkraut první poznatky o průběhu renaturace DNA (Schildkraut et al., 1961), ale mechanizmus obnovování dvouřetězce z denaturovaných vláken - renaturační kinetika - byl detailně popsán aţ o sedm let později (Britten a Kohne, 1968). DNA má v přirozeném stavu strukturu dvojité šroubovice, kde jsou u sebe jednotlivé nukleotidové řetězce drţeny vodíkovými můstky mezi párem bází (GC - 3 můstky, AT - 2 můstky) a hydrofobními interakcemi. Při zvýšení teploty dochází k postupnému rozvolnění těchto vazeb a vzniku jednořetězcové DNA (ssDNA). Tento proces se nazývá denaturace, je reverzibilní a po pominutí extrémních podmínek má DNA tendenci opět se spojovat do své původní struktury. Dochází k rozpoznávání komplementárních úseků a obnově původních vazeb mezi nimi – renaturaci. Vyuţívaným faktorem, který renaturační kinetiku ovlivňuje, je čas potřebný ke spárování homologních sekvencí u určitého mnoţství kopií dané sekvence. Čím více je kopií této sekvence ve vzorku (genomu), tím větší je pravděpodobnost jejich setkání v průběhu renaturace a tím rychleji se spojují oproti jednokopiovým sekvencím. Na základě tohoto poznatku lze snadno logicky vyvodit, ţe prvními úseky DNA, které začnou renaturovat, jsou repetice s velkým počtem opakování, následují středně kopiové sekvence a nakonec unikátní sekvence (Peterson et al., 2002) Renaturace nemusí být vţdy stoprocentně přesná. Nejčastěji k nepřesnostem dochází při velmi prudkém ochlazení. Mnoţství chybných párování, které ještě nevede k rozpadu dvouřetězce, je přímo úměrné jeho délce. Čím delší je renaturovaný úsek, tím více chyb se v něm můţe vyskytnout. Pokud tedy chceme, aby při renaturaci docházelo k co nejmenšímu mnoţství chyb, musíme ochlazování provádět pomalu. Postupně je tak dosahováno teploty, která je dostatečně nízká pro navázání komplementární sekvence, ale příliš vysoká pro hybridizaci úseků s nesprávným párováním. Dalším prostředkem k zamezení nespecifických interakcí je eliminace hydrofobního působení, které zvyšuje tendenci DNA k tvorbě dvouřetezců, změnou rozpouštědla.

16

V laboratorních podmínkách se denaturace provádí ohřátím vzorku na teplotu přibliţně 95 ºC. Teplota tání různých sekvencí můţe značně kolísat v závislosti na poměru párů GC/AT, kdy při vyšší koncentraci GC v sekvenci je vyšší i její bod tání, dále pak na podmínkách, v jakých denaturace probíhá (pH, rozpouštědlo) a v neposlední řadě také na délce oligonukleotidu, který denaturujeme (delší řetězce denaturují pomaleji neţ krátké). Ke sníţení teploty tání se vyuţívá změny koncentrace solí v roztoku DNA, díky čemuţ se zvýší odpudivá síla záporně nabitých fosfátových skupin, změna pH roztoku, nebo pouţití specifických rozpouštědel jako je formamid, který narušuje vodíkové můstky.

3.2.2 STANOVENÍ TEPLOTY TÁNÍ – HYPERCHROMNÍ EFEKT Sledováním průběhu denaturace můţeme stanovit bod tání vzorku DNA, který je doprovázen hyperchromním efektem, detekovatelným pomocí spektrofotometrického měření absorbance vzorku. Při rozpadu dvouřetězce DNA (dsDNA) na jednořetězce dochází k postupnému nárůstu absorbance vzorku. Tento nárůst je nejprve pomalý a signalizuje rozvolňování AT bohatých oblastí. Poté ve velmi úzkém teplotním rozpětí dojde k rychlému rozpadu většiny dvouvláknových fragmentů DNA, coţ je doprovázeno prudkým nárůstem absorbance. V poslední fázi dochází k rozpadu posledních GC bohatých oblastí a dlouhých fragmentů, coţ můţeme opět sledovat jako pozvolný nárůst absorbance, který se limitně blíţí k teoretické hodnotě. Teplota tání se určuje podle polohy inflexního bodu křivky (viz obr. 2). Za zvýšenou absorbancí ssDNA stojí heterocyklická jádra bází, která jsou u dsDNA uspořádána uvnitř řetězce a v této formě mají menší absorbanci, neţ v případě neuspořádané struktury ssDNA, kdy ční volně do prostoru.

Obrázek 2. Stanovení teploty tání DNA hyperchromním efektem. Jak se při denaturaci zvyšuje podílu jednořetězcové DNA ve vzorku, vzrůstá i jeho absorbance. Z log-fáze grafu, který tuto změnu znázorňuje, můţeme stanovit teplotu tání DNA v tomto vzorku (Tm). Převzato z (http://sandwalk.blogspot.com/2007/12/dna-denaturation-and-renaturation-and.html). 17

3.2.3 APLIKACE RENATURAČNÍ KINETIKY PŘI STUDIU REPETIC Stejně jako u izopyknické centrifugace, také v tomto případě se jedná o účinnou klasickou biofyzikální metodu izolace repetitivních sekvencí. Vyuţití analýzy C0t frakcí se ovšem nesoustřeďuje pouze na izolaci. Má široké uplatnění v rámci popisu genomové struktury nebo při srovnávání mezidruhové genomové stavby. Základním krokem je příprava vzorků genomové DNA v různém stupni její renaturace.

Tyto vzorky jsou označovány jako C0t-n frakce, kde hodnota n se počítá jako násobek průměrné nukleotidové koncentrace (mol/l), renaturační doby (v sekundách) a tzv. faktoru pufru odvozeného od koncentrace sodných iontů (Peterson et al., 2002). Tato hodnota slouţí jako ukazatel stupně renaturovanosti vzorku, coţ zprostředkovaně odpovídá i zastoupení repetitivní

DNA. Zatímco ve frakcích s niţší hodnotou C0t se budou vyskytovat repetice s vysokým počtem kopií, se zvyšující se hodnotou budou přibývat i méně se opakující sekvence. Nutno dodat, ţe stoprocentní renaturace nelze prakticky dosáhnout. Příprava jednotlivých frakcí probíhá tak, ţe DNA je sonikací nebo vysokorychlostním mícháním naštěpena v prvním kroku na fragmenty o délce 300 aţ 500 bp (nejčastěji se jako optimální délka uvádí 450 bp), obdobně jako tomu je u hustotní centrifugace. Následně je DNA rozpuštěna ve fosfátovém pufru s různou molární koncentrací sodných iontů (SPB), (standardně 0,03 M, 0,12 M a 0,50 M) a z nich jsou připraveny vzorky o známé koncentraci DNA (např. 1μg/μl). Po denaturaci varem je vzorek vystaven renaturačním podmínkám tak dlouho, dokud nedosáhne poţadované hodnoty C0t. Renaturace je zastavena rozředěním ve stonásobném objemu 0,03 M SPB nebo prudkým ochlazením a následuje separační krok, při kterém jsou odděleny renaturované a denaturované molekuly. Ten se provádí dvěma moţnými způsoby. V prvním případě se nukleázou S1 štěpí jednořetězcová frakce a k dispozici zůstává pouze renaturovaná část. Pokud je účelné zachovat i ssDNA, provádí se separace pomocí hydroxyapatitové chromatografie. Hydroxyapatitová chromatografická kolona je schopna na sebe vázat jednovláknovou i dvouvláknovou DNA v 0,03 M roztoku SPB. Při promývání roztokem SPB o vyšší iontové aktivitě se z hydroxyapatitu uvolňuje nejprve pouze jednořetězcová (0,12 M SPB), a následně i dvouřetězcová (0,5 M SPB) DNA. Nakonec se spektrofotometricky stanoví koncentrace získané ssDNA a dsDNA a jejich vzájemný poměr. Z takto získaných dat lze sestavit graf zobrazující průběh renaturace (viz obr. 3). Na osu x jsou vyneseny logaritmované hodnoty C0t a na osu y zastoupení ssDNA v příslušné frakci. Pro zpracování grafu i jeho vyhodnocení se nejčastěji pouţívá počítačový program vyvinutý W. R. Pearsonem (Pearson et al., 1977). 18

Podle tvaru křivky je moţné efektivně odhadovat, jak velkou část genomu tvoří repetitivní sekvence a zda se jedná o sekvence s vysokým, středním, nebo nízkým počtem kopií. Díky těmto poznatkům bylo mimo jiné stanoveno, ţe genom rajčete (L. esculentum) a je tvořen z více neţ 73 % jednokopiovými sekvencemi, přestoţe v jádře je minimálně 77 % DNA uloţeno v heterochromatinovém stavu (Peterson et al., 1998).

Obrázek 3. Renaturační křivka Sorghum bicolor s vyznačenou závislostí renaturace sekvencí na počtu jejich kopií (Peterson et al., 2002). V první fázi renaturace se spojují výhradně sekvence s vysokým počtem opakování. Čím menší je počet kopií repetice v genomu, tím později budou renaturovat.

Drobnou modifikací lze mechanismu přípravy C0t frakcí vyuţít i pro izolaci vybraných frakcí DNA (Zwick et al., 1997; Peterson et al., 2002). C0t-1 frakce, tvořená vysoce repetitivními sekvencemi se pouţívá v hybridizačních metodách s celogenomovými sondami, jako je GISH (genomová in situ hybridizace) nebo CGH (komparativní genomová hybridizace), k utlumení nespecifického hybridizačního potenciálu konzervativních repetic. Je tím upřednostněna hybridizace především euchromatinových úseků, coţ vede ke zvýšení specificity reakce. Také je moţné C0t-1 frakci vyuţít jako sondu při genotypování (Leung, 1999).

Vyuţití analýzy C0t frakcí při srovnávání genomů spočívá ve sledování renaturace směsi DNA ze dvou odlišných genomů. DNA jednoho bude renaturovat nejen sama se sebou, ale i s komplementárními úseky DNA druhého genomu. Na základě odlišností mezi renaturační křivkou směsi a kaţdého jednotlivého genomu můţeme porovnávat jejich příbuznost.

19

3.3 KLASICKÉ METODY VYUŢÍVAJÍCÍ NUKLEÁZY

3.3.1 IZOLACE SATELITŮ ŠTĚPENÍM GENOMOVÉ DNA RESTRIKČNÍMI ENDONUKLEÁZAMI Tato technika vznikla v 70. letech 20. století jako varianta izolace tandemových repetic DNA centrifugací v hustotním gradientu. Restrikční endonukleázy, izolované poprvé v roce 1970 (Kelly a Smith, 1970; Smith a Wilcox, 1970), štěpí DNA uvnitř řetězce a jejich specificita je dána sekvencí, kterou jsou schopné rozpoznat a rozštěpit. V prvním kroku je genomová DNA specifickými restrikčními endonukleázami naštěpena na fragmenty o různé délce, která odpovídá vzdálenosti jednotlivých restrikčních míst. Restrikční místa se v genomu vyskytují nahodile, ale pokud je neobsahuje repetitivní jednotka, nikdy se nebude vyskytovat uvnitř tandemových repetic. Proto nejdelšími fragmenty, které bude moţné po restrikčním štěpení genomové DNA získat, budou právě satelity. K jejich separaci se vyuţívá konvenční, v případě velmi dlouhých fragmentů i pulzní gelová elektroforéza. Samotná analýza fragmentů se nejčastěji provádí pomocí hybridizačních metod nebo klonováním s následným sekvenováním. Názorným příkladem vyuţití této metody je izolace vysoce repetitivních úseků DNA Rattus rattus, které nebylo moţné separovat hustotní centrifugací (Pech et al., 1979), nebo analýza dlouhých fragmentů DNA odolných vůči restrikčním endonukleázám v genomu Nicotiana tabacum (Suzuki et al., 1994).

3.3.2 ANALÝZA TERMINÁLNÍCH RESTRIKČNÍCH FRAGMENTŮ (TRF) Na principu restrikčního štěpení byla vypracována spolehlivá metoda měření délky telomerové DNA. Je odvozenou aplikací výše popsané izolace repetitivních sekvencí restrikčními enzymy s následnou analýzou pomocí hybridizace s radioaktivně značenou sondou. Genomová DNA je nejprve naštěpena restrikčními enzymy, jejichţ cílová místa se v telomerové sekvenci nenacházejí. Telomery rostlin jsou, aţ na několik výjimek (Sykorova et al., 2003), tvořeny tandemovým opakováním sekvenčního motivu 5´-TTTAGGG-3´ (Richards a Ausubel, 1988). U člověka a dalších obratlovců se jedná o sekvenci 5´-TTAGGG-3´ (Cheng et al., 1989; Meyne et al., 1989). Mezi enzymy, které tyto motivy nerozpoznávají, a tudíţ jsou vhodné pro jejich enzymatickou izolaci, patří například MseI, která štěpí sekvenci 5´-TTAA-3´ mezi thyminy, nebo HaeIII, který štěpí sekvenci 5´-GGCC-3´ mezi guaninem a cytosinem. Výsledné restrikční fragmenty jsou podle své velikosti rozděleny na gelové elektroforéze a pomocí Southernova přenosu imobilizovány na hybridizační membránu. Pro detekci 20 telomerických sekvencí hybridizací se pouţívají k nim komplementární oligonukleotidové sondy značené na 3´-konci radioaktivním fosforem 32P (detailnější popis sond je uveden v kapitole č. 4.1 věnované hybridizačním metodám). Porovnáním s velikostním standardem pak můţeme určit jejich délku. V roce 2003 byla popsána alternativa této metody vyţívající v prvním kroku amplifikaci telomer pomocí PCR s primerem specifickým pro subtelomerickou oblast jednotlivých chromozomůch rostliny Arabidopsis thaliana. Díky tomu je moţné studovat koncové oblasti kaţdého chromozomu samostatně. Této metodě bude věnován prostor v kapitole 4.2 zaměřené na metody PCR.

3.3.3 EXONUKLEÁZOVÁ ANALÝZA TERMINÁLNÍCH SEKVENCÍ ENZYMEM BAL31 Exonukleáza Bal31 je dalším enzymem vyuţívaným při analýze telomerových repetitivních sekvencí. Na rozdíl od endonukleáz neštěpí řetězec dsDNA na konkrétních místech uvnitř genomu, ale postupně odštěpuje konstantní rychlostí jednotlivé nukleotidy z obou konců (viz obr. 4). Proto se jí vyuţívá k důkazu, ţe kandidátní telomerová sekvence je skutečně terminální, jako v případě snahy o lokalizaci repetice 5´-TTAGGG-3´ v genomu rostlin rodu Allium. Přestoţe se ve skupině Alliaceae tato sekvence vyskytuje jako sekvenční motiv telomer, u rodu Allium je zachována pouze jako vnitřní tandemová repetice, nebo úplně chybí (Sykorova et al., 2006). Naopak kladný výsledek přinesla tato metoda při zkoumání telomer u dvou druhů ze skupiny Dinoflagellata, konkrétně Karenia papilionacea a Crypthecodinium cohnii. Zde byl v součinnosti s metodou in situ hybridizace, potvrzený „rostlinný“ typ telomer 5´-TTTAGGG-3´ (Fojtova et al., 2010). Stanovení se provádí na vzorku jaderné DNA, která musí být izolována tak, aby nedošlo k jejímu nadměrnému rozlámání, čehoţ se dosáhne purifikací DNA z buněk nebo jader zalitých do agarózových bločků. Po purifikaci je DNA nejprve naštěpena enzymem Bal31 v několika souběţných reakcích s různými časy působení enzymu (nejčastěji 5 vzorků s časovým působením v rozmezí deset aţ devadesát minut), čímţ je dosaţeno různé míry degradace konců chromozomů. Po ukončení štěpení je celá DNA fragmentována pomocí vybraných restrikčních enzymů, které nemají restrikční místo v telomerové repetitivní sekvenci (viz výše). Tyto fragmenty jsou na gelové elektroforéze rozděleny podle své délky a, stejně jako u TRF analýzy, jsou po přenesení na nylonovou membránu označeny sondou komplementární ke stanovované sekvenci. Pokud výsledný hybridizační signál vykazuje zkracování a úbytek intenzity v závislosti na délce působení Bal31, leţí tato sekvence na konci chromozomu. Samozřejmě takový důkaz musí být podpořen dalšími daty, například detekcí telomerázových 21 produktů, lokalizací telomerového signálu in situ, nebo detekcí identifikované sekvence na „uzdravených chromozomových zlomech“.

Obrázek 4. Mechanismus působení exonukleázy Bal31 a endonukleoázy EcoRI. Jednotlivé báze jsou exonukleázou konstantní rychlostí odštěpovány z obou konců dsDNA, zatímco endonukleázy štěpí konkrétní sekvence uvnitř řetězce (Liu et al. 2006).

22

4 METODY POUŽÍVANÉ OD 70. LET 20. STOLETÍ DODNES

4.1 HYBRIDIZAČNÍ TECHNIKY

4.1.1 POČÁTKY HYBRIDIZAČNÍCH METOD V šedesátých letech dvacátého století došlo k rozmachu technik vyuţívajících princip renaturace zkoumané DNA se značenou sondou při odhalování společných sekvencí v příbuzných i nepříbuzných genomech, při detekci cílové DNA imobilizované na membránách a konečně i při lokalizaci na cytologických preparátech. Uţ v roce 1969 byl publikován článek, ve kterém byla popsána detekce a lokalizace předpokládané nukleotidové sekvence pomocí radioaktivně značených sond v cytologických preparátech. Nejprve bylo vyuţito hybridizace DNA-DNA a následovalo i vyuţití sond na bázi RNA (Gall a Pardue, 1969). O rok později byl tento postup úspěšně vyuţit k lokalizaci satelitní DNA v myším genomu (Pardue a Gall, 1970). Zmíněné studie patří k základním kamenům jedné z nejpouţívanějších a také nejoblíbenějších technik molekulární biologie – metodě in situ hybridizace. Název „in situ“ pochází z latinského spojení „na svém místě“ a popisuje postup hledání sekvencí uvnitř chromozomů, v místě jejich přirozeného uloţení. Hybridizace nukleové kyseliny se značenou sondou se vyuţívá i při analýze rozmanitých vzorků izolované DNA či RNA, produktů PCR nebo restrikčního štěpení. Podstatou těchto analýz je imobilizace nukleové kyseliny na speciálních membránách. Široce vyuţívanou metodu přenosu DNA z agarózového gelu a její imobilizaci na membránu jako první popsal E. M. Southern, podle kterého byla tato metoda i pojmenována (Southern, 1975). Později byl popsán i přenos RNA (northernový přenos) a proteinů (westernový přenos).

4.1.2 PRINCIP HYBRIDIZAČNÍCH METOD

Princip této metody je, stejně jako analýza C0t frakcí, zaloţena na renaturační kinetice DNA. Místo renaturace se ale pro označení procesu spojování dvou řetězců pouţívá pojem hybridizace. Nedochází totiţ k obnově původní struktury DNA, nýbrţ ke vzniku hybridního duplexu tvořeného původní neznačenou molekulou a značenou molekulou uměle vytvořenou nebo upravenou. Po denaturaci vzorku teplem dojde k jeho ochlazení a vazbě komplementárních úseků sondy a cílového místa. Pokud se ve vzorku nachází sekvence komplementární k sondě,

23 sonda se na ni naváţe a po odmytí nenavázaných nebo nespecificky navázaných sond je moţné ji detekovat. V průběhu 90. let 20. století bylo popsáno několik metod, které se snaţily denaturaci vysokou teplotou obejít. Jednalo se o postupy zaloţené na enzymatickém rozvolňování dsDNA, hledaly se optimální časy a teploty pro denaturaci a renaturaci (Fast-FISH) (Durm et al., 1996), vyuţívalo se degradace nově syntetizovaných řetězců DNA (CO-FISH) a po objevení PNA sond (budou popsány dále) se začalo i s jejich přímou hybridizací na dvouřetězcovou DNA za vzniku třířetězcové struktury (Kuhn et al., 2002).

4.1.3 HYBRIDIZAČNÍ SONDY Aby bylo moţné sondy specificky detekovat, vyuţívá se několik typů jejich značení. Původní metoda vyuţívala pouze radioaktivně značené sondy obsahující izotopy 3H, 32P, 33P, 35S nebo 125I a autoradiografickou detekci signálu na citlivé vrstvě (Jin a Lloyd, 1997). Výhoda značení pomocí radioaktivních izotopů spočívá hlavně v jeho jednoduchosti a citlivosti, kterou moderní fluorescenční postupy zatím nebyly schopny překonat. Proto je radioaktivní značení stále široce vyuţívanou metodou při detekci (nejen) repetitvních sekvencí na membráně, například při analýzách TRF a Bal31, nebo při hybridizačním stanovení produktů PCR. Pouţívají se celkem tři postupy inkorporace radioaktivního atomu (nejčastěji 32P) do sondy: a) koncové značení, b) pomocí posunu jednořetězcového zlomu („nick-translace“) a c) v průběhu PCR. Koncové značení lze provést jak na 5´-konci, tak na 3´-konci. U 5´-konců je značení prováděno polynukleotid kinázou, zaměňující fosfátovou skupinu na 5´-konci DNA za radioaktivní s radioizotopem 32P. Ke značení 3´-konců slouţí terminální transferáza, která v tomto směru prodluţuje oligonukleotid, slouţící jako sonda, o značené nukleotidy. Další variantou značení 3´-konců je dosyntetizování přesahů indukovaných restriktázami pomocí DNA-polymerázy. Nick-translace zabudovává značené nukleotidy dovnitř řetězce DNA. Nejprve je DNázou I způsoben v DNA náhodný zlom, tzv. nick, který je DNA-polymerázou zacelen za pouţití nukleotidů obsahujících radioaktivní nuklid. Při tvorbě sond pomocí PCR se specifickými i náhodnými primery jsou v jejím průběhu do nově syntetizovaného řetězce, který bude slouţit jako sonda, začleňovány nejen normální nukleotidy, ale také nukleotidy s radioaktivní značkou. U sond pouţívaných při hybridizačních pokusech se kromě radioaktivního značení pouţívá i značení imunochemické. V tomto případě je na sondu navázána určitá látka (typickým 24 příkladem je digoxigenin nebo biotin) nebo je do řetězce inkorporován analog báze (např. bromdeoxyuridin). Po hybridizaci se provede promytí vzorku, aby nenavázané sondy neznehodnocovaly výsledky, a vyuţijí se protilátky specifické pro chemickou sloučeninu, nebo analog báze, který je součástí sondy. Jelikoţ tyto protilátky mají ve své struktuře zabudovaný specifický enzym (alkalická fosfatáza, nebo luciferáza), přidáním substrátu se aktivuje reakce, která stanoví přítomnost a polohu sondy. Pro zvýšení citlivosti se někdy pouţívá systém zahrnující sondu, protilátku sondy a teprve poté značenou protilátku, která se váţe na komplex první protilátka-sonda. Příkladem detekční dráhy můţe být biotin, který je součástí sondy a na který se jako protilátka váţe avidin (případně streptavidin). Na avidin je vázána peroxidáza. Pokud sonda hybridizuje s komplementárním místem, naváţe se avidin s peroxidázou na biotin (vznikne tzv. ABC komplex) a po přidání substrátu můţeme detekovat jasné záření.(Hsu et al., 1981) U metod prováděných na cytologických preparátech (tzv. „in situ“), kdy jsou hledané sekvence označovány hybridizačními sondami přímo na chromozomech, se od druhé poloviny 70. let ke značení sond začala vyuţívat fluorescenční barviva, jako je fluorescein, kumarin, rhodamin a řada dalších, synteticky připravených. Barviva jsou součástí protilátek – nepřímé značení, nebo jsou navázána přímo na sondu – přímé značení. Výhoda fluorescenčního značení spočívá nejen ve snadné manipulaci a moţnosti rychlého vyhodnocení, ale i v dlouhé ţivotnosti sond. Dalším nezanedbatelným pozitivem je široká škála barev, která umoţňuje aplikovat na jeden vzorek několik různých sond současně. Stejně jako se rozvíjely metody značení sond, vyvíjeli se i sondy samotné. Postupně byly uváděny do praxe analogy nukleových kyselin, jako jsou PNA („peptide nucleic acid“), nebo LNA („locked nucleic acid“), které díky vlastnostem plynoucím z jejich struktury našly značné uplatnění. Základem sond PNA je sekvence bazí, stejně jako je tomu u nukleových kyselin, ale “cukr- fosfátová“ kostra byla nahrazena peptidovým řetězcem (viz obr. 5). Tato záměna ruší záporný náboj indukovaný zbytky kyseliny fosforečné a díky tomu je sonda stabilnější a nepodléhá odpuzujícím silám, které působí mezi řetězci nukleových kyselin. Výhodou sond PNA je i jejich vyšší specifita. Bylo zaznamenáno, ţe chyba v párování jednoho nukleotidového páru v 15 bp dlouhé hybridní molekule DNA-PNA má za následek sníţení teploty tání duplexu o 15 °C, zatímco u duplexu DNA-DNA o stejné délce je to pouze o 11 °C. Krátké sondy PNA (nejčastěji o délce 17 aţ 22 bp) tedy představují velmi účinný nástroj pro hybridizační metody vyţadující vysokou přesnost (Pellestor, 2006).

25

Dalším důleţitým pozitivem je schopnost vázat se na dsDNA za tvorby třířetězcové struktury v homopurinových/homopyrimidinových oblastech (viz obr. 6), coţ usnadňuje průběh hybridizační reakce (Nielsen, Egholm, 1999).

Obrázek 5. Struktura PNA sondy (Nielsen, Egholm, 1999). Jednotlivé báze jsou řazeny za sebou jako v případě normálního nukleotidového řetězce, ale spojovány jsou proteinovým řetězcem

Obrázek 6. A) Třířetězcová struktura dsDNA a například PNA sondy, B) Triplety bází a řetězcová orientace pyrimidinového motivu, C) Triplety bází a řetězcová orientace purinového motivu (Van Dyke, 2000)

26

Struktura sond LNA je zaloţena na jiném principu. Jedná se o derivát molekuly RNA, ve které je atom kyslíku vázaný na atomu C2 ribózy spojen pomocí metylové skupiny s uhlíkem

C4 ribózy (viz obr. 7). Tato vazba „uzamyká“ cukerný zbytek v konformaci 3´ endo preferované při hybridizaci s jinou molekulou RNA nebo DNA. Takto zvýšená afinita není vykoupena sníţenou specificitou a navíc jsou sondy s takto upravenou strukturou odolné vůči štěpení nukleázami (Demidov, 2003). Rozšiřovalo se i uplatnění hybridizace in situ ve vztahu ke zkoumanému materiálu. Kromě jiţ zmíněné hybridizace DNA-DNA a RNA-DNA se začaly vyuţívat i protokoly RNA-RNA a DNA-RNA (Jin a Lloyd, 1997).

Obrázek 7. Struktura LNA sondy. Methylová skupina spojuje atom C4 s kyslíkovým atomem na uhlíku C2, čímţ je zajištěna správná konformace cukerného zbytku pro hybridizaci. Převzato z (http://en.wikipedia.org/wiki/Locked_nucleic_acid/).

4.1.4 PŘÍKLADY VYUŢITÍ HYBRIDIZAČNÍCH METOD PRO ANALÝZU REPETITIVNÍCH SEKVENCÍ 4.1.4.1 Kvantitativní FISH (Q-FISH) a dot blot hybridizace Kvantitativní fluorescenční in situ hybridizace je osvědčený nástroj slouţící ke stanovení počtu repetitivních jednotek v genomu. Můţe být vyuţíván například pro sledování úbytku telomerových repetic při opakovaném buněčném dělení. Rychlý odhad délky telomer u různých typů lidských buněk (hlavně nádorových) představuje nadějné uplatnění této metody v oboru, kde čas je kritickým faktorem. Představuje tak alternativu ke klasickému stanovení průměrné délky telomer pomocí analýzy telomerických restrikčních fragmentů (TRF), které je přesnější, ale časově náročnější. Základním principem, na kterém tato metoda pracuje, je porovnávání intenzity fluorescenčního záření emitovaného sondami navázanými na repetitivní sekvence ve zkoumaném vzorku s intenzitou záření vzorku o známém obsahu značených sekvencí. Čím vyšší je intenzita signálu, tím více sond je navázaných na cílové sekvence. Takto se dá porovnat mnoţství repetic mezi jednotlivými vzorky, případně odhadnout počet kopií.

27

Jako sondy slouţí komplementární sekvence DNA nebo PNA. K měření dat se pouţívají dva odlišné přístupy. První spočívá v odečítání intenzity záření ze snímků z fluorescenčního mikroskopu. Druhý, někdy téţ označovaný jako flow-FISH, nebo Q-FISHFCM, vyuţívá průtokové cytometrie. Flow-FISH umoţňuje velmi rychle vyhodnotit data z velkého mnoţství buněk (aţ několik tisíc buněk v průběhu hodiny), ovšem na rozdíl od Q-FISH vyuţívajícího analýzu fluorescenčních snímků můţe stanovit pouze průměrnou hodnotu repetic ve zkoumaném materiálu (Hultdin et al., 1998; Slijepcevic, 2001). V obou případech je pro správné a rychlé vyhodnocení nutný vhodný software, jakým je například „Tissue Telo“ (Takubo et al., 2010). Alternativou kvantitativní fluorescenční in situ hybridizace je na membráně prováděná dot blot hybridizace. Ta je postavena na srovnání signálu odpovídajícímu vzorku DNA o známé koncentraci a známém počtu repetitivních sekvencí se signálem vzorku o známé koncentraci DNA ale neznámým počtem repetic. Referenční vzorek je obvykle představován vektorem s vnesenou stanovovanou sekvencí. Zkoumaným vzorkem pak je izolovaná genomová DNA. Z referenčního i zkoumaného vzorku je připravena sestupná koncentrační řada a ta je tečkovací metodou nanesena na membránu. Po hybridizaci cílových sekvencí s radioaktivně značenými sondami je moţné změřit intenzitu signálu, která odpovídá mnoţství navázaných sond a na základě dat získaných z koncentrační křivky referenčního vzorku stanovit mnoţství repetitivních jednotek ve vzorku studovaném. Samotné měření i stanovení výsledků se provádí pomocí počítačových programů, jednímţ z nich je kupříkladu Multi Gauge (Fuji Film). Tento postup byl například vyuţit při zjištění, ţe mutace v genu fas u Arabidopsis thaliana, která má za následek narušení funkce faktoru organizujícího chromatin 1 (CAF 1), vede mimo jiné k rychlému úbytku kopií rDNA v genomu (u páté generace aţ na 15 % původního počtu), ovšem bez vlivu na mnoţství výsledného transkriptu v buňce (Mozgova et al., 2010).

4.1.4.2 Multiplex (multicolor) FISH (M-FISH) Postupy značení vzorků pomocí dvou a více různých sond byly dobře známé jiţ v polovině 90. let 20. století. Vyuţívalo se nejen barvení pomocí odlišných fluorescenčních barviv, ale i metody kombinující značení fluorescenční s imunochemickým, případně radioaktivní značení s neradioaktivním (Trembleau et al., 1993). K dalšímu rozvoji metod vícečetného značení došlo v roce 1996, kdy Michael R. Speicher se svými spolupracovníky sestrojil detekční přístroj a počítačový software schopný rozlišit dvacet sedm různých, souběţně aplikovaných sond slouţících k rozlišení lidských chromozomů (Speicher et al., 1996). Tato metoda byla určena pro usnadnění lidského karyotypování a

28 zpřesnění cytologických vyšetření. Metoda FISH se pro určení karyotypu člověka vyuţívá dodnes. V roce 2001 byla technika identifikace chromozomů pomocí fluorescenční in situ hybridizace popsána i u myší. Byly pouţity pouze tři různé sondy a v závislosti na místu jejich navázání na chromozom šlo určit, o který chromozom se jedná. Nevýhodou tohoto postupu bylo, ţe neumoţňoval další cytologická vyšetření, jako například stanovení delecí nebo translokací (Henegariu et al., 2001). V roce 2004 bylo vyuţito vysoké koncentrace repetitivních sekvencí v genomu kukuřice (Z. mays) pro sestavení kombinace sond umoţňujících spolehlivou detekci chromozomů na základě rozloţení různých repetitivních sekvencí v nich. Bylo vybráno osm sekvencí, ke kterým byly vytvořeny komplementární sondy značené různými fluorofory. Po provedení hybridizace a vyhodnocení fluorescenčního obrazu se daly na základě rozmístění repetic jednotlivé chromozomy přesně identifikovat (Kato et al., 2004). Na stejném principu bylo provedeno i rozlišení chromozomů Larix principis-rupprechtii (Liu et al., 2007), Silene latifolia (Lengerova et al., 2004) nebo Picea abies (Vischi et al., 2003).

4.1.4.3 CO-FISH a COD-FISH Chromosom-orientation FISH, nebo-li téţ vláknově specifická fluorescenční in situ hybridizace (CO-FISH), je modifikovaná metoda FISH, která k tvorbě jednovláknové DNA nevyuţívá tepelnou denaturaci, ale cílenou degradaci nově syntetizovaného řetězce v replikované DNA. Díky semikonzervativnímu průběhu replikace obsahuje kaţdá dceřiná molekula DNA jedno nově syntetizované a jedno mateřské vlákno. K tomu, aby bylo moţné provést degradaci dceřiného vlákna, inkorporují se do nově syntetizovaného vlákna místo thyminů jejich analogy bromdeoxyuridin a bromdeoxycytidin. Ty poskytují preferenční místa pro tvorbu zlomů při působení UV záření. Takto vzniklé zlomy jsou napadány exonukleasou III, která po optimalizaci dokončí štěpení dceřiného vlákna, aniţ by byla narušena struktura vlákna mateřského. Pokud je zachycena metafáze, kde zůstanou sesterské chromatidy vedle sebe a kaţdá bude obsahovat pouze jedno mateřské vlákno z původního chromozomu, získáváme informaci nejen o pozici sekvence ale i její orientaci (viz obr. 8) (Bailey et al., 2004). Základy této metody poloţil v roce 1993 E. Goodwin a J. Meyne, kteří ji vyuţili k určení orientace repetitivní sekvence v centromeře 18. lidského chromozomu (Goodwin a Meyne, 1993). Později byla díky této technice stanovena orientace pericentromerické satelitní DNA u myší a byla vyuţívána i pro studium telomer (Bolzan a Bianchi, 2006). CO-FISH (v součinnosti s klasickou FISH a PRINS, viz 4.1.4.6) byla pouţita i pro analýzu satelitní DNA

29 při studiu Robertsonovských translokací u myších telocentrických chromozomů (Garagna et al., 2001). Taktéţ představuje velmi dobrý nástroj pro studium inverzí (Bailey et al., 1996). Původní CO-FISH metoda vyuţívala pouze značení pomocí jedné sondy. Za účelem rozšíření moţností vyuţití byla záhy zdokonalena a vznikla COD-FISH metoda (Meyne a Goodwin, 1995). Začalo se pouţívat několikanásobného značení, kombinující sondu pro hledanou sekvenci se sondou pro telomerickou oblast, coţ umoţňuje snadnější lokalizaci a popis orientace studovaných sekvencí (viz obr. 9).

Obrázek 8. CO-FISH metoda (Meyne, Goodwin, 1995) A) původní chromozom, B) proces replikace, kdy jsou do nově syntetizovaných vláken inkorporovány analogy bazí, C) rozpad nových vláken působením UV záření a exonukleázy, D) značení pomocí ssDNA sondy pro centromerickou sekvenci. Díky komplementaritě poskytují jen 1 signál, E) výstup ve fluorescenčním mikroskopu

Obrázek 9. COD-FISH (Meyne, Goodwin, 1995) A) značení telomerových sekvencí na 3´ koncích chromozomů bohatých na guanin sondou bohatou na cytosin, B) výstup na fluorescenčním mikroskopu s jasným vyznačením orientace řetězce. 30

4.1.4.4 GISH Genomová in situ hybridizace je variantou klasické metody FISH a její podstatou je srovnávání jednoho genomu, který celý slouţí jako značená sonda, s genomem jiným. Poprvé byla technika představena při studiu uspořádání rodičovských chromozomů v genomu hybrida vzniklého kříţením Secale africanum a Hordeum chilense (Schwarzacher et al., 1989). Dnes slouţí pro charakterizaci genomů i jednotlivých chromozomů hybridů a allopolyploidů a jeví se jako velmi vhodný postup pro porovnávání genomů příbuzných druhů a odvozování evolučních vztahů mezi nimi, jako tomu bylo například při studiu Z. mays (Poggio et al., 2005). Další sféru uplatnění skýtá studium homologního párování chromozomů, odhalování chromozomových oblastní s vysokou druhovou specificitou a výzkum mezigenomových translokací a detekce translokačních zlomů (Markova a Vyskot, 2009). GISH je do značné míry provázána s repetitivními sekvencemi. Je to dáno faktem, ţe repetice představují velkou část eukaryotického genomu a často jsou mezidruhově konzervativní. Právě odlišnost repetitivních sekvencí u rodičovských druhů rostlinného hybrida či allopolyploida umoţňuje rozlišit chromozomy v jádře podle jejich původu a to i v případě, ţe pochází z poměrně příbuzných druhů (Schwarzacher et al., 1989). Platí to ovšem pouze v omezené míře. Rodičovské chromozomy je moţné odlišovat pouze za předpokladu, ţe jiţ před kříţením vykazovaly dostatečnou míru heterogenity a ţe hybrid vznikl poměrně nedávno. V opačném případě ztrácí celogenomová sonda schopnost efektivně a specificky se vázat na cílové místo (Mukai et al., 1993). Řešením je vyuţití „blokující“, nebo téţ „konkurenční“ neznačené DNA (kompetitor). Ta je do reakce přidávána ještě před samotnou sondou a vyvazuje místa, která by mohla způsobovat nespecifickou vazbu sond. Kvůli potřebě znemoţnit vazbu repetitivních sekvencí se často pro tento účel vyuţívá C0t-1 frakce genomu, který slouţí jako sonda. První postupy pro potlačení nespecifické vazby byly vypracovány v roce 1993 (Mukai et al., 1993) a vzápětí se dočkaly dalšího rozvoje. Metody komparativní GISH pro malé rostlinné genomy (C<0,6pg/l) prošly řadou optimalizací. Dlouhodobým průběhem hybridizace (aţ 7 dní) se dospělo pouze k částečné hybridizaci, převáţně v oblastech pericentromerického heterochromatinu, coţ v případě, ţe se porovnávají genomy stejného nebo velmi příbuzného druhu, není dostačující výsledek (Zoller et al., 2001). Úspěšné řešení nakonec spočívalo v pouţití velmi vysoké koncentrace sondy (7,5 aţ 15 μg) a dlouhém hybridizačním čase (aţ 62 h) (Ali et al., 2004). Chromozomově specifické barvení je metoda odvozená od GISH a je vyuţívána v cytogenetice člověka při vyšetřování karyotypu od roku 1988 (Pinkel et al., 1988). Díky rozdílnému rozloţení repetitivních jednotek na chromozomech je moţné jejich specifické

31 barvení právě sondami z příslušných repetic. U rostlin tento přístup zůstával dlouhou dobu výzvou, protoţe repetice jsou zde rozmístěny rovnoměrně po celém genomu a tento postup neumoţňují. Výjimkou jsou pohlavní chromozomy u Rumex acetosa (Shibata et al., 1999) a Silene latifolia (Hobza et al., 2004), kde bylo, díky vysoké koncentraci specifických repetitivních sekvencí, barvení provedeno Moţnou cestu k barvení chromozomů ukázal v roce 2001 Martin A. Lysák. Se svými kolegy vyuţil značené BAC klony se specifickou vazbou na krátké i dlouhé raménko 4. chromozomu A. thaliana k jeho úspěšnému obarvení (Lysak et al., 2001). Postupně byl tento postup aplikován i na další chromozomy a začal být vyuţíván při zkoumání vztahů mezi zástupci skupiny Brassicaceae (Lysak et al., 2003).

4.1.4.5 COMBO-FISH Tato poměrně mladá a zajímavá varianta klasické metody FISH pracuje na principu detekce homopyrimidinových/homopurinových sekvencí a slouţí k porovnávání stavby úseků chromozomů a diagnostice změn, které mohou být příčinou různých onemocnění. Homopyrimidinové/homopurinové sekvence tvoří 1 aţ 2 % lidského genomu a díky poměrně homolognímu rozloţení jich v úseku dlouhém 250 kb můţeme najít 150 - 200 (Hausmann et al., 2003). Jejich sekvence se skládá z opakování AG/TC bez zjevné vnitřní uspořádanosti (na rozdíl od tandemových repetic) a délka je poměrně variabilní. Nejdelší zjištěný úsek měl délku 499 bází, ale nejčastěji se vyskytují sekvence o délce 15 - 35 bází. Ty jsou také hlavním bodem zájmu combinatorial oligonucleotide FISH (COMBO-FISH). Výběr vhodných sond probíhá, díky osekvenování lidského genomu, za pomoci počítače. Nejprve jsou vyhledány všechny homopyrimidinové/homopurinové sekvence oblasti chromozomu, která nás zajímá, a následně jsou vyselektovány příliš dlouhé úseky a úseky s velkým počtem opakování v genomu. Takto je vybráno 20 - 30 sekvencí, ke kterým jsou vytvořeny komplementární sondy, většinou typu PNA. Ty jsou označeny a je provedena hybridizace. Po hybridizaci získáme lokusově specifický signál, který můţeme porovnávat s jinými, a určovat tak změny v jejich struktuře. První oblastí lidského genomu, pro kterou byla sestavena sada detekčních sond, je 9q34 obsahující proonkogen ABL. Jedná se o lidský homolog onkogenu, který byl původně objeven v Abelsonově viru myší leukémie (Hausmann et al., 2003). Následně pak byla podobná studie provedena například pro identifikaci zlomových bodů na chromozomech 9 a 22 u lymfocytů pacientů s chronickou myeloidní leukémií (Schwarz- Finsterle et al., 2005). 32

4.1.4.6 Primed in situ labeling (PRINS) Tato metoda velmi účinně kombinuje fluorescenční hybridizační in situ techniku a poznatky o polymerázové reakci. Neznačené sondy o délce 18 aţ 30 nukleotidů, které v prvním kroku nasedají na cílová místa, slouţí jako primery pro syntézu DNA, při které jsou do nově tvořeného řetězce vestavěny biotinem nebo jinou chemickou látkou značené nukleotidy. Detekce se poté provádí pomocí specifických, fluorescenčně značených protilátek. Hlavní výhodou PRINS oproti normální FISH je rychlost a vysoká specificita daná délkou sond. Poprvé byla tato metoda pouţita pro objevení chromozomově specifických odlišností ve stavbě monomeru alfa-satelitu u člověka (Koch et al., 1989). Centromery 13. a 21. chromozomu vykazují 99,7% homologii (Greig et al., 1993), coţ je další důkaz schopností PRINS. Kromě výzkumu centromer se PRINS velmi osvědčila i při studiu telomer, nebo genů pro rRNA (Ocalewicz et al., 2008; Wnuk et al., 2009).

33

4.2 PCR – POLYMERÁZOVÁ ŘETĚZOVÁ REAKCE

4.2.1 HISTORIE PCR Objevení polymerázové řetězové reakce a její zavedení do praxe znamenalo výrazný pokrok v metodologii molekulární biologie. Umoţnila zrychlení a zjednodušení mnoha stávajících postupů a svou variabilitou a univerzálností se stala jednou z vůdčích technik současného biologického výzkumu. Poměrně brzy si našla uplatnění i ve výzkumu repetic, stejně jako bylo studium repetitivních sekvencí podnětem pro různé modifikace PCR. Poprvé byl princip polymerázové řetězové reakce publikován v roce 1971 (Kleppe et al., 1971), ale aţ o čtrnáct let později došlo k jejímu prvnímu významnějšímu praktickému vyuţití, konkrétně při studiu diagnostiky srpkovité anemie (Saiki et al., 1985). Největší zásluhu na rozvoji a aplikaci Kleppeho mechanismu měl Kary Banks Mullis, který za svou práci obdrţel v roce 1993 Nobelovu cenu. Hlavními překáţkami, které znemoţnily dřívější rozvoj PCR, byly technické nedostatky při konstrukci zařízení pro zajištění správného teplotního průběhu PCR (potřeba rychlých teplotních skoků mezi jednotlivými kroky) a absence vhodných DNA-polymeráz schopných odolávat vysokým teplotám i teplotním skokům. První překáţka byla odstraněna s postupným technologickým vývojem termocyklerů a druhá objevením DNA polymerázy termofilní bakterie Thermus aquaticus (tzv. Taq DNA-polymeráza) v roce 1988.

4.2.2 PRINCIP PCR Polymerázová řetězová reakce je vyuţívá principu přirozeného replikačního procesu DNA, ale místo výsledného zdvojení celého genomu se mnohonásobně amplifikuje pouze vybraný úsek. Celý postup se skládá ze tří navazujících kroků a to denaturace, nasedání primerů (annealingu) a prodluţování oligonukleotidů DNA-polymerázou, tzv. syntéza (viz obrázek 8). Cyklickým opakováním těchto kroků se při kaţdé syntéze zdvojnásobí počet kopií poţadované sekvence, dokud se některá z reakčních komponent nevyčerpá. Počet kopií tak „řetězově“ (exponenciálně) narůstá. Právě rychlost a nenáročnost jsou hlavními výhodami oproti dříve jediné pouţívané moţnosti, amplifikaci v plazmidech. Denaturace je prováděna vystavením vzorku teplotě okolo 95 °C. Po ochlazení na 40 aţ 65 °C (optimalizováno podle délky a obsahu GC v sekvenci primerů) dojde k nasednutí primerů na komplementární úseky v cílové ssDNA. V dalším kroku, při teplotě 65 aţ 72 °C, poskytují správně nasedlé primery iniciační místo pro DNA-polymerázu. Ta zajišťuje prodlouţení

34

(polymeraci, syntézu) nově vznikajícího řetězce komplementárního k cílovému řetězci – templátu. Navrţení primerů je důleţitým faktorem, který rozhoduje o správnosti průběhu celé PCR. Pro základní verzi PCR se připravují dva primery tak, aby kaţdý nasedal na jeden ze dvou komplementárních řetězců cílového místa a sekvenci tak ohraničovaly svými 3´ konci směrem jeden k druhému (viz obr. 10). Mezi základní pravidla pro jejich navrţení patří výběr správné sekvence, která je specifická pouze pro cílový úsek, dále pak délka primerů, minimální rozdíl v teplotě tání přímého i reverzního primeru, absence vnitřních sekundárních struktur a absence tvorby vzájemných heteroduplexů. Největší nároky na specificitu a komplementaritu jsou kladeny na 3´ konce primerů. Pro návrh primerů existuje několik vhodných počítačových programů, jako jsou GCC, Primer3, PrimerBlast, Web Primer nebo Oligo Analyzer.

Obrázek 10. Nasedání primerů v prvním a druhém kroku PCR. Díky dobře navrţeným primerům, které ohraničují sekvenci našeho zájmu, jsme schopni tuto oblast velmi specificky amplifikovat. Převzato z (http://www.flmnh.ufl.edu/cowries/amplify.html).

PCR představuje velmi účinný amplifikační mechanismus a její varianty mají i silný analytický potenciál. Příkladem vyuţití je PCR v reálném čase (real time PCR, q-PCR), která umoţňuje například sledovat změnu exprese genu v závislosti na změně podmínek, kterým jsou 35 buňky vystaveny, jako v případě detekce mRNA telomerázy v séru pacientů s rakovinou prostaty (Carbonare et al., v tisku) Při studiu repetic se vyuţívá hlavně amplifikačních schopností PCR a produkty jsou dále zpracovávány hybridizačními nebo sekvenčními metodami. Existují ovšem i přístupy zaloţené na PCR umoţňující vyhledávání repetic v genomu, např. GSP-PCR (genomic self-priming PCR), nebo analyzovat počet repetitivních jednotek v satelitech (PETRA, STELA). Také je moţné vyuţití repetitivních sekvencí jako primerů.

4.2.3 VARIANTY PCR PRO ANALÝZU REPETITIVNÍCH SEKVENCÍ 4.2.3.1 Genomová soběstačná PCR (Genomic self-priming PCR, GSP-PCR) V roce 1998 byla poprvé popsána metoda izolace repetitivních sekvencí v DNA pomocí PCR reakce vyuţívající genomové DNA zároveň jako templátu i primerů. Genomová DNA, která bude slouţit jako primer, se nejprve denaturuje a zároveň fragmentuje varem při 100 °C po dobu 15 minut. Poté je smíchána v poměru 1:1 s nefragmentovanou DNA a všemi potřebnými komponenty PCR. Samotná PCR probíhá ve 30 aţ 120 cyklech, přičemţ kaţdých 30 cyklů je odebrána 1/6 aţ 1/5 objemu původní reakční směsi a přenesena jako templát do nového reakčního prostředí (Buntjer a Lenstra, 1998). Při fragmentaci DNA dochází ke vzniku volných 3´-konců, které poskytují iniciační místo DNA-polymeráze. Pokud ke zlomu dojde uvnitř tandemové repetice, bude po komplementární hybridizaci v kroku nasedání primerů překrývat pouze část repetice nefragmentované, která bude slouţit jako templát. Důleţitým faktorem, který hraje roli v průběhu této reakce je přednostní hybridizace repetitivních sekvencí podle pravidel, která byla popsána v kapitole o renaturační analýze. Produkty reakce jsou po skončení PCR přečištěny, naštěpeny specifickými enzymy a separovány na agarózovém gelu. Následně je moţné přenést je Southernovým přenosem na membránu a pouţít hybridizačních metod pro jejich detekci, nebo je sekvenovat. Tento postup byl aplikován na několik ţivočišných druhů a vedl mimo jiné k popsání nového satelitu u Struthio camelus (Buntjer a Lenstra, 1998). O dva roky později byla tato metoda úspěšně aplikována i na rostliny, konkrétně na rod Vicia (Macas et al., 2000). Jako náhrada za tepelnou fragmentaci zde byla pouţita fragmentace specifickým restrikčním enzymem. Tato úprava vedla ke zvýšení citlivosti reakce. V obou případech však bylo pozorováno, ţe stejná repetitivní sekvence je u některých druhů izolována a jiná nikoliv, přestoţe se u nich prokazatelně vyskytuje. Tento fakt můţe být dán mezidruhovou heterogenitou satelitů, případně interakcemi satelitů s jinými genomovými

36

úseky v průběhu reakce. Proto není moţné přítomnost repetice v genomu vyloučit, i kdyţ není tímto postupem zachycena (Macas et al., 2000).

4.2.3.2 Degenerovaná PCR (D-PCR) Pod pojmem degenerovaná PCR (D-PCR) se skrývá modifikace reakce, která se vyuţívá při hledání příbuzných sekvencí u různých druhů, jedinců nebo i paralogních genů v rámci jediného genomu. V biologii repetitivní DNA je D-PCR vyuţívána například při identifikaci a klasifikaci retrotranspozonů. Odrazovým bodem je vyhledání konzervativních motivů, v případě retrotranspozonů oblastí kódujících reverzně-transkriptázové domény, jako v případě prokázání přítomnosti vysoce heterogenní skupiny retrotranspozonů Ty1/copia v genomu Lycopersicon chilense (Yanez et al., 1998). V místech, kde je předpokládána moţná nukleotidová záměna v cílové sekvenci oproti příbuznému motivu (typicky třetí pozice v kodónu), je primer degenerován, coţ v nejširším slova smyslu znamená, ţe ve výsledku je navrţený primer tvořen směsí čtyř oligonukleotidů s různými nukleotidy v pozici degenerace. Pokud je navrţen primer se dvěma místy degenerace libovolným nukleotidem, narůstá počet variant na šestnáct atd. S takto připravenými primery je následně provedena PCR genomové DNA druhů, u nichţ předpokládáme výskyt dané sekvence. V případě, ţe dojde k amplifikaci, jsou produkty analyzovány, v současnosti nejčastěji sekvenováním. Touto metodou byla například provedena analýza výskytu a podobností mariner-like transpozonů u hlístic rodu Meloidogyne (Leroy et al., 2000) a také zjištěn vysoký stupeň homologie mezi mariner-like transpozonem Caenorhabditis elegans a Drosophila mauritiana (Sedensky et al., 1994) a uskutečněno srovnání mariner-like transpozonů několika druhů savců, včetně člověka.

4.2.3.3 Stanovení polymorfizmů délky tandemových repetic Na principu PCR byla rovněţ navrţena metoda pro studium variability počtu repetitivních jednotek u tandemových repetic. Na základě znalosti sekvencí, kterými jsou analyzované repetice ohraničeny, jsou navrhovány primery pro jejich amplifikaci. Velikost těchto amplikonů a tím i počet repetitivních jednotek můţe být určen následnou gelovou, akrylamidovou, kapilární nebo čipovou elektroforézou. Vyuţití metod spojených s délkovými polymorfismy je velmi široké. V lékařství slouţí jako nástroj výzkumu nemocí způsobených expanzí trinukleotidových sekvencí. V populačních studiích jsou vyuţívány ke stanovení příbuznosti jedinců i populací a v kriminalistice slouţí k identifikaci osob nebo určování otcovství.

37

Na výše popsaném principu pracuje i metoda stanovení délky telomer, která zlepšuje detekční schopnosti klasické analýzy TRF. Jedná se o analýzu délky jednotlivých telomer („single telomere length analysis“), zkráceně STELA. Poprvé byla představena v roce 2003 při výzkumu velmi krátkých telomer senescentních lidských buněk (Baird et al., 2003). Později byla aplikována i na krátké telomery rakovinných buněk s aktivní telomerázou (Xu a Blackburn, 2007). Díky své vysoké specificitě byla vyuţita i pro stanovení rozdílů v délce telomer jednotlivých chromozomů u Caenorhabditis elegans (Cheung et al., 2004). Medicínské vyuţití se nesoustřeďuje jen na rakovinu. Příkladem můţe být studium zrychleného stárnutí fibroblastů pacientů s Wernerovým syndromem (Baird et al., 2004), nabo aplikace v prenatální diagnostice aneuploidií a přenašečství mutantních alel pro CF. Na stejném principu jako STELA, pracuje i detekční technika PETRA („primer extension telomere repeat amplification“), aplikovaná na rostlinné genomy (Vespa et al., 2007; Watson a Shippen, 2007).

4.2.3.4 Interrepetitivní PCR Interrepetitivní PCR je označení pro soubor metod, které vyuţívají rozptýlených repetic k amplifikaci sekvencí nacházejících se mezi nimi. Primery jsou konstruovány tak, aby byly komplementární ke koncovým úsekům repetic a 3´-konec směřoval mimo ni. Výsledkem je vţdy několik produktů o různé délce, která odpovídá rozmístění repetic v genomu a jejich vzdálenosti od sebe. Díky druhově jedinečnému rozloţení se tak jedná o velmi účinnou genotypizační metodu prokaryotních i eukaryotních organizmů. Do této skupiny se řadí například SPAR-PCR („single primer amplification reaction“) nebo ISSR-PCR („inter-simple seqence repeat“). Jednotlivé techniky se od sebe liší hlavně typem repetitivních sekvencí, které vyuţívají. Principielně se do této skupiny dá zařadit také Alu- PCR, které se vyuţívá k odlišení lidské DNA od jiné na základě jedinečnosti lidského Alu- transpozonu (Nelson et al., 1989).

38

4.3 SEKVENOVÁNÍ

4.3.1 POČÁTKY SEKVENOVÁNÍ Sekvenační metody, umoţňující stanovení nukleotidové sekvence, znamenaly revoluci v moţnostech molekulární biologie. Dlouhou dobu bylo moţné základní informaci o sekvenci DNA získávat jen velmi zprostředkovaně, například restrikčním mapováním. Kdyţ v únoru 1977 vyšel článek Allana M. Maxama a Waltera popisující metodu sekvenování zaloţenou na cílené tvorbě zlomů v řetězci ssDNA v místě známé báze (Maxam a Gilbert, 1977), získala vědecká obec první významný nástroj k určování primární struktury DNA. K dalšímu posunu došlo o deset měsíců později, kdy byla opublikována práce Fredericka Sangera a jeho kolegů (Sanger et al., 1977) rozvíjející a zpřesňující metodu +/- sekvenování popsanou stejnou skupinou v roce 1975 (Sanger a Coulson, 1975), která vyuţívala principu PCR, objevené o čtyři roky dříve. Tato metoda byla rychlejší, přesnější a umoţňovala sekvenování delších úseků neţ Maxam-Gilbertův postup. Proto se brzy stala běţnou součástí laboratorní praxe.

4.3.1.1 Maxam-Gilbertovo (chemické) sekvenování Tato metoda je zaloţena na indukci zlomů v řetězci ssDNA v místě konkrétní báze. Báze v sekvenci s přesně stanoveným a označeným 5´-koncem jsou chemickými činidly, specifickými pro kaţdou z nich, případně pro pár bází, modifikovány tak, aby byla oslabena jejich vazba s 3´ sousedící bází a následně jsou tato místa rozštěpena pomocí piperidinu. Reakční podmínky jsou upraveny tak, aby ke zlomu docházelo v různých pozicích dané sekvence v průměru pouze jednou na řetězec, coţ má za následek tvorbu různě dlouhých fragmentů. Takto získané fragmenty jsou elektroforeticky rozděleny podle své velikosti a díky znalosti toho, jaká báze leţí v místě, kde ke zlomu došlo, můţeme stanovit kompletní sekvenci. K získání výchozích sekvencí s přesně stanovenými 5´-konci se pouţívají specifické restrikční enzymy a radioaktivní značení 5´-konců je prováděno polynukleotid kinázou. Tato metoda nenašla velkého uplatnění hlavně kvůli své náročnosti, citlivosti na znečištění, méně přesným výsledkům a moţnosti sekvenovat pouze kratké řetězce ve srovnání se Sangerovou metodou.

39

4.3.1.2 Sangerovo (enzymatické) sekvenování Sanger se svými spolupracovníky vyuţil pro stanovení neznámé nukleotidové sekvence upraveného principu PCR a schopnosti DNA-polymerázy začlenit do nově vznikajícího řetězce analogy bází, které následně znemoţní postup DNA-polymerázy a tím i další prodluţování řetězce. K úseku DNA, který chceme osekvenovat, je vytvořen primer, kterým můţe být krátký restrikční fragment, synteticky připravený nukleotid, primer z PCR amplifikace nebo je vektor určený ke klonování sekvence upraven tak, aby byl inzert vloţen za známou sekvenci, která je z vektoru vyštěpena společně s inzertem a slouţí jako cílové místo pro univerzální sekvenační primer. Primer, stejně jako je tomu u PCR, nasedne při renaturaci (resp. annealingovém kroku) na své komplementární místo a stane se iniciačním místem tvorby nového řetězce DNA, komplementárního ke stanovované sekvenci. Pouţití arabinonukleotidů, nebo 2´, 3´- dideoxynukleotidů (nakonec se ukázali vhodnějšími) jako analogů bází ve směsi s normálními bázemi (nejčastěji se udává poměr 1:100) má za následek, ţe nárust řetězce bude v místech, kde dojde k jejich začlenění, přerušen. Tím získáme velké mnoţství fragmentů o různé délce, které rozdělíme gelovou elektroforézou (v automatických sekvenátorech nahrazenou kapilární) a podle toho, jakým analogem jsou fragmenty zakončeny, sestavujeme původní sekvenci. Kromě gelové elektroforézy byly popsány i mechanismy rozlišování fragmentů na základě hmotnostní spektrometrie (Jacobson et al., 1991; Murray, 1996). Ke značení nově syntetizovaných řetězců se původně vyuţívalo radioaktivního značení primerů, případně nukleotidů inkorporovaných do řetězce. Dnes se vyuţívá fluorescenčního značení primerů nebo terminálních dideoxynukleotidů. S pomocí automatických sekvenátorů je dnes moţné Sangerovou metodou rychle a přesně stanovovat sekvence o délce větší neţ 1 kb. Pro stanovení sekvence při minimálním mnoţství materiálu se před samotnou sekvenaci zařazuje asymetrická PCR. Při ní je pouţit pouze jeden primer, případně dva, z nichţ jeden je v mnohonásobném přebytku. Díky tomu jsme schopni amplifikovat přímo ssDNA sekvenovaného úseku bez nutnosti následných denaturačních kroků.

4.3.2 SEKVENAČNÍ METODY NOVÉ GENERACE A JEJICH APLIKACE PŘI VÝZKUMU REPETITIVNÍCH SEKVENCÍ 4.3.2.1 Pyrosekvenování Princip této metody byl představen jiţ ve 2. polovině 80. let 20. století (Nyren, 1987; Hyman, 1988), ale technika pouţitelná pro širší laboratorní vyuţití byla zavedena aţ v roce 1998 (Ronaghi et al., 1998) a o několik let později byla představen postup 454 Life Science vyuţitý 40 na platformě GS 20. Je vzdáleně příbuzná Sangerově enzymatické metodě, neboť také vyuţívá prodluţování komplementárního řetězce ssDNA DNA-polymerázou, ale místo značení primerů nebo terminačních analogů bází sleduje světelné záření vyvolané kaskádou enzymatických reakcí po začlenění báze do řetězce. Po hybridizaci primeru na začátek sekvence jsou do reakční směsi postupně přidávány jednotlivé báze ve formě dTTP, dDTP, dCTP a 2´-deoxyadenosin -5´-α-thio-trifosfátu. Tento analog klasického adenosintrifosfátu (ATP), respektive 2´-deoxyadenosintifosfátu (dATP) je taktéţ začleňován do nově vznikajícího řetězce, ale na rozdíl od ATP a dATP neaktivuje luciferázovou reakci, popsanou dále. Při prodlouţení řetězce o danou bázi dojde k uvolnění pyrofosfátu (PPi) a jeho reakci s adenosin 5´-fosfosulfátem (APS). Produktem této reakce, katalyzované ATP sulfurylázou, je adenosintrifosfát (ATP), který umoţňuje přeměnu luciferinu na oxyluciferin pomocí enzymu luciferázy. Tato reakce je doprovázena emisí světelného záření, které je detekováno a jeho intenzity lze stanovit mnoţství nukleotidů inkorporovaných do řetězce. Báze, které nebyly začleněny do řetězce, a nadbytečná ATP jsou degradovány enzymem apyrázou a do reakční směsi je vpraven nový typ báze. Takto se celý proces opakuje mnohonásobně, dokud není stanovena kompletní sekvence.

4.3.2.2 Technika reverzibilních terminačních nukleotidů Solexa Genome Analyzer, představený v roce 2006, pracuje na principu kombinujícím hybridizaci sekvenovaného úseku DNA a upravenou Sangerovu metodu. Analyzovaná sekvence je naštěpena na fragmenty o délce kolem 800 pb a následně jsou DNA-polymerázou 3´-konce fragmentů prodlouţeny o jednu adeninovou bázi, která umoţňuje jejich ligaci s oligonukleotidovým adaptorem majícím na 3´-konci komplementárního vlákna přesah tvořený jednou bází thyminu. Oligonukleotidové adaptory zprostředkovávají hybridizaci fragmentů s kotvami, které zajišťují jejich imobilizaci na čipu. Dalším důleţitým krokem je mnohonásobná amplifikace, jejímţ cílem je zmnoţení upravených fragmentů. Děje se tak procesem zvaným „mostová“ amplifikace (viz obr. 11), jejímţ výsledkem jsou klastry obsahující aţ tisíc kopií původní sekvence. Tyto kopie jsou k čipu vázány oběma konci, coţ jim dává typickou podobu mostu spojujícího dvě kotvy. Následnou denaturací je odstraněn původní fragment a sekvenace probíhá na nově syntetizovaném, komplementárním řetězci. Posledním krokem je opět amplifikace, tentokrát s flourescenčně značenými nukleotidy, tzv. terminátory. Primerem je sekvence hybridizující s adaptorem, nacházejícím se nyní

41 na volném 5´-konci komplementárního vlákna. Terminátory jsou inkorporovány do řetězce na základě komplementarity bází. Po jejich začlenění jsou reagencie odstraněny a podle emitované barvy je stanoven typ zařazené báze. Po stanovení je citlivou chemickou metodou odblokován terminátor, coţ umoţní další sekvenční reakci. Kroky začlenění, odečtu a odblokování terminační báze se opakují, dokud není stanovena kompletní sekvence.

Obrázek č. 11 Po navázání sekvencí obohacených o adaptory na kotvy se pomocí procesu amplifikace „přemostěním“ vytvoří klastr o několika stovkách kopií. Tyto kopie jsou poté simultárně sekvenovány postupným nasedáním fluorescenčně značených terminátorů, stanovení navázaného nukleotidu podle typu emitovaného záření, reaktivací terminátoru a navázání nového (Voelkerding et al., 2009).

42

4.3.2.3 Sekvenování ligací Kořeny této metody sahají do roku 2005 a první komerční přístroj představila firma Applied Biosystem v roce 2007. Zkratka SOLiD znamená Supported Oligonucleotide Ligation and Detection a napovídá, jak vlastně celý přístroj funguje. Na rozdíl od ostatních totiţ není zaloţený na prodluţování 3´-konce řetězce a detekci vkládaných nukleotidů, ale na prodluţování 5´-konce pomocí umělých Okazakiho fragmentů. Stanovovaná sekvence je imobilizována pomocí adaptoru vázaného na její 5´-konec, který zároveň tvoří hybridizační místo pro primer, který bude 3´-koncem nově syntetizovaného řetězce. Následuje ligační fáze, kdy jsou do reakce postupně přidávány oktamery tvořené dvěma specifickými bázemi (celkem 16 moţných kombinací) na 3´-konci a dále pak šesti degenerovanými bázemi. Oktamery jsou fluorescenčně značeny na 5´-konci podle pravidla popsaného na obrázku 12. Po prodlouţení řetězce o jeden oktamer je změřena fluorescence a stanoveny kombinace bází, které se mohly navázat. Oktamery jsou následně enzymaticky sestřiţeny na pentamery, čímţ se obnoví jejich ligační potenciál a celý krok se opakuje. Celkem se těchto kroků opakuje 7, coţ umoţní osekvenovat řetězec o délce 35 bp. Jelikoţ ale známe pouze dva z kaţdých pěti nukleotidů a to pouze ve formě jednoho ze čtyř dinukleotidů, odstraníme denaturací nasyntetizovaný řetězec a pouţijeme další primer, jehoţ vazba je posunuta o jednu bázi blíţe ke 3´-konci, neţ u předchozího a zopakujeme ligační kroky. Na základě srovnání fluorescenčního signálu z prvního a druhého prodluţování primerů můţeme přesně stanovit, o jaký nukleotid se v dané pozici jedná. Abychom stanovili celou sekvenci pentameru, musíme provést denaturaci a navázání primeru celkem pětkrát po sobě.

43

Obrázek 12. Průběh vysokoprůtokového sekvenování metodou ligace. Primer specifický pro oblast adaptoru, který upevňuje sekvenci našeho zájmu na čip, je na 5´-konci ligací prodluţován o značené oktamery. Po odečtení fluorescence a stanovení dinukleotidu, kterým umělý Okazakiho fragment začíná, je oktamer sestřiţen na pentamer, který lze opět prodlouţit. Po prodlouţení na délku původního vlákna je nově vznikající vlákno odstraněno a celý proces se opakuje znovu, tentokrát s primerem posunutým o jeden nukleotid (Voelkerding et al., 2009).

4.3.2.4 Aplikace vysokoprůtokového sekvenování při objevování a charakterizaci repetitivních sekvencí Původní přístup k sekvenování dlouhých úseků DNA se zakládal na vytvoření rozsáhlé knihovny fragmentů naklonovaných do vektorů, jako byly například vektory BAC (bacterial artificial chromosome). Tyto fragmenty byly amplifikovány a postupně sekvenovány. Získané sekvence se „skládaly“ dohromady podle společných překryvů tak, aby na sebe navazovaly. Tím bylo moţné získat kompletní sekvenci. Jedná se o přesnou, ale zdlouhavou metodu a sekvenování celých genomů tzv. de novo je tímto způsobem práce na několik desítek let.

44

Posun nastal s nástupem plně automatizovaných metod nové generace, schopných souběţného sekvenování, čtením a skládáním mnoha milionů fragmentů. Ty poskytují během krátké doby informaci o sekvenci o celkové délce aţ několik gigabází. Problém ovšem je, ţe tato informace je „fragmentována“ do krátkých úseků, které není snadné poskládat do kontigů. Ačkoliv je tedy sekvenční charakterizace celého genomu stále výzvou, především finanční (viz tab. 2), pro vyhledávání a identifikaci repetitivních sekvencí představuje velmi snadný a poměrně rychlý postup. Z úsporných důvodů se v současnosti pouţívá varianta, která sekvenuje náhodné fragmenty představující pouze zlomek celkové velikosti genomu. Díky vysokému počtu kopií je pravděpodobné, ţe mezi sekvenovanými fragmenty budou zastoupeny právě repetitivní sekvence. Celková velikost Délka Doba trvání Přibliţná cena DNA Sekvenační metoda sekvenovaných jednoho osekvenování osekvenovatelná fragmentů cyklu jedné Gb při jednom cyklu Pyrosekvenování 750 – 840 bp 1 Gb 10 hodin 9 000 Kč Sekvenování ligací 75 - 100 bp 30 Gb 1 den 8000 Kč Metoda reverzních 120 – 150 bp 55 Gb 2 dny 8500 Kč terminátorů

Tabulka 2. Srovnání sekvenačních metod nové generace na základě délky sekvenovatelných fragmentů, celkové velikosti osekvenovatelné DNA v jednom cyklu a ceny za osekvenování 1 Gb.

Teoreticky pro získání celogenomové sekvence stačí sekvenovat právě tolik dat, z kolika se genom skládá. Pokud by náhodně sekvenované fragmenty na sebe dokonale navazovaly, získali bychom uţ při takovém pokrytí, tzv. pokrytí 1x, veškerou potřebnou informaci. Při masivním paralelním sekvenování jsou však některé oblasti čteny hůře, některé lépe a také na základě stochastických procesů se některá oblast přečte vícekrát a některá při nízkém pokrytí ani jednou. Tyto fakta brání sestavovat celogenomovou sekvenci při nízkém pokrytí, ale u repetice (uvaţujme repetiční jednotku rovnou délce průměrného čtení), která se bude v genomu vyskytovat tisíckrát, máme velkou šanci, ţe bude mezi osekvenovanými úseky. Pokud přečteme pouze jedno procento genomu (tzn. genomové pokrytí 0,01), pravděpodobnost, ţe zachytíme jednu konkrétní unikátní sekvenci, je velmi malá. Stále však budeme mít pokrytí 10x u repetic s počtem kopií 1000 (1000 x 0.01 = 10) (Navratilova a Macas, 2007). Tyto počty jsou do značné míry teoretické. V genomu existují sekvence, které jsou sekvenovatelné lépe a jiné, které vţdy budou zachytávány hůře. Pro odhalování a popis nových repetitivních jednotek v genomech a stanovení jejich zastoupení jsou však plně postačujícím, jak dokazuje například výše citovaná práce o repetitivních sekvencích v Pisum sativum. Prvním, kdo 45 se touto moţností detekce repetitivních sekvencí zabýval, byla Jennifer S. Hawkins (Hawkins et al., 2006) a v následujících letech se uchytila zejména v součinnosti s metodou pyrosekvenování (Macas et al., 2007).

46

5 ZÁVĚR Stejně jako v jiných oblastech molekulární biologie, i v případě studia repetitivních sekvencí jsou pokroky v jejich poznávání úzce spjaty s moţnostmi, které nabízí dostupné metody jejich studia. Za posledních padesát let jsme se od technik nespecifické izolace, umoţňujících pouze velmi hrubou charakteristiku a základní srovnávání bez znalosti nukleotidové sekvence, dostali k moţnostem rychlé amplifikace konkrétních repetic a přesnému stanovení jejich sekvence. Stejně tak jsme schopni nacházet a popisovat repetice přímo v jejich „přirozeném“ prostředí - na chromozomech. Navíc umíme repetitivní sekvence vyuţívat i při studiu jiných oblastí DNA a aplikovat je do forenzní či klinické praxe. V následujících letech bude vývoj bezesporu směřovat ke zrychlení, zpřesnění a zvýšení kapacity stávajících postupů, budou nalézány další moţnosti jejich uplatnění a pravděpodobně se dočkáme i dosud neznámých přístupů k získávání informací o těchto zajímavých stavebních prvcích (i naší) genetické výbavy.

47

6 LITERATURA

. Ali, H. B. M., Lysak, M. A., and Schubert, I. (2004). Genomic in situ hybridization in with small genomes is feasible and elucidates the chromosomal parentage in interspecific Arabidopsis hybrids. Genome 47, 954-960. Allsopp, R. C., and Harley, C. B. (1995). Evidence for a critical telomere length in senescent human fibroblasts. Experimental Cell Research 219, 130-136. Aparicio, S., Chapman, J., Stupka, E., Putnam, N., Chia, J., Dehal, P., Christoffels, A., Rash, S., Hoon, S., Smit, A., Gelpke, M. D. S., Roach, J., Oh, T., Ho, I. Y., Wong, M., Detter, C., Verhoef, F., Predki, P., Tay, A., Lucas, S., Richardson, P., Smith, S. F., Clark, M. S., Edwards, Y. J. K., Doggett, N., Zharkikh, A., Tavtigian, S. V., Pruss, D., Barnstead, M., Evans, C., Baden, H., Powell, J., Glusman, G., Rowen, L., Hood, L., Tan, Y. H., Elgar, G., Hawkins, T., Venkatesh, B., Rokhsar, D., and Brenner, S. (2002). Whole-genome shotgun assembly and analysis of the genome of Fugu rubripes. Science 297, 1301-1310. Arkhipova, I. R. (2001). Transposable elements in the animal kingdom. Molecular Biology 35, 157-167. Bailey, S. M., Goodwin, E. H., and Cornforth, M. N. (2004). Strand-specific fluorescence in situ hybridization: the CO-FISH family. Cytogenetic and Genome Research 107, 14-17. Bailey, S. M., Meyne, J., Cornforth, M. N., McConnell, T. S., and Goodwin, E. H. (1996). A new method for detecting pericentric inversions using COD-FISH. Cytogenetics and Cell Genetics 75, 248-253. Baird, D. M., Davis, T., Rowson, J., Jones, C. J., and Kipling, D. (2004). Normal telomere erosion rates at the single cell level in Werner syndrome fibroblast cells. Human Molecular Genetics 13, 1515-1524. Baird, D. M., Rowson, J., Wynford-Thomas, D., and Kipling, D. (2003). Extensive allelic variation and ultrashort telomeres in senescent human cells. Nature Genetics 33, 203-207. Bhattacharyya, M. K., Smith, A. M., Ellis, T. H. N., Hedley, C., and Martin, C. (1990). The wrinkled-seed character of pea described by Mendel is caused by a transposon-like insertion in a gene encoding starch-branching enzyme. Cell 60, 115-122. Blouin, M. S., Parsons, M., Lacaille, V., and Lotz, S. (1996). Use of microsatellite loci to classify individuals by relatedness. Molecular Ecology 5, 393-401. Boer, P. H., and Gray, M. W. (1991). Short dispersed repeats localized in spacer regions of Chlamydomonas reinhardtii mitochondrial DNA. Current Genetics 19, 309-312. Bolzan, A. D., and Bianchi, M. S. (2006). Telomeres, interstitial telomeric repeat sequences, and chromosomal aberrations. Mutation Research-Reviews in Mutation Research 612, 189- 214. Britten, R. J., and Kohne, D. E. (1968). Repeated Sequences in DNA. Science 161, 529-540. Bunemann, H., and Dattagupta, N. (1973). On the binding and specificity of 3,6-Bis- (acetatomercurimethyl)-dioxane to DNAs of different base composition. Biochimica Et Biophysica Acta 331, 341-348. Buntjer, J. B., and Lenstra, J. A. (1998). Self-amplification of satellite DNA in vitro. Genome 41, 429-434. Demidov, V. V. (2003). PNA and LNA throw light on DNA. Trends in Biotechnology 21, 4-7. Durm, M., Haar, F. M., Hausmann, M., Ludwig, H., and Cremer, C. (1996). Optimization of fast-fluorescence in situ hybridization with repetitive alpha-satellite probes. Zeitschrift Fur Naturforschung C-a Journal of Biosciences 51, 253-261. Economou-Pachnis, A., Lohse, M. A., Furano, A. V., and Tsichlis, P. N. (1985). Insertion of long interspersed repeated elements at the Igh (immunoglobulin heavy-chain) and Mlvi-2 48

(Moloney leukemia virus integration 2)lLoci of rats. Proceedings of the National Academy of Sciences of the United States of America 82, 2857-2861. Fojtova, M., Wong, J. T. Y., Dvorackova, M., Yan, K. T. H., Sykorova, E., and Fajkus, J. (2010). Telomere maintenance in liquid crystalline chromosomes of dinoflagellates. Chromosoma 119, 485-493. Gall, J. G., and Pardue, M. L. (1969). Formation and detection of RNA-DNA hybrid molecules in cytological preparations. Proceedings of the National Academy of Sciences of the United States of America 63, 378-383. Ganal, M. W., Lapitan, N. L. V., and Tanksley, S. D. (1991). Macrostructure of the tomato telomeres. Cell 3, 87-94. Garagna, S., Marziliano, N., Zuccotti, M., Searle, J. B., Capanna, E., and Redi, C. A. (2001). Pericentromeric organization at the fusion point of mouse Robertsonian translocation chromosomes. Proceedings of the National Academy of Sciences of the United States of America 98, 171-175. Goff, S. A., Ricke, D., Lan, T. H., Presting, G., Wang, R. L., Dunn, M., Glazebrook, J., Sessions, A., Oeller, P., Varma, H., Hadley, D., Hutchinson, D., Martin, C., Katagiri, F., Lange, B. M., Moughamer, T., Xia, Y., Budworth, P., Zhong, J. P., Miguel, T., Paszkowski, U., Zhang, S. P., Colbert, M., Sun, W. L., Chen, L. L., Cooper, B., Park, S., Wood, T. C., Mao, L., Quail, P., Wing, R., Dean, R., Yu, Y. S., Zharkikh, A., Shen, R., Sahasrabudhe, S., Thomas, A., Cannings, R., Gutin, A., Pruss, D., Reid, J., Tavtigian, S., Mitchell, J., Eldredge, G., Scholl, T., Miller, R. M., Bhatnagar, S., Adey, N., Rubano, T., Tusneem, N., Robinson, R., Feldhaus, J., Macalma, T., Oliphant, A., and Briggs, S. (2002). A draft sequence of the rice genome (Oryza sativa L. ssp japonica). Science 296, 92-100. Goldberg, Y. P., Andrew, S. E., Theilmann, J., Kremer, B., Squitieri, F., Telenius, H., Brown, J. D., and Hayden, M. R. (1993). Familial predisposition to recurrent mutations causing Huntington´s disease - genetic risk to sibs of sporadic cases. Journal of Medical Genetics 30, 987-990. Goodwin, E., and Meyne, J. (1993). Strand-specific FISH reveals orientation of chromosome-18 alphoid DNA. Cytogenetics and Cell Genetics 63, 126-127. Greig, G. M., Warburton, P. E., and Willard, H. F. (1993). Organization and evolution of an alpha satellite DNA subset shared by human chromosome 13 and chromosome 21. Journal of Molecular Evolution 37, 464-475. Hatlen, L., and Attardi, G. (1971). Proportion of HeLa cell genome complementary to transfer RNA and 5 S RNA. Journal of Molecular Biology 56, 535-553. Hausmann, M., Winkler, R., Hildenbrand, G., Finsterle, J., Weisel, A., Rapp, A., Schmitt, E., Janz, S., and Cremer, C. (2003). COMBO-FISH: specific labeling of nondenatured chromatin targets by computer-selected DNA oligonucleotide probe combinations. Biotechniques 35, 564-577. Hawkins, J. S., Kim, H., Nason, J. D., Wing, R. A., and Wendel, J. F. (2006). Differential lineage-specific amplification of transposable elements is responsible for genome size variation in Gossypium. Genome Research 16, 1252-1261. Henegariu, O., Dunai, J., Chen, X. N., Korenberg, J. R., Ward, D. C., and Greally, J. M. (2001). A triple color FISH technique for mouse chromosome identification. Mammalian Genome 12, 462-465. Hobza, R., Lengerova, M., Cernohorska, H., Rubes, J., and Vyskot, B. (2004). FAST-FISH with laser beam microdissected DOP-PCR probe distinguishes the sex chromosomes of Silene latifolia. Chromosome Research 12, 245-250. Hsu, S. M., Raine, L., and Fanger, H. (1981). Use of avidin-biotin-peroxidase complex (ABC) in immunoperoxidase techniques - a comparison between ABC and unlabeled antibody (Pap) procedures. Journal of Histochemistry & Cytochemistry 29, 577-580.

49

Hultdin, M., Gronlund, E., Norrback, K. F., Eriksson-Lindstrom, E., Just, T., and Roos, G. (1998). Telomere analysis by fluorescence in situ hybridization and flow cytometry. Nucleic Acids Research 26, 3651-3656. Hyman, E. D. (1988). A new method of sequencing DNA. Analytical Biochemistry 174, 423- 436. Cheng, J. F., Smith, C. L., and Cantor, C. R. (1989). Isolation and characterization of a human telomere. Nucleic Acids Research 17, 6109-6127. Cheung, I., Schertzer, M., Baross, A., Rose, A. M., Lansdorp, P. M., and Baird, D. M. (2004). Strain-specific telomere length revealed by single telomere length analysis in Caenorhabditis elegans. Nucleic Acids Research 32, 3383-3391. Jacobson, K. B., Arlinghaus, H. F., Buchanan, M. V., Chen, C. H., Glish, G. L., Hettich, R. L., and Mcluckey, S. A. (1991). Applications of mass spectrometry to DNA sequencing. Genetic Analysis-Biomolecular Engineering 8, 223-229. Jeffreys, A. J., Wilson, V., and Thein, S. L. (1985). Individual-Specific Fingerprints of Human DNA. Nature 316, 76-79. Jiang, J. M., Birchler, J. A., Parrott, W. A., and Dawe, R. K. (2003). A molecular view of plant centromeres. Trends in Plant Science 8, 570-575. Jin, L., and Lloyd, R. V. (1997). In situ hybridization: Methods and applications. Journal of Clinical Laboratory Analysis 11, 2-9. Kato, A., Lamb, J. C., and Birchler, J. A. (2004). Chromosome painting using repetitive DNA sequences as probes for somatic chromosome identification in maize. Proceedings of the National Academy of Sciences of the United States of America 101, 13554-13559. Kelly, T. J., and Smith, H. O. (1970). A restriction enzyme from Hemophilus Influenzae: II. Base sequence of recognition site. Journal of Molecular Biology 51, 393-409. Kilbride, E., Boocock, M. R., and Stark, W. M. (1999). Topological selectivity of a hybrid site- specific recombination system with elements from Tn3 res/resolvase and bacteriophage P1 loxP/Cre. Journal of Molecular Biology 289, 1219-1230. Kleppe, K., Ohtsuka, E., Kleppe, R., Molineux, I., and Khorana, H. G. (1971). Studies on polynucleotides: XCVI. Repair replication of short synthetic DNA´s as catalyzed by DNA polymerases. Journal of Molecular Biology 56, 341-361. Koch, J. E., Kolvraa, S., Petersen, K. B., Gregersen, N., and Bolund, L. (1989). Oligonucleotide- priming methods for the chromosome-specific labeling of alpha-satellite DNA Insitu. Chromosoma 98, 259-265. Kuhn, H., Demidov, V. V., Coull, J. M., Fiandaca, M. J., Gildea, B. D., and Frank-Kamenetskii, M. D. (2002). Hybridization of DNA and PNA molecular beacons to single-stranded and double-stranded DNA targets. Journal of the American Chemical Society 124, 1097- 1103. Lavrov, D. V. (2010). Rapid proliferation of repetitive palindromic elements in mtDNA of the endemic baikalian sponge Lubomirskia baicalensis. Molecular Biology and Evolution 27, 757-760. Lengerova, M., Kejnovsky, E., Hobza, R., Macas, J., Grant, S. R., and Vyskot, B. (2004). Multicolor FISH mapping of the dioecious model plant, Silene latifolia. Theoretical and Applied Genetics 108, 1193-1199. Leroy, H., Leroy, F., Auge-Gouillou, C., Castagnone-Sereno, P., Vanlerberghe-Masutti, F., Bigot, Y., and Abad, P. (2000). Identification of mariner-like elements from the root-knot nematode Meloidogyne spp. Molecular and Biochemical Parasitology 107, 181-190. Leung, F. C. (1999). New applications of low-C(o)t DNA as a DNA fingerprint probe. Electrophoresis 20, 1762-1767. Li, Y. C., Korol, A. B., Fahima, T., Beiles, A., and Nevo, E. (2002). Microsatellites: genomic distribution, putative functions and mutational mechanisms: a review. Molecular Ecology 11, 2453-2465. 50

Liu, B., Qi, L. W., Chen, R. Y., and Song, W. Q. (2007). Multicolor fluorescence in situ hybridization with combinatorial labeling probes enables a detailed karyotype analysis of Larix principis-rupprechtii. Biological Research 40, 23-28. Liu, G. L., Yin, Y., Kunchakarra, S., Mukherjee, B., Gerion, D., Jett, S. D., Bear, D. G., Gray, J. W., Alivisatos, A. P., Lee, L. P., Chen, F. F. (2006). A nanoplasmonic molecular ruler for measuring nuclease activity and DNA footprinting. Nature Nanotechnology 1. 47-52 Lysák, M. A., Fransz, P. F., Ali, H. B. M., and Schubert, I. (2001). Chromosome painting in Arabidopsis thaliana. Plant Journal 28, 689-697. Lysák, M. A., Pecinka, A., and Schubert, I. (2003). Recent progress in chromosome painting of Arabidopsis and related species. Chromosome Research 11, 195-204. Macas, J., Neumann, P., and Navrátilová, A. (2007). Application of massively parallel pyrosequencing ("454-sequencing") to comprehensive analysis of repetitive DNA in higher plant genomes. Chromosome Research 15, 6-6. Macas, J., Pozárková, D., Navrátilová, A., Nouzová, M., and Neumann, P. (2000). Two new families of tandem repeats isolated from Vicia using genomic self-priming PCR. Molecular and General Genetics 263, 741-751. MacDonald, M. E., Ambrose, C. M., Duyao, M. P., Myers, R. H., Lin, C., Srinidhi, L., Barnes, G., Taylor, S. A., James, M., Groot, N., Macfarlane, H., Jenkins, B., Anderson, M. A., Wexler, N. S., Gusella, J. F., Bates, G. P., Baxendale, S., Hummerich, H., Kirby, S., North, M., Youngman, S., Mott, R., Zehetner, G., Sedlacek, Z., Poustka, A., Frischauf, A. M., Lehrach, H., Buckler, A. J., Church, D., Doucettestamm, L., Odonovan, M. C., Ribaramirez, L., Shah, M., Stanton, V. P., Strobel, S. A., Draths, K. M., Wales, J. L., Dervan, P., Housman, D. E., Altherr, M., Shiang, R., Thompson, L., Fielder, T., Wasmuth, J. J., Tagle, D., Valdes, J., Elmer, L., Allard, M., Castilla, L., Swaroop, M., Blanchard, K., Collins, F. S., Snell, R., Holloway, T., Gillespie, K., Datson, N., Shaw, D., and Harper, P. S. (1993). A novel gene containing a trinucleotide repeat that is expanded and unstable on huntington´s disease chromosomes. Cell 72, 971-983. Markova, M., and Vyskot, B. (2009). New horizons of genomic in situ hybridization. Cytogenetic and Genome Research 126, 368-375. Matsutani, S. (2006). Links between repeated sequences. Journal of Biomedicine and Biotechnology, 1-3. Maxam, A. M., and Gilbert, W. (1977). New method for sequencing DNA. Proceedings of the National Academy of Sciences of the United States of America 74, 560-564. Mazrimas, J. A., and Hatch, F. T. (1972). Possible relationship between satellite DNA and the evolution of kangaroo rat species (genus Dipodomys). Nature New Biology 240, 102- 105. Mazrimas, J. A., and Hatch, F. T. (1977). Similarity of satellite DNA properties in order Rodentia. Nucleic Acids Research 4, 3215-3227. McClintock, B. (1941). The stability of broken ends of chromosomes in Zea mays. Genetics 26, 234-282. McClintock, B. (1951). Chromosome organization and genic expression. Cold Spring Harbor Symposia on Quantitative Biology 16, 13-47. Mehta, G. D., Agarwal, M. P., and Ghosh, S. K. (2010). Centromere identity: a challenge to be faced. Molecular Genetics and Genomics 284, 75-94. Meyers, B. C., Tingley, S. V., and Morgante, M. (2001). Abundance, distribution, and transcriptional activity of repetitive elements in the maize genome. Genome Research 11, 1660-1676. Meyne, J., and Goodwin, E. H. (1995). Direction of DNA-Sequences within Chromatids Determined Using Strand-Specific Fish. Chromosome Research 3, 375-378.

51

Meyne, J., Ratliff, R. L., and Moyzis, R. K. (1989). Conservation of the human telomere sequence (TTAGGG)n among vertebrates. Proceedings of the National Academy of Sciences of the United States of America 86, 7049-7053. Monahan, J. J., and Hall, R. H. (1974). Isopycnic centrifugation of sheared L-cell chromatin in metrizamide gradients. Nucleic Acids Research 1, 1359-1370. Mozgová, I., Mokroš, P., and Fajkus, J. (2010). Dysfunction of chromatin assembly factor 1 induces shortening of telomeres and loss of 45S rDNA in Arabidopsis thaliana. Plant Cell 22, 2768-2780. Mukai, Y., Nakahara, Y., and Yamamoto, M. (1993). Simultaneous discrimination of the 3 genomes in hexaploid wheat by multicolor hluorescence in situ hybridization using total genomic and highly repeated DNA probes. Genome 36, 489-494. Muller, H. J., (1938). The remarking of chromosomes. Collecting Net. 13, 182-198 Murray, K. K. (1996). DNA sequencing by mass spectrometry. Journal of Mass Spectrometry 31, 1203-1215. Nakamura, Y., Leppert, M., Oconnell, P., Wolff, R., Holm, T., Culver, M., Martin, C., Fujimoto, E., Hoff, M., Kumlin, E., and White, R. (1987). Variable number of tandem repeat (VNTR) markers for human-gene mapping. Science 235, 1616-1622. Nakazono, M., Kanno, A., Tsutsumi, N., and Hirai, A. (1994). Palindromic repeated sequences (PRSs) in the mitochondrial genome of rice - evidence for their insertion after divergence of the genus Oryza from the other Gramineae. Plant Molecular Biology 24, 273-281. Navrátilová, A., and Macas, J. (2007). Chromosome localization of novel satellite repeats identified in pea (Pisum sativum) by computer analysis of 454-sequencing data. Chromosome Research 15, 45-45. Nelson, D. L., Ledbetter, S. A., Corbo, L., Victoria, M. F., Ramirezsolis, R., Webster, T. D., Ledbetter, D. H., and Caskey, C. T. (1989). Alu polymerase chain reaction - a method for rapid isolation of human-specific sequences from complex DNA sources. Proceedings of the National Academy of Sciences of the United States of America 86, 6686-6690. Neumann, P., Navrátilová A., Koblíţková A., Kejnovský E., Hřibová E., Hobza R., Widmer A., Doleţel J., Macas J. (2011). Plant centromeric retrotransposons: a structural and cytogenetic perspective. Mobile DNA Journal 2, v tisku Nielsen, P. E, Egholm, M., (1999). An introduction to peptide nucleic acid. Current Issues in Molecular Biology 1, 89-104 Nyren, P. (1987). Enzymatic Method for Continuous Monitoring of DNA-Polymerase-Activity. Analytical Biochemistry 167, 235-238. Ocalewicz, K., Woznicki, P., and Jankun, M. (2008). Mapping of rRNA genes and telomeric sequences in Danube salmon (Hucho hucho) chromosomes using primed in situ labeling technique (PRINS). Genetica 134, 199-203. Pardue, M. L., and DeBaryshe, P. G. (2008). Drosophila telomeres - A variation on the telomerase theme. Fly 2, 101-110. Pardue, M. L., and Gall, J. G. (1970). Chromosomal localization of mouse satellite DNA. Science 168, 1356-1358. Pearson, W. R., Davidson, E. H., and Britten, R. J. (1977). Program for least-squares analysis of reassociation and hybridization data. Nucleic Acids Research 4, 1727-1737. Pech, M., Igokemenes, T., and Zachau, H. G. (1979). Nucleotide sequence of a highly repetitive component of rat DNA. Nucleic Acids Research 7, 417-432. Pellestor, F. (2006). In situ aneuploidy assessment in human sperm: the use of primed in situ and peptide nucleic acid-fluorescence in situ hybridization techniques. Asian Journal of Andrology 8, 387-392. Peterson, D. G., Pearson, W. R., and Stack, S. M. (1998). Characterization of the tomato (Lycopersicon esculentum) genome using in vitro and in situ DNA reassociation. Genome 41, 346-356. 52

Peterson, D. G., Schulze, S. R., Sciara, E. B., Lee, S. A., Bowers, J. E., Nagel, A., Jiang, N., Tibbitts, D. C., Wessler, S. R., and Paterson, A. H. (2002). Integration of Cot analysis, DNA cloning, and high-throughput sequencing facilitates genome characterization and gene discovery. Genome Research 12, 795-807. Pinkel, D., Landegent, J., Collins, C., Fuscoe, J., Segraves, R., Lucas, J., and Gray, J. (1988). Fluorescence insitu hybridization with human chromosome-specific libraries - detection of trisomy 21 and translocations of chromosome 4. Proceedings of the National Academy of Sciences of the United States of America 85, 9138-9142. Poggio, L., Gonzalez, G., Confalonieri, V., Comas, C., and Naranjo, C. A. (2005). The genome organization and diversification of maize and its allied species revisited: evidences from classical and FISH-GISH cytogenetic analysis. Cytogenetic and Genome Research 109, 259-267. Prokopowich, C. D., Gregory, T. R., and Crease, T. J. (2003). The correlation between rDNA copy number and genome size in eukaryotes. Genome 46, 48-50. Ranen, N. G., Stine, O. C., Abbott, M. H., Sherr, M., Codori, A. M., Franz, M. L., Chao, N. I., Chung, A. S., Pleasant, N., Callahan, C., Kasch, L. M., Ghaffari, M., Chase, G. A., Kazazian, H. H., Brandt, J., Folstein, S. E., and Ross, C. A. (1995). Anticipation and instability of It-15 (CAG)n repeats in parent-offspring pairs with huntington disease. American Journal of Human Genetics 57, 593-602. Rangwala, S. H., Zhang, L. L., and Kazazian, H. H. (2009). Many LINE1 elements contribute to the transcriptome of human somatic cells. Genome Biology 10, -. Richards, E. J., and Ausubel, F. M. (1988). Isolation of a higher eukaryotic telomere from Arabidopsis thaliana. Cell 53, 127-136. Ronaghi, M., Uhlen, M., and Nyren, P. (1998). A sequencing method based on real-time pyrophosphate. Science 281, 363-365. Roy, A. M., West, N. C., Rao, A., Adhikari, P., Aleman, C., Barnes, A. P., and Deininger, P. L. (2000). Upstream flanking sequences and transcription of SINEs. Journal of Molecular Biology 302, 17-25. Saiki, R. K., Scharf, S., Faloona, F., Mullis, K. B., Horn, G. T., Erlich, H. A., and Arnheim, N. (1985). Enzymatic amplification of beta-globin genomic sequences and restriction site analysis for diagnosis of sickle-cell anemia. Science 230, 1350-1354. Sanger, F., and Coulson, A. R. (1975). Rapid method for determining sequences in DNA by primed synthesis with DNA-polymerase. Journal of Molecular Biology 94, 441-446. Sanger, F., Nicklen, S., and Coulson, A. R. (1977). DNA sequencing with chain-terminating inhibitors. Proceedings of the National Academy of Sciences of the United States of America 74, 5463-5467. Sedensky, M. M., Hudson, S. J., Everson, B., and Morgan, P. G. (1994). Identification of a Mariner-Like Repetitive Sequence in C-Elegans. Nucleic Acids Research 22, 1719-1723. Shibata, F., Hizume, H., and Kuroki, Y. (1999). Chromosome painting of Y chromosomes and isolation of a Y chromosome-specific repetitive sequence in the dioecious plant Rumex acetosa. Chromosoma 108, 266-270. Schildkraut, C., Doty, P., and Marmur, J. (1961). Formation of hybrid DNA molecules and their use in studies of DNA homologies. Journal of Molecular Biology 3, 595-617. Schneider, P. M. (1997). Basic issues in forensic DNA typing. Forensic Science International 88, 17-22. Schwarz-Finsterle, J., Stein, S., Grossmann, C., Schmitt, E., Schneider, H., Trakhtenbrot, L., Rechavi, G., Amariglio, N., Cremer, C., and Hausmann, M. (2005). COMBO-FISH for focussed fluorescence labelling of gene domains: 3D-analysis of the genome architecture of abl and bcr in human blood cells. Cell Biology International 29, 1038-1046. Schwarzacher, T., Leitch, A. R., Bennett, M. D., and Heslopharrison, J. S. (1989). In situ localization of parental genomes in a wide hybrid. Annals of Botany 64, 315-324. 53

Slijepcevic, P. (2001). Telomere length measurement by Q-FISH. Methods in Cell Science, 17- 22. Smith, H. O., and Wilcox, K. W. (1970). A restriction enzyme from Hemophilus influenzae: I. Purification and general properties. Journal of Molecular Biology 51, 379-391. Southern, E. M. (1975). Detection of specific sequences among DNA fragments separated by gel electrophoresis. Journal of Molecular Biology 98, 503-517. Speicher, M. R., Ballard, S. G., and Ward, D. C. (1996). Karyotyping human chromosomes by combinatorial multi-fluor FISH. Nature Genetics 12, 368-375. Sýkorová, E., Fajkus, J., Mezníková, M., Lim, K. Y., Neplechová, K., Blattner, F. R., Chase, M. W., and Leitch, A. R. (2006). Minisatellite telomeres occur in the family Alliaceae but are lost in Allium. American Journal of Botany 93, 814-823. Sýkorová, E., Lim, K. Y., Chase, M. W., Knapp, S., Leitch, I. J., Leitch, A. R., and Fajkus, J. (2003). The absence of Arabidopsis-type telomeres in Cestrum and closely related genera Vestia and Sessea (Solanaceae): first evidence from . Plant Journal 34, 283-291. Takubo, K., Aida, J., Izumiyama-Shimomura, N., Ishikawa, N., Sawabe, M., Kurabayashi, R., Shiraishi, H., Arai, T., and Nakamura, K. I. (2010). Changes of telomere length with aging. Geriatrics & Gerontology International 10, 197-206. Tam, O. H., Aravin, A. A., Stein, P., Girard, A., Murchison, E. P., Cheloufi, S., Hodges, E., Anger, M., Sachidanandam, R., Schultz, R. M., and Hannon, G. J. (2008). Pseudogene- derived small interfering RNAs regulate gene expression in mouse oocytes. Nature 453, 534-538. Tenhagen, K. G., and Cohen, S. N. (1993). Timing of replication of beta-satellite repeats of human chromosomes. Nucleic Acids Research 21, 2139-2142. Timchenko, L. T., and Caskey, C. T. (1996). Trinucleotide repeat disorders in humans: Discussions of mechanisms and medical issues. Faseb Journal 10, 1589-1597. Trembleau, A., Roche, D., and Calas, A. (1993). Combination of nonradioactive and radioactive in situ hybridization with immunohistochemistry - a new method allowing the simultaneous detection of 2 messenger-RNAs and one antigen in the same brain tissue section. Journal of Histochemistry & Cytochemistry 41, 489-498. Trifonov, E. N. (2010). Base pair stacking in nucleosome DNA and bendability sequence pattern. Journal of Theoretical Biology 263, 337-339. Venter, J. C., Adams, M. D., Myers, E. W., Li, P. W., Mural, R. J., Sutton, G. G., Smith, H. O., Yandell, M., Evans, C. A., Holt, R. A., Gocayne, J. D., Amanatides, P., Ballew, R. M., Huson, D. H., Wortman, J. R., Zhang, Q., Kodira, C. D., Zheng, X. Q. H., Chen, L., Skupski, M., Subramanian, G., Thomas, P. D., Zhang, J. H., Miklos, G. L. G., Nelson, C., Broder, S., Clark, A. G., Nadeau, C., McKusick, V. A., Zinder, N., Levine, A. J., Roberts, R. J., Simon, M., Slayman, C., Hunkapiller, M., Bolanos, R., Delcher, A., Dew, I., Fasulo, D., Flanigan, M., Florea, L., Halpern, A., Hannenhalli, S., Kravitz, S., Levy, S., Mobarry, C., Reinert, K., Remington, K., Abu-Threideh, J., Beasley, E., Biddick, K., Bonazzi, V., Brandon, R., Cargill, M., Chandramouliswaran, I., Charlab, R., Chaturvedi, K., Deng, Z. M., Di Francesco, V., Dunn, P., Eilbeck, K., Evangelista, C., Gabrielian, A. E., Gan, W., Ge, W. M., Gong, F. C., Gu, Z. P., Guan, P., Heiman, T. J., Higgins, M. E., Ji, R. R., Ke, Z. X., Ketchum, K. A., Lai, Z. W., Lei, Y. D., Li, Z. Y., Li, J. Y., Liang, Y., Lin, X. Y., Lu, F., Merkulov, G. V., Milshina, N., Moore, H. M., Naik, A. K., Narayan, V. A., Neelam, B., Nusskern, D., Rusch, D. B., Salzberg, S., Shao, W., Shue, B. X., Sun, J. T., Wang, Z. Y., Wang, A. H., Wang, X., Wang, J., Wei, M. H., Wides, R., Xiao, C. L., Yan, C. H., Yao, A., Ye, J., Zhan, M., Zhang, W. Q., Zhang, H. Y., Zhao, Q., Zheng, L. S., Zhong, F., Zhong, W. Y., Zhu, S. P. C., Zhao, S. Y., Gilbert, D., Baumhueter, S., Spier, G., Carter, C., Cravchik, A., Woodage, T., Ali, F., An, H. J., Awe, A., Baldwin, D., Baden, H., Barnstead, M., Barrow, I., Beeson, K., Busam, D., Carver, A., Center, A., Cheng, M. L., Curry, L., Danaher, S., Davenport, L., Desilets, R., Dietz, S., Dodson, K., 54

Doup, L., Ferriera, S., Garg, N., Gluecksmann, A., Hart, B., Haynes, J., Haynes, C., Heiner, C., Hladun, S., Hostin, D., Houck, J., Howland, T., Ibegwam, C., Johnson, J., Kalush, F., Kline, L., Koduru, S., Love, A., Mann, F., May, D., McCawley, S., McIntosh, T., McMullen, I., Moy, M., Moy, L., Murphy, B., Nelson, K., Pfannkoch, C., Pratts, E., Puri, V., Qureshi, H., Reardon, M., Rodriguez, R., Rogers, Y. H., Romblad, D., Ruhfel, B., Scott, R., Sitter, C., Smallwood, M., Stewart, E., Strong, R., Suh, E., Thomas, R., Tint, N. N., Tse, S., Vech, C., Wang, G., Wetter, J., Williams, S., Williams, M., Windsor, S., Winn-Deen, E., Wolfe, K., Zaveri, J., Zaveri, K., Abril, J. F., Guigo, R., Campbell, M. J., Sjolander, K. V., Karlak, B., Kejariwal, A., Mi, H. Y., Lazareva, B., Hatton, T., Narechania, A., Diemer, K., Muruganujan, A., Guo, N., Sato, S., Bafna, V., Istrail, S., Lippert, R., Schwartz, R., Walenz, B., Yooseph, S., Allen, D., Basu, A., Baxendale, J., Blick, L., Caminha, M., Carnes-Stine, J., Caulk, P., Chiang, Y. H., Coyne, M., Dahlke, C., Mays, A. D., Dombroski, M., Donnelly, M., Ely, D., Esparham, S., Fosler, C., Gire, H., Glanowski, S., Glasser, K., Glodek, A., Gorokhov, M., Graham, K., Gropman, B., Harris, M., Heil, J., Henderson, S., Hoover, J., Jennings, D., Jordan, C., Jordan, J., Kasha, J., Kagan, L., Kraft, C., Levitsky, A., Lewis, M., Liu, X. J., Lopez, J., Ma, D., Majoros, W., McDaniel, J., Murphy, S., Newman, M., Nguyen, T., Nguyen, N., Nodell, M., Pan, S., Peck, J., Peterson, M., Rowe, W., Sanders, R., Scott, J., Simpson, M., Smith, T., Sprague, A., Stockwell, T., Turner, R., Venter, E., Wang, M., Wen, M. Y., Wu, D., Wu, M., Xia, A., Zandieh, A., and Zhu, X. H. (2001). The sequence of the human genome. Science 291, 1304-1351. Vergnaud, G., and Denoeud, F. (2000). Minisateilites: mutability and genome architecture. Genome Research 10, 899-907. Vespa, L., Warrington, R. T., Mokros, P., Siroky, J., and Shippen, D. E. (2007). ATM regulates the length of individual telomere tracts in Arabidopsis. Proceedings of the National Academy of Sciences of the United States of America 104, 18145-18150. Vischi, M., Jurman, I., Bianchi, G., and Morgante, M. (2003). Karyotype of norway spruce by multicolor FISH. Theoretical and Applied Genetics 107, 591-597. Voelkerding, K. V., Dames, S. A., and Durtschi, J. D. (2009). Next-generation sequencing: From basic research to diagnostics. Clinical Chemistry 55, 641-658. Watanabe, M., Satoh, A., Kanemoto, M., Ohkoshi, N., and Shoji, S. (2000). De novo expansion of a CAG repeat in a Japanese patient with sporadic Huntington's disease. Journal of the Neurological Sciences 178, 159-162. Watson, J. D., and Crick, F. H. C. (1953). The structure of DNA. Cold Spring Harbor Symposia on Quantitative Biology 18, 123-131. Watson, J. M., and Shippen, D. E. (2007). Telomere rapid deletion regulates telomere length in Arabidopsis thaliana. Molecular and Cellular Biology 27, 1706-1715. Waye, J. S., and Willard, H. F. (1989). Human beta-satellite DNA - genomic organization and sequence definition of a class of highly repetitive tandem DNA. Proceedings of the National Academy of Sciences of the United States of America 86, 6250-6254. Weiller, G., Schueller, C. M. E., and Schweyen, R. J. (1989). Putative target sites for mobile G + C rich clusters in Yeast mitochondrial-DNA - Single elements and tandem arrays. Molecular & General Genetics 218, 272-283. Wnuk, M., Lewinska, A., Bugno, M., Bartosz, G., and Slota, E. (2009). Rapid detection of yeast rRNA genes with primed in situ (PRINS) labeling. Fems Yeast Research 9, 634-640. Woodhead, J. L., and Malcolm, A. D. B. (1980). Nonspecific-binding of restriction endonuclease Ecor1 to DNA. Nucleic Acids Research 8, 389-402. Xu, L., and Blackburn, E. H. (2007). Human cancer cells Harbor T-stumps, a distinct class of extremely short telomeres. Molecular Cell 28, 315-327.

55

Yanez, M., Verdugo, I., Rodriguez, M., Prat, S., and Ruiz-Lara, S. (1998). Highly heterogeneous families of Tyl/copia retrotransposons in the Lycopersicon chilense genome. Gene 222, 223-228. Yu, J., Hu, S. N., Wang, J., Wong, G. K. S., Li, S. G., Liu, B., Deng, Y. J., Dai, L., Zhou, Y., Zhang, X. Q., Cao, M. L., Liu, J., Sun, J. D., Tang, J. B., Chen, Y. J., Huang, X. B., Lin, W., Ye, C., Tong, W., Cong, L. J., Geng, J. N., Han, Y. J., Li, L., Li, W., Hu, G. Q., Huang, X. G., Li, W. J., Li, J., Liu, Z. W., Li, L., Liu, J. P., Qi, Q. H., Liu, J. S., Li, L., Li, T., Wang, X. G., Lu, H., Wu, T. T., Zhu, M., Ni, P. X., Han, H., Dong, W., Ren, X. Y., Feng, X. L., Cui, P., Li, X. R., Wang, H., Xu, X., Zhai, W. X., Xu, Z., Zhang, J. S., He, S. J., Zhang, J. G., Xu, J. C., Zhang, K. L., Zheng, X. W., Dong, J. H., Zeng, W. Y., Tao, L., Ye, J., Tan, J., Ren, X. D., Chen, X. W., He, J., Liu, D. F., Tian, W., Tian, C. G., Xia, H. G., Bao, Q. Y., Li, G., Gao, H., Cao, T., Wang, J., Zhao, W. M., Li, P., Chen, W., Wang, X. D., Zhang, Y., Hu, J. F., Wang, J., Liu, S., Yang, J., Zhang, G. Y., Xiong, Y. Q., Li, Z. J., Mao, L., Zhou, C. S., Zhu, Z., Chen, R. S., Hao, B. L., Zheng, W. M., Chen, S. Y., Guo, W., Li, G. J., Liu, S. Q., Tao, M., Wang, J., Zhu, L. H., Yuan, L. P., and Yang, H. M. (2002). A draft sequence of the rice genome (Oryza sativa L. ssp indica). Science 296, 79-92. Zhang, Z. L., and Gerstein, M. (2003). The human genome has 49 cytochrome c pseudogenes, including a relic of a primordial gene that still functions in mouse. Gene 312, 61-72. Zoller, J. F., Yang, Y., Herrmann, R. G., and Hohmann, U. (2001). Comparative genomic in situ hybridization (cGISH) analysis on plant chromosomes revealed by labelled Arabidopsis DNA. Chromosome Research 9, 357-375. Zwick, M. S., Hanson, R. E., McKnight, T. D., IslamFaridi, M. N., Stelly, D. M., Wing, R. A., and Price, H. J. (1997). A rapid procedure for the isolation of C(0)t-1 DNA from plants. Genome 40, 138-142.

Další zdroje: BROWN, T. Genomes 1st ed. Oxford : BIOS, 1999. 472 s. ISBN 1859962017 SNUSTAD, D; SIMMONS, Michael J; RELICHOVÁ, Jiřina. Genetika. 5th ed. Brno : Masarykova univerzita, 2009. 871 s. ISNB 9788021048522 ŠMARDA, Jan. Metody molekulární biologie. 1. vyd. Brno : Masarykova univerzita, 2005. 188 s. ISBN 8021038411.

Citované webové stránky: University of Manitoba, 26. Říjen 2010, Global models of genome organization. (Online.) http://www.umanitoba.ca/afs/plant_science/courses/PLNT3140/114/114.html (12. května 2011; datum poslední návštěvy) Sandwalk strolling with a skeptici biochemist, 29. Prosinec 2007, DNA denaturation and Renaturation and the role of hydrogen bonds and stacking interactions. (Online.) http://sandwalk.blogspot.com/2007/12/dna-denaturation-and-renaturation-and.html (12.května 2011;datum poslední návštěvy) Florida museum of natural history, 9. květen 2011, DNA amplification part 1. (Online.) http://www.flmnh.ufl.edu/cowries/amplify.html (12. května 2011; datum poslední návštěvy) Wikipedia, 25. Duben 2011, Locked mucleic acid. (Online.) http://en.wikipedia.org/wiki/Locked_nucleic_acid (12.května 2011; datum poslední návštěvy)

56