PRACE PRZEGL¥DOWE

Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

Pawe³ Mackiewicz1, Przemys³aw Gagat1, Andrzej Body³2 1Zak³ad Genomiki, Wydzia³ Biotechnologii, Uniwersytet Wroc³awski, Wroc³aw 2Zak³ad Bioró¿norodnoœci i Taksonomii Ewolucyjnej, Instytut Zoologiczny, Uniwersytet Wroc³awski, Wroc³aw

Genomics of Protists – very diversified but poorly studied

Summary

Initially, most eukaryotic sequence projects were devoted to typical ani- mals, fungi and plants. Now, more and more effort is put into sequencing pro- tist . Protists are an artificial assemblage that usually contains unicellu- lar eukaryotes coming from different phylogenetic lineages, much more diversi- fied and widespread than higher Eukaryota. The sequenced protist genomes are essential for reconstruction of the Tree of Life and understanding significant events in eukaryotic evolution and diversification. Many protists are parasites and pathogens of medical and economic significance, and play an important ecological role as primary producers and crucial links in food webs. A lot of protists also serve as model organisms in many biological fields and are becom- Adres do korespondencji ing important in biotechnology. 37 protist projects were published Pawe³ Mackiewicz, until the beginning of 2010 and 217 are ongoing. Knowledge coming from these Zak³ad Genomiki, projects will be helpful in more efficient protection from pathogenic protists Wydzia³ Biotechnologii, and their elimination. Sequenced genomes of ecologically important protists Uniwersytet Wroc³awski, ul. Przybyszewskiego 63/77, could help to understand many environmental phenomena and even to control 51-148 Wroc³aw; them. Thanks to the newly sequenced genomes we can discover unknown en- e-mail: zymes and metabolic pathways that will be useful in many branches of biotech- [email protected]. nology. pl Key words: genome, genomics, unicellular , protist, parasite, model organ- 4 (91) 91–130 2010 ism. Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³

1. Sekwencjonowanie genomów i protisty

Mo¿na przyj¹æ, ¿e opublikowanie w 1995 r. pierwszej kompletnej sekwencji wolno ¿yj¹cej bakterii chrobotwórczej – Haemophilus influenzae (1) zapocz¹tkowa³o nowy okres w dziejach biologii nazwany er¹ poligenomow¹ (2). Od tego czasu, dziê- ki rozwojowi nowych technik sekwencjonowania (3-5), liczba kompletnie pozna- nych genomów zaczê³a intensywnie rosn¹æ, a wiele zjawisk zachodz¹cych na ró¿- nych poziomach organizacji biologicznej zaczêto rozpatrywaæ w kontekœcie ca³ego genomu (2). Genomy organizmów prokariotycznych s¹ znacznie czêœciej sekwencjo- nowane ni¿ genomy eukariotów ze wzglêdu na ich relatywnie ma³e rozmiary i prost¹ organizacjê. Wed³ug bazy GOLD (6, http://www.genomesonline.org), do pocz¹tku 2010 r., opublikowano 1033 sekwencje genomów prokariotów i tylko 127 sekwencji przedstawicieli Eukaryota, przy czym te ostatnie genomy nie zawsze zo- sta³y w pe³ni zsekwencjonowane. Zgodnie z t¹ sam¹ baz¹ danych, rozpoczêtych i nie opublikowanych projektów sekwencjonowania genomów prokariotów by³o w tym samym okresie 3824, natomiast eukariotów – 1248. W przypadku eukariotów, wiêkszoœæ projektów sekwencjonowania genomów by³a pocz¹tkowo poœwiêcona organizmom modelowym, takim jak: dro¿d¿e Saccharomyces cerevisiae (7), nicieñ Caenorhabditis elegans (8), muszka owocowa Drosophila melanogaster (9) oraz roœlina wy¿sza Arabidopsis thaliana (10). Zsekwencjonowano równie¿ genom cz³owieka (11,12). Wszystkie te gatunki – podobnie jak wiele innych, których geno- my zsekwencjonowano póŸniej – reprezentuj¹ trzy g³ówne grupy wyró¿niane w ob- rêbie domeny Eukaryota, tj. grzyby, roœliny i zwierzêta (13,14). Pozosta³e eukarioty – niebêd¹ce typowymi grzybami, roœlinami lub zwierzêtami, i zaliczane przez ró¿nych autorów do historycznej grupy Protista lub Protoctista (13-15) – nie by³y pocz¹tkowo eksplorowane na szerok¹ skalê pod wzglêdem genomowym. Podzia³ eukariotów na cztery królestwa: protisty (Protista lub Protoctista), grzy- by (Fungi), zwierzêta (Animalia) oraz roœliny (Plantae) by³ najbardziej popularny do pocz¹tku lat osiemdziesi¹tych XX w. (16). Jednak w bardziej wspó³czesnych koncep- cjach postuluje siê istnienie – zw³aszcza w obrêbie protistów – szeregu nowych grup (17-21). Uwzglêdniaj¹c najnowsze odkrycia filogenetyki molekularnej (22-29), mo¿na wyodrêbniæ osiem g³ównych linii ewolucyjnych (tzw. supergrup) w obrêbie Eukaryota: Opisthokonta, , Archaeplastida, Hacrobia, Rhizaria, Alveolata, Stramenopila (Heterokonta) i Excavata (30-35). Do wielu z tych linii nale¿¹ gatunki bardzo zró¿nicowane morfologicznie, z których wiêkszoœæ jest ci¹gle s³abo poznana pod wzglêdem ultrastrukturalnym i molekularnym. W tabeli 1 przedstawiono krótk¹ charakterystykê poszczególnych supergrup, a na rysunku obecne pogl¹dy na po- wi¹zania filogenetyczne pomiêdzy nimi z podaniem liczby opublikowanych kom- pletnych sekwencji ich genomów oraz liczby kontynuowanych i nie opublikowanych jeszcze projektów.

92 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów Gardia , Tabela 1 Ichthyosporea , Pythium ; paso¿yt zwie- Trichomonas , Toxoplasma ; bruzdnice Phytophthora , Entamoeba histolytica Euglena ; paso¿yty zwierz¹t: Leishamania , Plasmodium , Przyk³ady przedstawicieli lub podgrup Blastocystis Eimeria , zwierzêta (Animalia = Metazoa);choanoflagellaty; grzyby paso¿yty (Fungi); zwierz¹t: Microsporidia proteus ; œluzoroœla (Mycetozoa);Acanthamoeba , paso¿yty: glaukofity (Glaucophyta), krasnorosty (Rhodophyta), roœ- liny zielone (Viridiplantae) obejmuj¹ce zieleniceny i wy¿sze roœli- s³onecznice (Centrohelida); kryptofityhaptofity (Haptophyta) (Cryptophyta); –dê; w Picobiliphyta przesz³oœci – utworzy³y kre- sk³adnik pikoplanktonu (Dinoflagellata) – istotnysymbionty koralowców sk³adnik rafotwórczych, powoduj¹ planktonu, zakwity morskie endo- zwi¹zane z produkcj¹ toksyn promienice (Radiolaria) i otworniceistotna (Foraminifera) rola ska³otwórcza; – paso¿ytyi roœlin zwierz¹t, szczególnie (Phytomyxea) morskich(Ascetosporea) bezkrêgowców Naegleria brunatnice (Phaeophyta); okrzemki (Bacillariophyta) – istotny sk³adnik planktonu; paso¿yty roœlince (Oomycetes): – lêgniow- orzêski (Ciliphora); paso¿ytynp. zwierz¹t (Apicomplexa), rz¹t: Reclinomonas ; Trypanosoma , Charakterystyka p³askie grzebienie mitochondrialne; jednaj¹c¹ wiæ wyrasta- w dystalnejkszta³cone czêœci w mitosomy komórki; (mikrosporidia) mitochondria prze- brak wici; p³atowate i wachlarzowatega³êzione pseudopodia; rurkowate roz- grzebienie mitochondrialne;chondria mito- zmodyfikowane do mitosomów (anaeroby) pseudopodia wzmocnione w³óknami osiowyminice); (s³onecz- plastyd czterob³onowy(kryptofity, nabyty haptofity); istotny od udzia³ krasnorostów w planktonie plastydy dwub³onowe nabyte od sinic; celulozowakomórkowa; œciana p³askie grzebienie mitochondrialne d³ugie, cienkie pseudopodia tworz¹ce sieæ;grzebienie cylindryczne mitochondrialne; pancerzykiotwornice); (promienice, plastyd czterob³onowy(Chlorarachniophyta) nabyty od zielenic dwie wici nierównejpochodzenia d³ugoœci; krasnorostowego; plastydy pancerzyki krzemionko- czterob³onowe we (okrzemki) z³o¿ona pow³okaskomplikowanym komórki systemem sp³aszczonych pêcherzyków (amfisema)(alweole); wzmocniona rurkowate grzebienie mitochondrialne;rakterystyczna cha- budowalob³onowe wici ró¿nego i pochodzenianiefotosyntetyczny rzêsek; (bruzdnice); – plastydy plastyd apikoplast wie- (apikompleksy) nowy nabyty od zielenic (eugleniny); mitochondriakszta³cone prze- w mitosomy lubi hydrogenosomy niektóre (anaeroby mikroaerofile) tkankowej), jednokomórkowe; heterotrofy rotrofy jednokomórkowe, kolonijne,(niektóre wielokomórkowe o z³o¿onej budowie tkankowej); auto- trofy autotrofy (chlorarachniofity) jednokomórkowe, kolonijne, wielokomórkowe pseudotkankowe (brunatnice), pseudogrzybnia komórczakowa (lêgniowce); autotrofy, hetero- trofy (bruzdnice) Supergrupa Formy ¿yciowe i sposób od¿ywiania siê Opsithokonta wielokomórkowe (niektóre o z³o¿onej budowie Amoebozoa ameby, wieloj¹drowa œluŸnia (œluzoroœla); hete- Archaeplastida (Plantae) Hacrobia wiciowce, ameby; autotrofy,Rhizaria heterotrofy ameby, wiciowce, amebowiciowce; heterotrofy, Stramenopila (Heterokonta) Alveolata jednokomórkowe; heterotrofy, autotrofy Excavata wiciowce; heterotrofy; autotrofy (eugleniny) charakterystyczna rynienka pokarmowa; plastyd trójb³o- Charakterystyka g³ównych linii rozwojowych eukariotów (supergrup)

BIOTECHNOLOGIA 4 (91) 91-130 2010 93 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³

Rys. Dotychczasowe pogl¹dy na drzewo ¿ycia ze szczególnym uwzglêdnieniem g³ównych grup eu- kariotów. Podano równie¿ liczby kompletnie zsekwencjonowanych genomów (czcionka pogrubiona) oraz liczby kontynuowanych i nie opublikowanych projektów (czcionka normalna) do pocz¹tku 2010 r.

94 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

Ostatnio coraz wiêcej projektów genomowych skoncentrowanych jest na proti- stach (rys., tab. 2), daj¹c coraz jaœniejszy obraz olbrzymiego zró¿nicowania struktu- ralnego i funkcjonalnego genomów eukariotów. Protisty stanowi¹ przewa¿ajc¹ czêœæ wszystkich przedstawicieli Eukaryota, dlatego poznanie ich genomów jest niezbêdne do wyjaœnienia zwi¹zków filogenetycznych pomiêdzy ró¿nymi liniami eukariotycznymi, a tym samym do odtworzenia drzewa ¿ycia (ang. Tree of Life, http:// tolweb.org/tree). Znajomoœæ genomów protistów pozwala tak¿e zrozumieæ wiele aspektów ewolucji eukariotów. Wspomnieæ tu nale¿y o: 1) zmianach wielkoœci oraz ró¿nych specjaliza- cjach ich genomów, 2) ewolucji intronów spliceosomalnych, 3) zmianach w kodzie genetycznym, 4) poziomym transferze informacji genetycznej, 5) zmianach w szla- kach metabolicznych, 6) kszta³towaniu siê zwi¹zków paso¿ytniczych i symbiotycz- nych oraz 7) nabywaniu organelli komórkowych i ich wtórnych modyfikacjach (36- -43). Wiele protistów ma olbrzymie znaczenie medyczne oraz ekologiczne. Nale¿y tutaj wiele uci¹¿liwych i groŸnych paso¿ytów (np. zarodziec malaryczny Plasmodium falciparum wywo³uj¹cy malariê) oraz organizmów fotosyntetyzuj¹cych, które odgry- waj¹ istotn¹ rolê w ³añcuchach troficznych i obiegu pierwiastków w ekosystemach naturalnych (np. okrzemki Bacillariophyta). Poznanie genomów protistów paso¿ytni- czych mo¿e okazaæ siê pomocne w zrozumieniu mechanizmów dokonywanych przez nie infekcji, a nastêpnie w ich zapobieganiu oraz zwalczaniu wywo³uj¹cych je pa- so¿ytów. Z kolei, zsekwencjonowanie genomów ró¿nych glonów pozwoli zapewne na lepsze zrozumienie sieci zale¿noœci ekologicznych, a w przysz³oœci na kontrolê i ochronê zagro¿onych ekosystemów. Ponadto genomy licznych protistów stanowi¹ bogate Ÿród³o nieznanych jeszcze genów oraz szlaków i cykli metabolicznych, które mog¹ znaleŸæ zastosowanie w ró¿nych ga³êziach biotechnologii.

2. Opublikowane projekty sekwencjonowania genomów protistów

Wed³ug wspomnianej ju¿ bazy GOLD (6), na pocz¹tku 2010 r., wœród 127 opubli- kowanych kompletnych sekwencji genomów eukariotów, 37 genomów reprezento- wa³o szeroko rozumian¹ grupê Protista (rys., tab. 2). Stanowi to tylko 29% wszyst- kich projektów, chocia¿ protisty dominuj¹ na drzewie ¿ycia, a roœliny, zwierzêta i grzyby stanowi¹ jedynie jego niewielk¹ czêœæ (rys.). Najwiêkszym zainteresowa- niem wœród wszystkich organizmów eukariotycznych cieszy³y siê genomy zwierz¹t (45 projektów), grzybów (34 projekty) i roœlin wy¿szych (11 projektów), natomiast wœród protistów poznano najwiêcej genomów alweolatów – 11, przy czym a¿ 9 apikompleksów paso¿ytniczych. W tabeli 2 zamieszczono wykaz i krótk¹ charakterystykê opublikowanych se- kwencji genomów protistów. Do sekwencjonowania wybierano przede wszystkim gatunki: 1) paso¿ytnicze o du¿ym znaczeniu medycznym i gospodarczym, 2) wa¿ne ekologicznie, 3) modelowe, 4) istotne w biotechnologii oraz 5) zasadnicze w zrozu- mieniu ewolucji ¿ycia na naszej planecie.

BIOTECHNOLOGIA 4 (91) 91-130 2010 95 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ 8 Publikacja Tabela 2 Rok 2006 (108) 2004 (58) 2004 (53,59) 2005 (113) 20012007 (106) (107) 20052007 (48,49) 2009 (46) (47) 2007 (74) 2001 (44) 20052007 (71,74,75) (74) opublikowania G³ówne znaczenie i zwierz¹t i zwierz¹t 567 331 ewolucja 472 ewolucja 464 ewolucja 39943807 paso¿yt cz³owieka paso¿yt cz³owieka 4775 modelowy/biotechnologia 2004 (103,104) 1997 paso¿yt cz³owieka 81606470 paso¿yt cz³owieka 6768 paso¿yt cz³owieka paso¿yt cz³owieka 8154 paso¿yt cz³owieka 82988153 paso¿yt cz³owieka paso¿yt cz³owieka 15 143 modelowy/biotechnologia 2007 (102) 12 500 modelowy Liczba genów koduj¹cych bia³ka 4 0,373 0,572 0,551 [Mb] 34 11,7 11 Wielkoœæ genomu 3 Supergrupa Podgrupa Alveolata Apicomplexa 9,1 Archaeplastida ChlorophytaAlveolata 120 Apicomplexa 9,2 Rhizaria Cercozoa Archaeplastida Rhodophyta 16,5 Amoebozoa Mycetozoa Opisthokonta Microsporidia 2,9 Hacrobia Cryptophyta Excavata Fornicata Excavata Fornicata Hacrobia Cryptophyta Excavata Euglenozoa 32,1 Excavata Euglenozoa 32,8 AX4 10D TU502 GB-M1 Iowa II MHOM/BR/75M2904 Excavata Euglenozoa 32 CCMP644 HM-1:IMSS Amoebozoa Archamoebae 20 JPCM5 12 lamblia ) lamblia ) CCMP621 ( ( Friedlin Gatunek (nukleomorf) T2Bo Alveolata Apicomplexa 8,2 3671 paso¿yt zwierz¹t 2007 (52,62) CC-503 cw92 mt+ Chlamydomonas reinhardtii Cryptosporidium hominis Cryptosporidium parvum Bigelowiella natans (nukleomorf) Babesia bovis Cyanidioschyzon merolae Dictyostelium discoideum Encephalitozoon cuniculi Hemiselmis andersenii (nukleomorf) Leishmania infantum Giardia intestinalis Giardia intestinalis Guillardia theta A WB ATCC 50803 B GS ATCC 50581 Entamoeba histolytica Leishmania major Leishmania braziliensis Wykaz opublikowanych genomów protistów

96 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów 8 2008 (114) 2006 (109) 20092006 (82) (82,83) 2006 (82,83) 2002 (52-55) 20082002 (55) (52,57) 2005 (52,60) 2005 (52,60,61) 200720052005 (45) (71,72) (71,73) 567 92007651 ewolucja 7892 ekologiczne/modelowy ekologiczne/modelowy 2007 2006 (90) (90,91) 5403 paso¿yt cz³owieka 5188 paso¿yt cz³owieka i zwierz¹t 2008 (56) 54335878 paso¿yt cz³owieka paso¿yt zwierz¹t 3792 paso¿yt zwierz¹t 4035 paso¿yt zwierz¹t 9068 paso¿yt cz³owieka 39 642 modelowy 17 797 paso¿yt roœlin 14 451 paso¿yt roœlin 16 988 paso¿yt roœlin 59 681 paso¿yt cz³owieka 8,3 8,3 4 72 13,2 12,6 27,4 10 402 ekologiczne/biotechnologia 2008 (93) 65 95 32,4 11 776 ekologiczne/biotechnologia 2004 (93,94) 26 60,4 12 000 paso¿yt cz³owieka 240 103,9 27 424 modelowy/biotechnologia 2006 (110) 3 Opisthokonta Choanoflagellatea 41,6 Archaeplastida Chlorophyta Stramenopila Oomycetes Stramenopila Oomycetes Alveolata Apicomplexa 23,3 Alveolata Ciliophora AlveolataAlveolata Apicomplexa Apicomplexa 26,8 23,1 Alveolata Apicomplexa Alveolata Apicomplexa Excavata Parabasalia 160 CCAP1055/1 Stramenopila Ochrophyta CCMP1335 Stramenopila Ochrophyta SB210 CCE9901 Archaeplastida Chlorophyta 17XNL 3D7 d4-2 (makronukleus) Alveolata Ciliophora Pr102, UCD Pr4 Stramenopila Oomycetes T30-4 G3 H, Pk1(A+) Alveolata Apicomplexa 23,5 12 MX1 TREU927/4 GUTat10.1 Excavata Euglenozoa CCMP1545RCC299 Archaeplastida Chlorophyta Archaeplastida Chlorophyta 21,9 20,9 10 575 10 056 ekologiczne ekologiczne 2009 2009 (92) (92) CL Brener TC3 Excavata Euglenozoa P6497 Ankara C9 Sal-I OTH95 Muguga Micromonas pusilla Micromonas pusilla Monosiga brevicollis Ostreococcus lucimarinus Ostreococcus tauri Paramecium tetraurelia Phaeodactylum tricornutum Phytophthora infestans Phytophthora ramorum Phytophthora sojae Plasmodium falciparum Plasmodium knowlesi Plasmodium vivax Plasmodium yoelii yoelii Tetrahymena thermophila Thalassiosira pseudonana (makronukleus) Theileria annulata Theileria parva Trichomonas vaginalis Trypanosoma brucei Trypanosoma cruzi

BIOTECHNOLOGIA 4 (91) 91-130 2010 97 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³

2.1. Genomy protistów paso¿ytniczych

Protisty paso¿ytnicze wyewoluowa³y niezale¿nie w ró¿nych liniach filogenetycz- nych, takich jak: Alveolata, Excavata, Amoebozoa, Stramenopila i Opisthokonta (33). Pomimo adaptacji do odmiennych nisz ekologicznych (np. specjalizacja do ró¿nych ¿ywicieli), ich genomy wykszta³ci³y na drodze konwergencji wiele cech wspólnych. Z jednej strony, uleg³y one redukcji i utraci³y wiele genów, zw³aszcza tych zwi¹za- nych z metabolizmem, które okaza³y siê zbêdne w bogatym w ró¿ne zwi¹zki che- miczne œrodowisku ¿ywiciela. Z drugiej jednak strony, dosz³o w nich do ekspansji rodzin genów zaanga¿owanych w przystosowanie do paso¿ytniczego trybu ¿ycia. Dotyczy to przede wszystkim genów umo¿liwiaj¹cych skuteczn¹ infekcjê oraz o- chronê przed uk³adem odpornoœciowym gospodarza. Istotne znaczenie w ich ewo- lucji odegra³ równie¿ poziomy transfer genów od bakterii, który umo¿liwi³ przemo- delowanie i wzbogacenie metabolizmu tych paso¿ytów. Z kolei, charakterystyczne dla nich geny s¹ dobrymi kandydatami do wykorzystania w celach diagnostycznych, produkcji szczepionek i opracowania nowych metod leczenia.

2.1.1. Genomy paso¿ytów pozbawionych typowych mitochondriów: Encephalitozoon cuniculi, Entamoeba histolytica, Trichomonas vaginalis i Giardia intestinalis

Wa¿nymi z punktu widzenia medycznego i ekonomicznego s¹ patogenne proti- sty anaerobowe i mikroaerofilne, które reprezentowane s¹ przez: 1) mikrospori- dium Encephalitozoon cuniculi (44), 2) ekskawaty Trichomonas vaginalis (45) i 3) Giardia (lamblia) intestinalis (46,47) oraz 4) amebê Entamoeba histolytica (48,49). E. cuniculi charakteryzuje siê du¿ym potencja³em zoonotycznym, infekuj¹c ró¿ne gatunki ssa- ków, w tym cz³owieka. Choruj¹ przede wszystkim osobniki o obni¿onej odpornoœci, np. dotkniête AIDS czy za¿ywaj¹ce cyklosporynê. G³ówne objawy to problemy ga- stryczne i neurologiczne, które zwi¹zane s¹ z miejscem ekspansji tego paso¿yta. T. vaginalis (rzêsistek pochwowy) bytuje w uk³adzie moczowo-p³ciowym cz³owieka, powoduj¹c rocznie 170 milionów zaka¿eñ. Ostre infekcje rzêsistkiem s¹ czêsto po- wodem wzrostu ryzyka zara¿enia wirusem HIV-1. G. intestinalis (giardia lub lamblia) wywo³uje lambliozê, infekuj¹c – najczêœciej u dzieci – jelito i pêcherzyk ¿ó³ciowy, co powoduje 250 milionów objawowych zaka¿eñ rocznie. E. histolytica (pe³zak czer- wonki) jest równie¿ paso¿ytem uk³adu pokarmowego, który wywo³uje pe³zakowicê u 50 milionów ludzi rocznie. Na podstawie analiz genomów E. cuniculi (44), T. vaginalis (45), G. intestinalis (46,47) oraz E. histolytica (48, 49) (zob. tak¿e tab. 2) wykazano brak lub ubóstwo ge- nów zaanga¿owanych w syntezê nukleotydów, kwasów t³uszczowych i aminokwa- sów, co wynika z paso¿ytniczego trybu ¿ycia i dostarczania wielu zwi¹zków przez organizm gospodarza. Geny zaanga¿owane w biosyntezê aminokwasów i kwasów t³uszczowych wystêpuj¹ tylko u T. vaginalis.UT. vaginalis i G. intestinalis nie znale-

98 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów ziono równie¿ genów koduj¹cych miozynê, co wskazuje na istnienie osobliwego mechanizmu cytokinezy, który nie wymaga pierœcienia aktyno-miozynowego. Najwiêkszej redukcji uleg³y genomy: G. intestinalis oraz E. cuniculi. Ten drugi ge- nom jest jednoczeœnie najmniejszym (2,9 Mb) z dotychczas zsekwencjonowanych genomów organizmów eukariotycznych, wy³¹czaj¹c genomy nukleomorfów (zob. podrozdz. 2.3.3). Genomy G. intestinalis i E. cuniculi s¹ zwarte pod wzglêdem struktu- ry i sk³adu genów. Ich geny s¹ bardzo ubogie w introny: u E. cuniculi znaleziono ich 13, natomiast u G. intestinalis – zaledwie 4. Ponadto genom E. cuniculi charakteryzu- je siê zredukowan¹ d³ugoœci¹ zarówno sekwencji miêdzygenowych, jak i sekwencji samych bia³ek w porównaniu do ich homologów u innych eukariotów. Olbrzymia za- le¿noœæ G. intestinalis i E. cuniculi od swoich gospodarzy objawia siê znacznymi uproszczeniami na poziomie ich metabolizmu komórkowego. E. cuniculi nie jest zdolny do przeprowadzania fermentacji alkoholowej i mlekowej. Z kolei, obecnoœæ enzymów zaanga¿owanych w produkcjê i rozk³ad trehalozy sugeruje, ¿e jest to g³ówny rezerwuar wêglowodanów u tego paso¿yta. Presja selekcyjna na redukcjê genomów E. cuniculi i G. intestinalis doprowadzi³a równie¿ do uproszczenia ich ma- szynerii replikacyjnej i transkrypcyjnej, a tak¿e transportu wewn¹trzkomórkowego. U E. cuniculi kolejnym uproszczeniom uleg³y aparat translacyjny oraz potranslacyjna modyfikacja bia³ek, natomiast u G. intestinalis – zestaw genów zwi¹zanych z polia- denylacj¹, degradacj¹ mRNA oraz cytoszkieletem aktynowym. Ka¿dy z genomów omawianych paso¿ytów posiada swoje charakterystyczne cechy. Na przyk³ad genom G. intestinalis jest tetraploidalny i wystêpuje w postaci dwóch j¹der. Dla genomu E. histolytica charakterystyczne s¹ natomiast d³ugie, tandemowo po- wtórzone sekwencje tRNA, które stanowi¹ 10% wielkoœci genomu i pe³ni¹ najprawdo- podobniej funkcje strukturalne. Z kolei, interesuj¹c¹ cech¹ genomu T. vaginalis jest a¿ 65% zawartoœæ sekwencji powtórzonych i niedawno rozprzestrzenionych jednostek trans- pozonowych, co doprowadzi³o do wzrostu wielkoœci tego genomu. Niezwykle du¿a jest równie¿ liczba przewidzianych genów, która wynosi prawie 60 tysiêcy i jest jedn¹ z najwy¿szych wœród eukariotów. Jednak introny znaleziono zaledwie w 65 genach. Du¿y wp³yw na ukszta³towanie siê metabolomu E. histolytica, G. intestinalis oraz T. vaginalis mia³y wielokrotne poziome transfery genów od bakterii. W ich geno- mach zidentyfikowano odpowiednio 96, 100 i 152 geny o takim pochodzeniu. Wœród nich, najwiêcej jest genów koduj¹cych enzymy zwi¹zane z metabolizmem wêglowodanów i aminokwasów. Umo¿liwiaj¹ one zwiêkszenie zakresu przetwarza- nych zwi¹zków, które s¹ ³atwo dostêpne w bogatym œrodowisku gospodarzy. W prawie wszystkich genomach charakteryzowanych gatunków paso¿ytów, ale z wyj¹tkiem bardzo zredukowanego genomu E. cuniculi, dosz³o do niezale¿nych eks- pansji wielu rodzin bia³ek zwi¹zanych z adaptacj¹ do paso¿ytniczego trybu ¿ycia i specyficznego œrodowiska gospodarza. U T. vaginalis szczególnie liczne – jak na eukarioty jednokomórkowe – s¹ kinazy kodowane przez oko³o 900 genów. Bia³ka te s¹ równie¿ bogato reprezentowane w zwartych genomach G. intestinalis i E. histolytica. Du¿a liczba kinaz mo¿e œwiadczyæ o z³o¿onym systemie przekszta³cania sygna³ów

BIOTECHNOLOGIA 4 (91) 91-130 2010 99 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ u tych paso¿ytów. U T. vaginalis dosz³o ponadto do ekspansji ró¿nych typów bia³ek powierzchniowych, takich jak: BspA, GP63 i VSP, które kodowane s¹ przez oko³o 800 genów. U G. intestinalis zmienne bia³ka powierzchniowe (VSP) równie¿ tworz¹ du¿¹ rodzinê bia³ek. U E. histolytica liczne s¹ lektyny wielopodjednostkowe GalGalNAc, a ponadto znaleziono geny koduj¹ce bia³ka powierzchniowe typu BspA. Wszystkie te bia³ka s¹ istotne w adhezji i inwazji gospodarzy oraz ochronie E. histolytica przed ich enzymami trawiennymi i uk³adem odpornoœciowym. U E. histolytica i T. vaginalis zidentyfikowano dodatkowo peptydy homologiczne, które tworz¹ pory w komór- kach gospodarza i prowadz¹ ostatecznie do ich lizy. Genomy E. histolytica i T. vaginalis koduj¹ szczególnie liczne bia³ka zwi¹zane z transportem pêcherzykowym, które s¹ wa¿ne w procesach, takich jak: 1) sekrecja bia³ek patogennych, 2) fagocytoza bakte- rii i komórek gospodarza oraz 3) endocytoza bia³ek i innych cz¹steczek znajdu- j¹cych siê w otaczaj¹cym œrodowisku gospodarza. Do innych bogato reprezentowa- nych rodzin bia³ek u T. vaginalis, które zwi¹zane s¹ z paso¿ytniczym trybem ¿ycia, nale¿¹: 1) peptydazy (potencjalne czynniki wirulencji, niektóre z nich s¹ kandydata- mi na inhibitory peptydazy anty-HIV), 2) transportery wêglowodanów i aminokwa- sów (umo¿liwiaj¹ce pobieranie tych zwi¹zków od gospodarza) oraz 3) kotransporte- ry kationowo-chlorkowe (reguluj¹ce zmiany osmotyczne œrodowiska gospodarza). U T. vaginalis zidentyfikowano tak¿e enzymy zaanga¿owane w syntezê lipofosfogli- kanu tworz¹cego glikokaliks na powierzchni komórki, który odpowiada za przylega- nie tego paso¿yta do komórek gospodarza. Z kolei, genom E. histolytica koduje: 1) liczne proteazy cysteinowe, odpowiedzialne za degradacjê macierzy zewn¹trzko- mórkowej gospodarza, 2) receptory chrakteryzuj¹ce siê obecnoœci¹ siedmiu obsza- rów transb³onowych oraz 3) trimery bia³ek G, które reguluj¹ proces encystacji. Wiele z wymienionych bia³ek mo¿e s³u¿yæ do celów diagnostycznych, produkcji szczepionek lub jako potencjalne cele dla leków. Dziêki sekwencjom genomów E. cuniculi, E. histolytica, G. intestinalis i T. vaginalis dok³adniej poznano molekularne pod³o¿e ich patogenezy i infekcji, co bêdzie pomocne w leczeniu i zapobieganiu wywo³ywanym przez nie chorobom. Jedn¹ z istotnych cech wspólnych E. cuniculi, E. histolytica, G. intestinalis i T. vaginalis jest brak typowych mitochondriów, które uleg³y przekszta³ceniu w hydrogenosomy (T. vaginalis) lub mitosomy (pozosta³e gatunki) (50,51). Hydrogenosomy uczestnicz¹ w produkcji ATP i wodoru na drodze oddychania beztlenowego. Analizy genomu T. vaginalis doprowadzi³y do wykrycia jeszcze jednej – dotychczas nie znanej – funkcji tego organellum, która zwi¹zana jest z metabolizmem aminokwasów. W mi- tosomach natomiast zachodzi dojrzewanie bia³ek ¿elazowo-siarkowych (50,51). Przypuszcza siê, ¿e mog¹ one tak¿e chroniæ paso¿yty przez stresem oksydacyjnym. Dowodem na dawn¹ obecnoœæ typowych mitochondriów u przodków opisywanych gatunków jest wystêpowanie w ich genomach j¹drowych genów homologicznych z genami mitochondrialnymi (50,51). Zarówno hydrogenosomy, jak i mitosomy s¹ pozbawione enzymów cyklu Krebsa oraz ³añcucha transportu elektronów, a geny koduj¹ce te bia³ka zosta³y utracone przez genomy j¹drowe.

100 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

Bardzo ciekawe wyniki uzyskano porównuj¹c genomy szczepów patogennych zali- czanych do jednego gatunku – G. intestinalis (46,47). Spoœród 7 genotypów zsekwen- cjonowano genomy dwóch: GS i WB, które zaka¿aj¹ cz³owieka. Genomy tych szcze- pów wykazuj¹ odpowiednio 77 i 78% identycznoœci w sekwencjach koduj¹cych bia³ka na poziomie nukleotydowym i aminokwasowym. Genotyp GS charakteryzuje siê wiêk- szym poziomem polimorfizmu allelicznego (0,53%) ni¿ genotyp WB (0,01%), przy czym oba genomy s¹ tetraploidalne. Mo¿e to œwiadczyæ o ró¿nych mechanizmach tworzenia i redukcji zmiennoœci w ka¿dym z tych szczepów. W szczepie GS zidentyfikowano 28 unikatowych genów, natomiast w szczepie WB – tylko 3 takie geny. Mog¹ one zostaæ wykorzystane w celach diagnostycznych oraz identyfikacji poszczególnych szczepów. Niektóre z tych genów wykazuj¹ pochodzenie bakteryjne, a funkcja wielu z nich jest nieznana. Interesuj¹c¹ cech¹, ró¿ni¹c¹ szczepy GS i WB, jest zmienny repertuar bia³ek VSP. Dodatkowe ró¿nice dotycz¹ bia³ek: NEK i HCMP. Wszystkie te cechy mog¹ wyjaœ- niaæ obserwowane ró¿nice biologiczne i kliniczne pomiêdzy obu szczepami G. intestinalis. Ponadto promotory kilku enzymów szczepu GS, które zwi¹zane s¹ z syntez¹ œciany cy- sty, nie posiadaj¹ typowych miejsc wi¹zania czynników transkrypcyjnych Myb2, co mo¿e t³umaczyæ s³absz¹ encystacjê tego szczepu i sugerowaæ inny mechanizm jej re- gulacji. Zaobserwowane ró¿nice pomiêdzy szczepami GS i WB uprawniaj¹ do trakto- wania ich jako odrêbnych gatunków i mog¹ pomóc w skuteczniejszym zapobieganiu i leczeniu wywo³ywanych przez nie chorób.

2.1.2. Genomy apikompleksów: Babesia, Cryptosporidium, Plasmodium, Theileria

Wœród opublikowanych obecnie genomów protistów, najliczniejsz¹ grupê stano- wi¹ przedstawiciele Apicomplexa (sporowce w³aœciwe) (33). S¹ one endopaso¿ytami (czêsto wewn¹trzkomórkowymi) bezkrêgowców i krêgowców. Spoœród znanych po- nad 5000 gatunków, opublikowanych zosta³o zaledwie 9 genomów, nale¿¹cych do: 1) czterech gatunków z rodzaju Plasmodium (52-57), 2) dwóch gatunków z rodzaju Cryptosporidium (53,58,59), 3) dwóch gatunków z rodzaju Theileria (52,60,61) oraz 4) Babesia bovis (52,62) (zob. tak¿e tab. 2). Genomy te zosta³y zsekwencjonowane ze wzglêdu na ich olbrzymie znaczenie medyczne, gospodarcze i spo³eczne. Na przy- k³ad z powodu malarii, za któr¹ odpowiadaj¹ zarodŸce z rodzaju Plasmodium, ka¿de- go roku umiera 2,7 miliona ludzi, a 300-500 milionów choruje. Szczególnie niebez- pieczny jest gatunek P. falciparum bêd¹cy najwiêkszym zabójc¹ ludzi wœród apikom- pleksów. Co 30 sekund pozbawia on ¿ycia jedno dziecko w Afryce. Pozosta³e wymie- nione apikompleksy, odpowiedzialne s¹ za kryptosporidiozê u ludzi (Cryptosporidium spp.) oraz choroby byd³a: babeszjozê (Babesia bovis), gor¹czkê wschodniego wybrze- ¿a Afryki (Theileria parva) i teileriozê tropikaln¹ (T. annulata). Straty wyrz¹dzane przez te gatunki szacuje siê na setki milionów dolarów rocznie. Opublikowane genomy: Plasmodium (52-57), Cryptosporidium (53,58,59), Theileria (52,60,61) oraz Babesia (52,62) s¹ zró¿nicowane pod wzglêdem ich wielkoœci i struk-

BIOTECHNOLOGIA 4 (91) 91-130 2010 101 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ tury. U Plasmodium maj¹ one wielkoœæ oko³o 25 Mb, natomiast u Cryptosporidium, Theileria i Babesia s¹ prawie trzy razy mniejsze. Jednak potencja³ koduj¹cy genomu Plasmodium (licz¹cego oko³o 5500 genów) jest zaledwie w 30% wiêkszy od zdolnoœci koduj¹cych: Cryptosporidium, Theileria i Babesia. Rozbie¿noœci w wielkoœci genomu i liczbie kodowanych genów pomiêdzy Plasmodium a Cryptosporidium, Theileria i Babesia wynikaj¹ z krótszych regionów miêdzygenowych i gêstszego upakowania genów u trzech ostatnich rodzajów. Najwiêcej intronów posiadaj¹ genomy: Theileria i Babesia. U Theileria geny podzielone stanowi¹ a¿ 75% ca³ego genomu, u Plasmodium – ponad 50%, natomiast u Cryptosporidium – zaledwie 5%. Zwiêkszenie liczby intronów mo¿e mieæ znaczenie dla tworzenia nowych wariantów genów (i kodowanych przez nie bia³ek) na drodze tasowania eksonów, wp³ywaj¹c w ten sposób na du¿¹ zmiennoœæ antygenow¹ komórek Theileria i Babesia. Wszystkie zsekwencjonowane genomy przedstawicieli Apicomplexa s¹ ubogie w sekwencje koduj¹ce tRNA (39-47 kopii) i rRNA (2-7 kopii), co pokazuje ich tendencjê do redukcji. Tendencjê tê, która wynika z przystosowania do paso¿ytniczego trybu ¿y- cia, mo¿na równie¿ dostrzec w zaniku wielu enzymów zaanga¿owanych w podstawo- we szlaki metaboliczne, takie jak: 1) glukoneogeneza, 2) utlenianie kwasów t³uszczo- wych, 3) cykl mocznikowy, 4) synteza aminokwasów, 5) hemu, 6) puryn i 7) kwasów t³uszczowych. Podobnie jak u innych paso¿ytów, genomy apikompleksów charaktery- zuj¹ siê zwiêkszon¹ liczb¹ par AT. W ekstremalnych przypadkach siêga ona a¿ 81% u P. falciparum, natomiast u P. vivax wynosi – 58%. Stosunkowo niska, jak na apikom- pleksy, zawartoœæ par AT u P. vivax mo¿e byæ zwi¹zana z izochoryczn¹ struktur¹ jego chromosomów, w których tylko zmienne czêœci telomerów s¹ bogate w pary AT, nato- miast obszary konserwatywne – o du¿ym potencjale koduj¹cym – obfituj¹ w pary GC. Jednym z zaskakuj¹cych odkryæ, bêd¹cych wynikiem sekwencjonowania geno- mów apikompleksów, jest brak mo¿liwoœci przyporz¹dkowania a¿ 40% genów do odpowiednich grupy ortologicznych, co sugeruje, ¿e koduj¹ one nowe rodziny bia- ³ek. Powstawanie nowych genów jest najprawdopodobniej przyczyn¹ wyodrêbnia- nia siê nowych gatunków w obrêbie Apicomplexa. Gatunki te ró¿ni¹ siê pomiêdzy sob¹ niejednokrotnie zaledwie kilkoma genami, które koduj¹ bia³ka chroni¹ce ich komórki przed odpowiedzi¹ ze strony uk³adu odpornoœciowego gospodarza, np. bia³ka powierzchniowe o du¿ej zmiennoœci antygenowej (PfEMP1) u P. falciparum czy glikoproteiny podobne do mucyny u C. parvum. Czêsta lokalizacja subtelomero- wa tych genów (szczególnie u Plasmodium) dodatkowo zwiêksza ich zmiennoœæ anty- genow¹ na skutek czêstych rekombinacji. Sekwencjonowanie genomów przedstawicieli Apicomplexa jest szczególnie istotne, poniewa¿ roœnie ich opornoœæ na dostêpne leki, natomiast ich wektory (ko- mary – w przypadku Plasmodium, a kleszcze – w przypadku Theileria i Babesia) rów- nie¿ nabywaj¹ odpornoœci na insektycydy. Informacje zawarte w genomach apikom- pleksów pozwoli³y ju¿ na wyselekcjonowanie najlepszych kandydatów na szcze- pionki (np. bia³ka adhezyjne, odpowiedzialne za ³¹czenie siê apikompleksów z ko- mórkami gospodarza), jak równie¿ stanowi¹ podstawê do prac nad nowymi lekami

102 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

(55,57,63,64). ród³em nowych rozwi¹zañ biotechnologicznych mo¿e byæ tak¿e po- znanie nowych rodzin bia³ek u apikompleksów oraz zrozumienie, w jaki sposób radz¹ one sobie z uk³adem odpornoœciowym gospodarza, czego przyk³adem mo¿e byæ transformacja leukocytów przez przedstawicieli Theileria (65). Zdecydowana wiêkszoœæ apikompleksów posiada charakterystyczne organellum zwane apikoplastem (66), które jest zmodyfikowanym plastydem o pochodzeniu kra- snorostowym lub zielenicowym (67,68). Apicoplast nie jest aktywny fotosyntetycznie i zosta³ zaadoptowany do paso¿ytniczego trybu ¿ycia, uczestnicz¹c w syntezie izopre- noidów, kwasów t³uszczowych i hemu (66). Jego genom koduje bardzo niewiele ge- nów, dlatego prawie wszystkie bia³ka apikoplastu kodowane s¹ przez genom j¹drowy. Bia³ka te importowane s¹ przez system wewn¹trzb³onowy za pomoc¹ charakterystycz- nych presekwencji dwuczêœciowych, które sk³adaj¹ siê z peptydu sygna³owego i pep- tydu tranzytowego (69). Apikoplastu nie zidentyfikowano dotychczas u gatunków Cryptosporidium. Jednak w genomach j¹drowych C. hominis oraz C. parvum znaleziono geny, które mog¹ œwiadczyæ o jego wczeœniejszej obecnoœci (58,70).

2.1.3. Genomy œwidrowców: Trypanosoma i Leishmania

G³ównymi powodami sekwencjonowania 5 genomów œwidrowców z rodzajów: Trypanosoma (71-73) i Leishmania (71,74,75) (zob. tak¿e tab. 2) by³y wa¿ne powody medyczne i weterynaryjne. T. brucei wywo³uje œpi¹czk¹ afrykañsk¹, T. cruzi – choro- bê Chagasa, natomiast L. major, L. infantum i L. braziliensis – ró¿ne typy leiszma- nioz. £¹cznie Trypanosoma i Leishmania infekuj¹ miliony, a zabijaj¹ dziesi¹tki tysiêcy ludzi. Niestety, brak szczepionek – w po³¹czeniu z toksycznoœci¹ stosowanych le- ków – nie daje nadziei na poprawê sytuacji w najbli¿szych latach. Genomy przedstawicieli Trypanosoma (71-73) i Leishmania (71,74,75), podobnie jak genomy apikompleksów (zob. poprzedni rozdz.), charakteryzuj¹ siê du¿¹ ró¿no- rodnoœci¹ strukturaln¹. Genom T. brucei sk³ada siê z 11 par du¿ych chromosomów o wielkoœci powy¿ej 1 Mb, natomiast genomy T. cruzi i Leishmania z odpowiednio 28 i 35-36 par mniejszych chromosomów. T. brucei posiada dodatkowo 3-5 œrednich chromosomów (200-500 kb) i oko³o 100 minichromosomów (50-100 kb), co w sumie daje zadziwiaj¹c¹ liczbê oko³o 120 chromosomów. Bogate w chromosomy kariotypy T. cruzi i Leishmania odzwierciedlaj¹ stan ancestralny, natomiast du¿e chromosomy u T. brucei s¹ wynikiem fuzji mniejszych chromosomów. Genom T. cruzi jest dwa razy wiêkszy od genomów pozosta³ych œwidrowców. Posiada on w przybli¿eniu 25-30% wiêcej genów ni¿ pozosta³e gatunki Trypanosoma oraz gatunki Leishmania, a co najmniej 50% jego genomu sk³ada siê z sekwencji powtórzonych, takich jak: 1) retrotranspozony, 2) powtórzenia subtelomerowe oraz 3) rodziny wielogenowe koduj¹ce bia³ka powierzchniowe. Pomimo tych ró¿nic, genomy Trypanosoma i Leishmania s¹ podobne pod wzglê- dem organizacyjnym. Wystêpuj¹ w nich olbrzymie klastry policistronowe, sk³ada-

BIOTECHNOLOGIA 4 (91) 91-130 2010 103 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ j¹ce siê z dziesi¹tek, a nawet setek genów, pomiêdzy którymi nastêpuje prze³¹cza- nie kodowania nici DNA, tzn. niæ sensowa staje siê antysensow¹, a niæ antysensowa sensow¹ (76-78). Tworzenie olbrzymich klastrów genów jest jedn¹ z g³ównych przy- czyn zdumiewaj¹co wysokiego poziomu syntenii u œwidrowców. Pomimo 200-500 milionów lat niezale¿nej ewolucji, 68% genów u T. brucei i 75% u L. major zachowa³o swoje konserwatywne u³o¿enie. Na utrzymanie syntenii wp³ywaj¹ te¿ bardzo rzad- kie rekombinacje mejotyczne, poniewa¿ rozmna¿anie p³ciowe zdarza siê u œwi- drowców wyj¹tkowo rzadko. Najbardziej zmienne geny, które charakterystyczne s¹ dla poszczególnych ga- tunków œwidrowców i odpowiadaj¹ za oddzia³ywania z komórkami gospodarza, wy- stêpuj¹ pomiêdzy blokami konserwatywnych genów. U Trypanosoma, najliczniejsze z nich, zaanga¿owane s¹ w produkcjê glikoprotein powierzchniowych, umo¿liwia- j¹cych unikniêcie reakcji ze strony uk³adu odpornoœciowego gospodarza poprzez generowanie du¿ej zmiennoœci antygenowej. U T. brucei jedna z takich glikoprotein, zwana zmienn¹ glikoprotein¹ powierzchniow¹ (VSG), kodowana jest przez 1000 se- kwencji. VSG tworzy p³aszcz glikoproteinowy zbudowany z 10 milionów identycz- nych makrocz¹steczek, które os³aniaj¹ niezmienne epitopy paso¿yta przed syste- mem immunologicznym gospodarza. Wiêkszoœæ sekwencji koduj¹cych VSG to pseu- dogeny u³o¿one tandemowo w czêœciach subtelomerowych chromosomów. Stano- wi¹ one swoisty rezerwuar potencjalnej zmiennoœci antygenowej, który wykorzysty- wany jest do tworzenia aktywnych genów zlokalizowanych w specjalnych miejscach ekspresji (BESs, ang. Bloodstream Expression Sites). Niektóre z tych genów powstaj¹ w sposób mozaikowy z po³¹czenia ró¿nych genów VSG. Aktywacja nowego genu VSG polega na zast¹pieniu starego genu nowym w miejscu BES. Mechanizm ten umo¿liwia ci¹g³e tworzenie nowego rodzaju VSG, co powoduje permanentny stan infekcji, który nieleczony prowadzi do œmierci. T. cruzi posiada znacznie wiêcej ró¿- nych genów koduj¹cych bia³ka powierzchniowe ni¿ pozosta³e œwidrowce. Wœród nich nale¿y wymieniæ: 1) mucyny, 2) bia³ka powierzchniowe zwi¹zane z mucynami (MASP), 3) proteazy gp63 oraz 4) bardzo zmienne transsialidazy (TS), znajduj¹ce siê pod szczególnie siln¹ presj¹ immunologiczn¹. Na powierzchni komórek Leishmania wystêpuj¹ glikoproteiny kodowane przez du¿e rodziny genów, takie jak: amastin, gp46 i gp63. Jednak powierzchnia ich komó- rek zdominowana jest przez charakterystyczne kompleksy wêglowodanowe, które uczestnicz¹ w ró¿nych etapach procesu infekcji. Kompleksy te zawieraj¹: 1) lipofos- foglikan (LPG), 2) fosfolipidy glikoinozytolowe (GIPL) oraz 3) proteofosfoglikan (PPG). Obecnoœæ dwóch bia³ek zawieraj¹cych domenê czynnika hamuj¹cego migra- cjê makrofagów (MIF), które kodowane s¹ przez geny LmjF33.1740 i LmjF33.1750, mo¿e stanowiæ jeden z wielu sposobów na prze¿ycie komórek Leishmania w organi- zmie gospodarza poprzez hamowanie odpowiedzi komórkowej ze strony jego uk³a- du odpornoœciowego. Paso¿ytniczy tryb ¿ycia powoduje u œwidrowców z jednej strony ekspansjê ge- nów koduj¹cych makrocz¹steczki oddzia³uj¹ce z organizmem gospodarza, nato-

104 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów miast z drugiej prowadzi do znacznej redukcji zdolnoœci metabolicznych. Przyk³a- dem mo¿e byæ utrata enzymów odpowiedzialnych za syntezê: hemu, wiêkszoœci aminokwasów oraz puryn. Spoœród wszystkich zsekwencjonowanych genomów œwi- drowców, najbardziej zredukowanym metabolizmem charakteryzuje siê T. brucei. Wynika to z jedynie zewn¹trzkomórkowego trybu ¿ycia i, w konsekwencji, prost- szego cyklu rozwojowego. Koniecznoœæ adaptacji do wiêkszej liczby nisz ekologicz- nych, zarówno zewn¹trz-, jak i wewn¹trzkomórkowego œrodowiska makrofagów, sprawia, ¿e liczba ortologów u T. cruzi i Leishmania jest wy¿sza ni¿ u T. brucei. Œwidrowce posiadaj¹ tak¿e uproszczon¹ maszyneriê transkrypcyjn¹, a brak me- chanizmów jej kontroli ujawnia siê w postaci duplikacji genów jako œrodka na zwiêkszenie ich ekspresji. Duplikacje genów i ich dywergencja pozwalaj¹ równie¿ na zwiêkszanie zmiennoœci. Innymi cechami charakterystycznymi œwidrowców, któ- re pozostaj¹ w bezpoœrednim zwi¹zku z ich genomami, s¹: 1) transsplicing po³¹czo- ny z poliadenylacj¹, 2) du¿y potencja³ modyfikacji potranslacyjnych bia³ek, 3) reduk- cja szlaków przekazywania sygna³ów komórkowych przy jednoczesnej ekspansji ki- naz bia³kowych oraz 4) zdolnoœæ do modyfikacji histonów, wskazuj¹ca na wczesne pojawienie siê modelowania chromatyny u eukariotów. Nale¿y równie¿ wspomnieæ o dominuj¹cej roli cytoszkieletu tubulinowego, której towarzyszy brak homologów bia³ek filamentów poœrednich oraz redukcja cytoszkieletu aktyno-miozynowego. G³ównymi czynnikami kszta³tuj¹cymi ewolucjê genomów Trypanosoma by³y insercje nowych fragmentów chromosomów oraz substytucje istniej¹cych ju¿ odcinków, które rozrywa³y bloki synteniczne generuj¹c geny specyficzne gatunkowo. Z kolei, w obrêbie linii Leishmania, zmiany polega³y g³ównie na utracie genów, które ulega³y wczeœniej przekszta³ceniu w pseudogeny. Zsekwencjonowanie genomów œwidrowców pozwoli³o na wyselekcjonowanie du¿ej liczby bia³ek nabytych od bakterii na drodze poziomego transferu genów (72,79), które s¹ doskona³ymi kandydatami do badañ nad nowymi lekami. Wyprodu- kowanie skutecznych leków, a tak¿e szczepionek, jest pilne, poniewa¿ w ostatnich latach obserwujemy wzrost przypadków zachorowañ na trypanosomatozy i leiszma- niozy. Opublikowane genomy pomog¹ równie¿ wyjaœniæ zagadki zwi¹zane z ewolu- cj¹ œwidrowców. Wci¹¿ bowiem trwaj¹ debaty nad tym, czy posiada³y one w swojej przesz³oœci plastyd (79-81).

2.1.4. Genomy gatunków Phytophtora – uci¹¿liwe paso¿yty roœlin wy¿szych, które s¹ blisko spokrewnione z glonami posiadaj¹cymi plastydy z³o¿one

Przedstawiciele rodzaju Phytophtora s¹ uci¹¿liwymi, grzybopodobnymi paso¿yta- mi roœlin nale¿¹cymi do lêgniowców (Oomycetes) (33). Wspólnie z okrzemkami, bru- natnicami, z³otowiciowcami i pokrewnymi grupami glonów, tworz¹ one gromadê Stramenopila (33). Dotychczas poznano kompletne sekwencje genomów trzech ga- tunków Phytophtora:1)P. infestans (zaraza ziemniaczana) – infekuj¹cej g³ównie

BIOTECHNOLOGIA 4 (91) 91-130 2010 105 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ ziemniaki (82), 2) P. sojae – zara¿aj¹cej sojê (82,83) oraz 3) P. ramorum – infe- kuj¹cej 100 ró¿nych gatunków roœlin, w tym dêby i ró¿aneczniki (82,83) (zob. tak¿e tab. 2). Paso¿yty te powoduj¹ ogromne straty w rolnictwie i ekosystemach natural- nych. Epidemia zarazy ziemniaczanej w Irlandii w po³owie XIX w. by³a przyczyn¹ wielkiego g³odu i masowych migracji ludnoœci do USA. Przedstawiciele rodzaju Phytophtora charakteryzuj¹ siê szczególnie szybkimi zdolnoœciami adaptacyjnymi, co ma odzwierciedlenie w strukturze ich genomów (82,83). Porównanie genomów trzech gatunków Phytophtora ujawni³o obecnoœæ kon- serwatywnych bloków sekwencji bogatych w kolinearnie u³o¿one geny, które roz- dzielone s¹ regionami zawieraj¹cymi mniej genów, ale o wiêkszej zawartoœci se- kwencji powtórzonych i jednostek transpozonowych. To w³aœnie one odpowiedzial- ne s¹ za rearan¿acje i niezwyk³¹ zmiennoœæ tych obszarów. Udzia³ sekwencji powtó- rzonych w genomach Phytophtora wzrasta wraz z ich wielkoœci¹: od 28% (u P. ramorum), poprzez 39% (u P. sojae) do 74% (u P. infestans). Ten ostatni gatunek posiada równie¿ od 5 do 10 razy wiêcej ró¿nych ruchomych elementów genetycznych ni¿ dwa pozo- sta³e gatunki. Najbardziej interesuj¹ce jest to, ¿e w tych dynamicznych regionach zgromadzone s¹ przede wszystkim szybko ewoluuj¹ce geny, które koduj¹ efektoro- we bia³ka sekrecyjne odpowiedzialne za patogennoœæ i infekcyjnoœæ przedstawicieli Phytophtora oraz zmianê fizjologii swoich gospodarzy. Bia³ka te reprezentowane s¹ przez tzw. efektory apoplastowe wydzielane do przestrzeni miêdzykomórkowej, ta- kie jak: 1) hydrolazy degraduj¹ce tkanki, 2) inhibitory enzymów gospodarza i 3) tok- syny nekrotyczne. Inn¹ grup¹ efektorowych bia³ek sekrecyjnych s¹ bia³ka cytoplaz- matyczne, reprezentowane przez RXLR i CRN, które transportowane s¹ do wnêtrza komórek roœlin przez specjaln¹ ssawkê. Bia³ka te s¹ szczególnie liczne i zró¿nicowa- ne u P. infestans. Ka¿dy gatunek Phytophtora ma w³asny unikatowy repertuar genów determinuj¹cych jego specyficznoœæ wzglêdem gospodarza, sposób infekcji i cha- rakter patogennoœci. Szybka ewolucja tych genów jest napêdzana przez czêste re- kombinacje niealleliczne oraz duplikacje tandemowe, co generuje du¿¹ zmiennoœæ genetyczn¹, zapewniaj¹c¹ plastycznoœæ adaptacyjn¹ gatunkom Phytophtora. Chocia¿ przedstawiciele Phytophtora s¹ blisko spokrewnieni z glonami zaliczany- mi do Stramenopila (33,84,85), to jednak nie znaleziono u nich plastydu. Zgodnie z hipotez¹ chromalweolata, wspólny przodek stramenopili, alweolatów, kryptofi- tów i haptofitów, naby³ na drodze wtórnej endosymbiozy plastyd od krasnorostu, który zosta³ nastêpnie utracony w ró¿nych liniach heterotroficznych (np. u orzê- sków), w³¹czaj¹c czêœæ form paso¿ytniczych, takich jak przedstawiciele rodzaju Phytophtora (84,85). W genomach gatunków Phytophtora zidentyfikowano geny po- chodz¹ce od krasnorostów i sinic (83), co mog³oby œwiadczyæ o wczeœniejszej obec- noœci plastydu u tych paso¿ytów. Jednak w przeprowadzonych analizach statystycz- nych nie wykazano, aby ich udzia³ by³ wystarczaj¹cy do poparcia hipotezy chromal- weolata (86).

106 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

2.2. Protisty wa¿ne ekologicznie

Protisty o du¿ym znaczeniu ekologicznym, to przede wszystkim ró¿ne glony fo- tosyntetyzuj¹ce bêd¹ce istotnym sk³adnikiem planktonu, które s¹ odpowiedzialne za wi¹zanie ditlenku wêgla i produkcjê pierwotn¹ w ekosystemach mórz i oceanów. Genomy gatunków o takim znaczeniu poznano w dwóch grupach: u zielenic i okrze- mek. U glonów tych wyewoluowa³y ró¿ne strategie adaptacyjne (np. zwi¹zane z wy- stêpowaniem odmiennych aparatów fotosyntetycznych czy osobliwych selenoenzy- mów), natomiast w ich genomach dominuj¹ geny zaanga¿owane w metabolizm ko- mórkowy, które u³atwiaj¹ optymalne wykorzystanie zasobów œrodowiska.

2.2.1. Niewielkie genomy pikoeukariotów: Micromonas i Ostreococcus

Pikoeukarioty s¹ formami planktonowymi, charakteryzuj¹cymi siê niewielkimi rozmiarami komórek – od 0,2 do 2 mm. Nale¿¹ do nich m.in. fotosyntetyzujace prasinofity (Prasinophyceae), które odga³êziaj¹ siê u podstawy drzewa filogenetycz- nego roœlin zielonych (87). S¹ to prosto uorganizowane glony jednokomórkowe z jednym plastydem i mitochondrium, pozbawione œciany komórkowej i wici. Piko- eukarioty s¹ jednak szeroko rozprzestrzenione, od mórz tropikalnych po polarne, i odgrywaj¹ du¿¹ rolê w ich produkcji pierwotnej, procesach biogeochemicznych i ³añcuchach troficznych (88,89). Stanowi¹ one istotne wskaŸniki kondycji ekosyste- mów morskich i, w konsekwencji, zmian klimatycznych. Obecnie znamy kompletne sekwencje genomów czterech parsinofitów. S¹ to dwa gatunki Ostreococcus: O. lucumarinus (90) i O. tauri (90,91) oraz dwa szczepy Micromonas pusilla oznaczone jako: CCMP1545 i RCC299 (92) (zob. tak¿e tab. 2). Cech¹ charakterystyczn¹ genomów Ostreococcus (90,91) i Micromonas (92) s¹ ich niewielkie rozmiary, przy czym najbardziej zredukowane genomy posiadaj¹ gatunki Ostreococcus. Nale¿y podkreœliæ, ¿e w genomach Micromonas znaleziono geny zwi¹- zane z rozmna¿aniem p³ciowym i tworzeniem œciany komórkowej. Odkrycie to jest nieoczekiwane, poniewa¿ procesów tych nie zaobserwowano dotychczas u tego prasinofita. Genomy Micromonas koduj¹ wiêcej rodzin transporterów b³onowych oraz bia³ek zapewniaj¹cych ochronê przed metalami ciê¿kimi i wolnymi rodnikami ni¿ genomy Ostreococcus. Jednak w przeciwieñstwie do genomów Ostreococcus,s¹ one ubogie (szczep CCMP1545) lub pozbawione (szczep RCC299) transpozonów. Zsekwencjonowane genomy dwóch szczepów M. pusilla s¹ prawie identyczne (97%) pod wzglêdem sekwencji 18S rRNA, maj¹ jednak tylko 90% wspólnych genów, co wskazuje, ¿e mog¹ one byæ osobnymi gatunkami. Hipoteza ta jest zgodna z ist- niej¹cymi pomiêdzy nimi du¿ymi ró¿nicami ekologicznymi. Szczep CCMP1545 zo- sta³ wyizolowany z wód umiarkowanych, natomiast RCC299 – z wód tropikalnych. Geny specyficzne dla poszczególnych szczepów pochodz¹ najprawdopodobniej z poziomych transferów od bakterii i opistokontów. Szczep CCMP1545 nie posiada

BIOTECHNOLOGIA 4 (91) 91-130 2010 107 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ niektórych rodzin bia³ek (np. transporterów dla zwi¹zków azotu), które s¹ niezbêd- ne dla szczepu RCC299, ¿yj¹cego w wodach bardziej oligotroficznych. Ponadto szczepy M. pusilla ró¿ni¹ siê: 1) organizacj¹ prze³¹czników RNA (tzw. ryboprze- ³¹czników), 2) sk³adem komponentów RNAi, 3) liczb¹ intronów oraz 4) obecnoœci¹ sekwencji powtórzonych. Genomy Ostreococcus s¹ bardzo zredukowane, co zwi¹zane jest z miniaturyzacj¹ ich komórek (oko³o 1 mm). Genomy te cechuj¹ siê szczególnie du¿¹ gêstoœci¹ kodo- wania. Bardzo ma³o jest sekwencji powtórzonych. Introny s¹ stosunkowo krótkie, a liczba zduplikowanych genów jest niewielka. Ponad 300 genów uleg³o fuzji, a wie- le genów z du¿ych rodzin bia³ek zosta³o utraconych, np. geny zaanga¿owane w bio- genezê wici oraz œciany komórkowej czy geny koduj¹ce czynniki transkrypcyjne i bia³ka bêd¹ce sk³adnikami chromatyny. Najciekawsz¹ adaptacj¹ Ostreococcus jest stosunkowo du¿a liczba bia³ek zawie- raj¹cych selenocysteinê, która kodowana jest przez kodon TGA. U O. lucumarinus bia³ek tych jest 20, u O. tauri – 19, podczas gdy w 10 razy wiêkszym genomie ziele- nicy Chlamydomonas reinhardtii – tylko 10. Selenoenzymy s¹ bardziej reaktywne ni¿ enzymy bez selenu, dlatego komórka zawieraj¹ca te bia³ka mo¿e ograniczyæ liczbê innych enzymów. Analizy genomów Ostreococcus wskazuj¹ na istnienie kilku intere- suj¹cych cech fenotypowych, takich jak: 1) optymalizacja w wykorzystaniu zasobów œrodowiska (np. wystêpowanie transporterów amonowych), 2) obecnoœæ unikatowe- go metabolizmu metali oraz 3) adaptacja do niskiej zawartoœci ¿elaza w œrodowi- sku. Ich aparat fotosyntetyczny charakteryzuje siê brakiem typowych bia³ek uk³adu antenowego LHCII, natomiast obecnoœci¹ – specyficznych dla prasinofitów – bia- ³ek wi¹¿¹cych chlorofil oraz bia³ek zwi¹zanych z fotosyntez¹ typu C4. O. lucumarinus przystosowany jest do wiêkszej intensywnoœci œwiat³a i, w zwi¹zku z tym, posiada dwie kopie genu ferrytyny, podczas gdy niewyspecjalizowany O. tauri – tylko jedn¹. Na podstawie analiz porównawczych genomów O. lucumarinus i O. tauri wykaza- no, ¿e 18 z 20 ich chromosomów charakteryzuje siê wysokim poziomem syntenii i konserwatywnoœci. Jednak chromosom 2 jest bogaty w introny i charakteryzuje siê du¿ym poziomem rearan¿acji genów, za co odpowiedzialne s¹ wystêpuj¹ce licznie na nim transpozony. Przypuszcza siê, ¿e mo¿e to byæ chromosom p³ciowy. Dodatko- wo, po jednym chromosomie u ka¿dego gatunku, nie wykazuje prawie ¿adnych po- dobieñstw i koduje geny zwi¹zane z biosyntez¹, modyfikacj¹ lub transportem wê- glowodanów. Geny te najprawdopodobniej pochodz¹c¹ z poziomych transferów. Mog¹ one odgrywaæ rolê w zmianie glikozylacji powierzchni komórki, stanowi¹c w ten sposób ochronê przed fagami oraz protistami fagotroficznymi. Jeden z chro- mosomów u O. lucumarinus powsta³ w wyniku fuzji dwóch innych. Opisane zmiany chromosomów s¹ najprawdopodobniej zwi¹zane ze specjacj¹ w obrêbie rodzaju Ostreococcus.

108 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

2.2.2. Zró¿nicowane genomy okrzemek: Phaeodactylum tricornutum i Thalassiosira pseudonana

Okrzemki (z grupy Stramenopila) s¹ glonami jednokomórkowymi zasiedlaj¹cymi zarówno wody œródl¹dowe, jak i morskie (33,93,94). Maj¹ one szczególne znaczenie ekologiczne. Ich rola w globalnym obiegu wêgla i globalnej fotosyntezie jest porów- nywana do produktynoœci wszystkich lasów deszczowych razem wziêtych. Charak- terystyczn¹ cech¹ ich komórek jest obecnoœæ krzemionkowej œciany komórkowej. Ponadto okrzemki posiadaj¹ plastyd czterob³onowy, który zosta³ nabyty od krasno- rostu na drodze endosymbiozy wtórnej (93-96). Dotychczas poznano genomy dwóch gatunków okrzemek: Thalassiosira pseudonana (93,94) oraz Phaeodactylum tricornutum (93). Pierwszy z nich nale¿y do okrzemek promienistych, natomiast drugi – do okrzemek pierzastych. Chocia¿ linie te od- dzieli³y siê zaledwie 90 milionów lat temu, to struktura i organizacja genomów Thalassiosira i Phaeodactylum s¹ bardzo ró¿ne. Nie stwierdzono wiêkszych obszarów syntenii. Ponad 40% genów nie posiada homologów w drugim genomie. W genomie T. pseudonana wystêpuje wiêcej intronów ni¿ u P. tricornutum (odpowiednio 1,5 i 0,79 intronów na gen). Z kolei, genom Phaeodactylum charakteryzuje siê wiêksz¹ aktywnoœci¹ retrotranspozonów ni¿ genom Thalassiosira. Ich udzia³ w ka¿dym z ge- nomów wynosi odpowiednio 3,8 i 1,1%. Retrotranspozony odegra³y z pewnoœci¹ istotn¹ rolê w rearan¿acji tych genomów. Przypuszcza siê, ¿e wysokie tempo ró¿ni- cowania siê genomów i genów u T. pseudonana i P. tricornutum umo¿liwi³o odniesie- nie przez nie sukcesu ewolucyjnego i intensywn¹ ekspansj¹ w morzach i oceanach. Poznanie genomów Phaeodactylum i Thalassiosira pozwoli³o na zidentyfikowanie nowych genów, zaanga¿owanych w: 1) transport kwasu krzemowego, 2) tworzenie œciany komórkowej, 3) pobieranie ¿elaza, 4) biosyntezê wielonienasyconych kwa- sów t³uszczowych oraz 5) wykorzystywanie zwi¹zków azotu. Znajomoœæ szczegó- ³ów biosyntezy nanostruktur w pancerzykach okrzemek, opartych na analizach ich genomów, mo¿e okazaæ siê istotna w dalszym rozwoju nanotechnologii bazuj¹cych na krzemie (97,98). Zaskakuj¹ce by³o odkrycie u nich kompletnego cyklu moczniko- wego, zintegrowanego z metabolizmem komórkowym. Szczególnie liczne s¹ rodzi- ny: 1) kinaz histydynowych, 2) cyklin (reguluj¹cych cykl komórkowy), 3) bia³ek zwi¹- zanych z metabolizmem poliamidów d³ugo³añcuchowych (uczestnicz¹cych w two- rzeniu œciany komórkowej) oraz 4) czynników transkrypcyjnych bia³ek szoku ter- micznego (ulegaj¹cych ekspresji w pewnych warunkach wzrostu i stanowi¹cych po- ³owê wszystkich czynników transkrypcyjnych). Interesuj¹ce jest wystêpowanie w genomach T. pseudonana i P. tricornutum ponad 300. genów nabytych w wyniku poziomego transferu z ró¿nych grup prokariotów, o rz¹d wielkoœci wiêcej ni¿ w genomach innych eukariotów, ale podobnie jak u bak- terii. Nabyte geny istotnie kszta³tuj¹ funkcjonowanie komórek okrzemek i s¹ odpo- wiedzialne za wykorzystanie wêgla organicznego oraz azotu. Uczestnicz¹ one po- nadto w: 1) cyklu mocznikowym, 2) metabolizmie poliamin, 3) tworzeniu œciany ko-

BIOTECHNOLOGIA 4 (91) 91-130 2010 109 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ mórkowej, 4) nietypowych mechanizmach replikacji, 5) naprawie i rekombinacji DNA oraz 6) odbieraniu sygna³ów ze œrodowiska opartych na kinazach histydyno- wych. Plastyd okrzemek zosta³ nabyty od krasnorostu (95,96). Jednak, w przeciwieñ- stwie do plastydu kryptofitów (zob. podrozdz. 2.3.3), utraci³ on j¹dro komórkowe endosymbionta. Ponadto genomy plastydowe okrzemek koduj¹ znacznie mniej ge- nów ni¿ genomy plastydowe krasnorostów (99). Wszystko to wskazuje na intensyw- ny transfer genów z genomów endosymbionta do genomu j¹drowego gospodarza. Na podstawie analiz zsekwencjonowanych genomów Phaeodactylum i Thalassiosira wykazano, ¿e zawieraj¹ one wiele genów maj¹cych pochodzenie krasnorostowe (93,94). Geny te koduj¹ bia³ka z charakterystycznymi dwuczêœciowymi presekwen- cjami, które sk³adaj¹ siê z peptydu sygna³owego oraz peptydu tranzytowego, i od- powiadaj¹ za ich import do plastydu czterob³onowego (100). Nieoczekiwane wyniki przynios³y dalsze analizy filogenomiczne, które wykaza³y obecnoœæ ponad dwukrot- nie wiêcej genów pochodzenia zielenicowego ni¿ krasnorostowego (101). Dane te mo¿na zinterpretowaæ w dwojaki sposób: albo przodek okrzemek posiada³ endo- symbionta lub plastyd o pochodzeniu zielenicowym, albo te¿ geny te zosta³y nabyte od zielenic w wyniku wielu poziomych transferów. Przysz³e studia powinny pomóc w sprecyzowaniu ich pochodzenia.

2.3. Modelowe gatunki glonów i ich zredukowane j¹dra wystêpujace jako nu- kleomorfy

Aby zrozumieæ funkcjonowanie komórek eukariotycznych zdolnych do przeprowa- dzania fotosyntezy, zsekwencjonowano genomy relatywnie prosto uorganizowanych glonów jednokomórkowych, takich jak: zielenice i krasnorosty. Dziêki zwartoœci ich genomów oraz obecnoœci najbardziej istotnych genów, mo¿na ³atwo przeanalizowaæ wiele istotnych zjawisk i procesów zachodz¹cych na poziomie molekularnym oraz zro- zumieæ ich funkcjonowanie w kontekœcie ca³ej komórki eukariotycznej. Skrajnym przy- padkiem uproszczenia genomów zielenic i krasnorostów s¹ nukleomorfy – silnie zre- dukowane j¹dra komórkowe, które, wraz z ca³¹ komórk¹, zosta³y poch³oniête przez inne protisty heterotroficzne, co doprowdzi³o do powstania plastydów wielob³ono- wych i wy³onienia siê nowych linii ewolucyjnych w obrêbie Eukaryota.

2.3.1. Genom modelowej zielenicy Chlamydomonas reinhardtii

C. reinhardtii (zaw³otnia) jest zielenic¹ jednokomórkow¹, s³u¿¹c¹ za bardzo do- bry system modelowy do badania zarówno zjawiska fotosyntezy, jak i funkcjonowa- nia wici, które s¹ nieobecne w komórkach roœlin wy¿szych (33,102). Zielenica ta jest bardzo dobrym obiektem do badañ, poniewa¿ charakteryzuje siê krótkim czasem

110 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów trwania generacji i mo¿e rosn¹æ równie¿ w ciemnoœci, wykorzystuj¹c octan jako Ÿród³o wêgla i energii. Cech¹ charakterystyczn¹ genomu Chlamydomonas (102) (zob. równie¿ tab. 2) jest du¿a zawartoœæ intronów w porównaniu do innych eukariotów jednokomórkowych oraz roœlin wy¿szych. U C. reinhardtii liczba eksonów na gen wynosi 8,3, natomiast u roœliny wy¿szej A. thaliana – 5,2. Introny w genach Chlamydomonas s¹ œrednio d³u¿sze (373 bp) ni¿ introny w genach Arabidopsis (164 bp). Sugeruje siê, ¿e du¿y udzia³ w ich modyfikacjach mog³y mieæ transpozony. W genomie C. reinhardtii ge- nów podzielonych jest 92%, podczas gdy w genomie A. thaliana – 79%. W wyniku analiz porównawczych genomu Chlamydomonas z innymi zsekwencjo- nowanymi genomami eukariotów zidentyfikowano du¿¹ liczbê genów odpowiedzial- nych za biogenezê plastydów (349 genów) oraz wici (195 genów), przy czym wiele z nich nie by³o wczeœniej znanych. Podobnie jak u A. thaliana, bardzo licznymi rodzi- nami bia³ek s¹ kinazy i cytochromy P-450. Jednak najliczniejsz¹ rodzin¹, równie¿ w porównaniu z innymi organizmami, jest klasa III cyklaz guanylowych i adenylo- wych. Nukleotydy cykliczne, tworzone przez te enzymy, uczestnicz¹ w przekszta³- caniu sygna³ów w komórce i s¹ istotne u C. reinhardtii w procesach: rozmna¿ania, funkcjonowania wici oraz przystosowywania siê do zmiennych warunków troficz- nych w œrodowisku. Adaptacjê do takich warunków umo¿liwiaj¹ równie¿ zró¿nico- wane transportery b³onowe, specyficzne dla poszczególnych zwi¹zków, wœród któ- rych najliczniejsze s¹ transportery: fosforanowe PiT i potasowe KUP. W obrêbie transporterów b³onowych zidentyfikowano tak¿e transportery charakterystyczne dla komórek zwierz¹t (np. reguluj¹ce poziom kationów wapnia i innych jonów), które zwi¹zane s¹ z funkcjonowaniem wici.

2.3.2. Uproszczony genom termofilnego i kwasolubnego krasnorostu Cyanidoschyzon merolae

C. merolae jest bardzo ma³ym (2 mm) krasnorostem jednokomórkowym, ¿yj¹cym w gor¹cych Ÿród³ach siarkowych o niskim pH (33,103,104). Posiada on minimalny zestaw organelli komórkowych oraz ma³y i prosto zorganizowany genom, co czyni go idealnym organizmem modelowym do badania funkcjonowania i ewolucji ko- mórki eukariotycznej. Osobliw¹ cech¹ genomu Cyanidoschyzon (103,104) (zob. równie¿ tab. 2) jest bar- dzo wysoka u¿ywalnoœæ dinukleotydów CpG w porówaniu do innych eukariotów. Jednostki transpozonowe stanowi¹ zaledwie 0,7% jego genomu, natomiast obecne s¹ kopie nieznanych rozproszonych elementów powtórzonych, które s¹ aktywne transkrypcyjnie i stanowi¹ 5% genomu. Podstawowy zestaw istotnych genów czyni C. merolae bardzo dobrym modelem do badañ proteomicznych. Jedynie w 26 genach stwierdzono wystêpowanie intronów, a a¿ 25 z nich zawiera tylko jeden intron. Znaleziono jedynie 3 kopie rDNA, bez tandemowych powtórzeñ typowych dla euka-

BIOTECHNOLOGIA 4 (91) 91-130 2010 111 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ riotów, oraz tylko 30 genów tRNA. Stwierdzono zmniejszony udzia³ genów zwi¹za- nych z: 1) biosyntez¹ metabolitów wtórnych, 2) transportem komórkowym, 3) kata- bolizmem oraz 4) transdukcj¹ sygna³ów, co wi¹¿e siê ze s³abym zró¿nicowaniem ko- mórki Cyanidoschyzon. Cech¹ charakterystyczn¹ genomu tego krasnorostu jest naj- mniejszy znany klaster genów koduj¹cych histony, który zlokalizowany jest tylko na jednym chromosomie. W genomie C. merolae wystêpuj¹ tylko dwa geny dynamin, zwi¹zane z podzia³em mitochondriów i plastydów. Nie stwierdzono natomiast genów dla dyneiny i miozy- ny, co mo¿e œwiadczyæ o prostym mechanizmie cytokinezy. Aparat importu bia³ek do plastydu nie zawiera trzech komponentów: Toc159, Tic40 i Tic55, które obecne s¹ u roœlin wy¿szych. Cyanidoschyzon posiada równie¿ najprostszy zestaw chlorofili i karotenoidów wœród eukariotów fotosyntetyzuj¹cych. Podobnie jak u roœlin wy¿- szych, znaleziono u niego ten sam mozaikowy (tj. pochodzenia sinicowego i euka- riotycznego) zestaw enzymów cyklu Calvina, potwierdzaj¹c w ten sposób koncepcjê jednorazowego nabycia plastydu przez wspólnego przodka zielenic i krasnorostów (105). Genom mniejszy od genomu C. merolae odkryto u zielenicy Ostreococcus (zob. podrozdz. 2.2.1.), jednak nie jest on w takim samym stopniu uproszczony struktu- ralnie jak genom Cyanidoschyzon. Poniewa¿ C. merolae ¿yje w ekstremalnych warun- kach œrodowiskowych, nie wiadomo, czy uproszczenie jego genomu jest cech¹ pier- wotn¹, czy raczej wtórn¹, wynikaj¹c¹ z przystosowania do specyficznych warunków ¿ycia. W uzyskaniu odpowiedzi na to pytanie mo¿e pomóc poznanie genomu kolej- nego krasnorostu zamieszkuj¹cego gor¹ce Ÿród³a – Galdieria sulphuraria. Bardziej szczegó³owe analizy bia³ek Cyanidoschyzon bêd¹ istotne w poznaniu ich adaptacji strukturalnych do wysokiej temperatury i du¿ej kwasowoœci. Dane te mog¹ znaleŸæ wa¿ne zastosowanie w biotechnologii, pomagaj¹c w projektowaniu bardziej stabil- nych bia³ek.

2.3.3. Genomy nukleomorfów – skrajnie zredukowane j¹dra komórkowe endo- symbiontów pochodz¹cych od krasnorostów i zielenic

Nukleomorfy to niezwyk³e organelle komórkowe wystêpuj¹ce w przestrzeni pe- riplastydowej niektórych typów plastydów czterob³onowych (42,106-108). S¹ one zredukowanymi j¹drami komórkowymi glonów, które zosta³y poch³oniête przez jednokomórkowe eukarioty heterotroficzne, a nastêpnie przekszta³cone w plastydy z³o¿one. Zjawisko to okreœlane jest jako endosymbioza wtórna, w przeciwieñstwie do endosymbiozy pierwotnej, polegaj¹cej na poch³oniêciu cyjanobakterii, czyli or- ganizmu prokariotycznego (95,96). Nukleomorfy zosta³y zachowane tylko w dwóch liniach filogenetycznych: u kryptofitów, które wesz³y w endosymbiozê z krasno- rostem oraz u chlorarachniofitów, które naby³y swój plastyd od zielenicy (42,106-108).

112 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

Chocia¿ nukleomorfy kryptofitów i chlorarachniofitów wyewoluowa³y niezale¿- nie, to jednak ich genomy s¹ uderzaj¹co podobne zarówno pod wzglêdem ich wiel- koœci, jak i struktury. Obecnie dysponujemy kompletnymi sekwencjami nukleomor- fów dwóch kryptofitów: Guillardia theta (106) i Hemiselmis andersenii (107) oraz jedne- go chlorarachinofita: Bigelowiella natans (108) (zob. tak¿e tab. 2). Nukleomorfy s¹ jednymi z najmniejszych genomów, nawet w porównaniu z genomami prokariotów. Ich wielkoœæ (< 1 Mb), a tak¿e potencja³ koduj¹cy, uleg³y drastycznej redukcji w po- równaniu do spokrewnionych z nimi form wolno¿yj¹cych. Na przyk³ad wielkoœæ ge- nomu nukleomorfu B. natans i liczba jego genów s¹ odpowiednio 300- i 50-krotnie mniejsze ni¿ u zielenicy C. reinhardtii (zob. podrozdz. 2.3.1). Zarówno nukleomorfy kryptofitów, jak i chlorarachniofitów zawieraj¹ tylko 3 chromosomy, dostarczaj¹c w ten sposób interesuj¹cy przyk³ad konwergencji ewolucyjnej. Sugeruje siê, ¿e mniejsze, ale liczniejsze chromosomy mog³yby zostaæ zagubione podczas podzia³u mitotycznego, natomiast w przypadku wiêkszych chromosomów istnia³by problem z ich upakowaniem w nukleomorfie. Trzy chromosomy, o wielkoœci od 95 do 210 kb, jak siê wydaje, stanowi¹ optymalne rozwi¹zanie dla zapewnienia stabilnoœci genomu nukleomorfu. Materia³ genetyczny nukleomorfów wykazuje wiele cech genomów znajduj¹cych siê pod siln¹ presj¹ selekcyjn¹ na redukcjê ich wielkoœci. Wœród cech tych nale¿y wymieniæ podwy¿szon¹ zawartoœæ par AT (oko³o 75%) i bardzo wysok¹ gêstoœæ ko- dowania. Czêœæ genów nukleomorfów transkrybowana jest w postaci policistrono- wych jednostkek transkrypcyjnych, a niektóre s¹ nawet genami zachodz¹cymi. Po- nadto ekstremalna redukcja genomów nukleomorfów poci¹ga za sob¹ skrajne skró- cenie sekwencji koduj¹cych bia³ka. Podobnie jak u mikrosporidii E. cuniculi (zob. podrozdz. 2.1.1), niemal wszystkie kodowane polipeptydy s¹ krótsze od ich homo- logów u innych organizmów. Wci¹¿ nie jest znana funkcja wielu genów (prawie po³owy w nukleomorfie G. theta), a wiêkszoœæ genów o znanych funkcjach zwi¹zana jest z podtrzymywaniem aktywnoœci nukleomorfu i rybosomów, znajduj¹cych siê w kompartymencie periplastydowym. Nukleomorfy kryptofitów i chlorarachniofitów charakteryzuj¹ siê podobn¹ za- wartoœci¹ procentow¹ genów uczestnicz¹cych w ró¿nych procesach, takich jak: transkrypcja, translacja czy biogeneza plastydu. Wyj¹tek stanowi¹ geny zaanga- ¿owane w metabolizm RNA, których jest zdecydowanie wiêcej u B. natans ni¿ u G. theta i H. andersenii, co ma zwi¹zek z odmienn¹ ewolucj¹ intronów w nukleo- morfach chlorararchinofitów i kryptofitów. Nukleomorf B. natans zawiera 852 intro- ny (œrednio 3,1 intronu na gen), które uleg³y miniaturyzacji do d³ugoœci 18-21 nt. Jest interesuj¹ce, ¿e introny te s¹ bardzo konserwatywne, poniewa¿ porównanie ich rozmieszczenia z nukleomorfem innego chlorarachniofita – Gymnochlora stellata wskazuje na zachowanie oko³o 94% z nich. Introny w nukleomorfach chlorarachnofi- tów s¹ bardzo stabilne i ulegaj¹ utracie wolniej ni¿ introny zielenic czy roœlin wy¿- szych. W przeciwieñstwie do nukleomorfów B. natans i G. stellata, nukleomorf kryp- tofita G. theta zachowa³ zaledwie 17 intronów, podczas gdy nukleomorf H. andersenii

BIOTECHNOLOGIA 4 (91) 91-130 2010 113 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ utraci³ ca³kowicie introny razem z maszyneri¹ splicingow¹. Dane te wskazuj¹ na ist- nienie dwóch strategii ewolucyjnych: pierwsza z nich polega na zachowywaniu in- tronów z jednoczesn¹ ich miniaturyzacj¹ (chlorarachniofity), natomiast druga na – ich ca³kowitej eliminacji (kryptofity). Nukleomorfy kryptofitów koduj¹ 30, natomiast chlorarachniofitów 17 bia³ek, które s¹ importowane do ich plastydów. Bia³ka te syntetyzowane s¹ w komparty- mencie periplastydowym, a nastêpnie przechodz¹ przez dwie b³ony w³aœciwego pla- stydu do stromy. Jest niezwykle interesujace, ¿e nukleomorfy s¹ utrzymywane tylko dla ekspresji zaledwie od kilkunastu do kilkudziesiêciu bia³ek plastydowych, czyli jeszcze mniej ni¿ w przypadku genomów plastydowych (99). W innych typach pla- stydów wtórnych (np. u stramenopili; zob. podrozdz. 2.2.2.), j¹dro endosymbionta zosta³o ca³kowicie utracone (95,96). Byæ mo¿e utrzymywanie nukleomorfów wynika z trudnoœci w transferze ich genów plastydowych do j¹dra gospodarza (42). Nukleomorfy s¹ niezwykle interesuj¹cymi przyk³adami miniaturyzacji j¹der ko- mórkowych (genomy typu bonsai), a ich dok³adne poznanie ma fundamentalne zna- czenie dla zrozumienia zjawiska endosymbiozy (42). Ze wzglêdu na swoj¹ prost¹ or- ganizacjê, nukleomorfy mog¹ byæ tak¿e pomocne w zrozumieniu bardziej z³o¿o- nych procesów zachodz¹cych w j¹drze komórkowym, wci¹¿ bowiem s¹ one funkcjo- nalnym, choæ silnie zredukowanym j¹drem, które utrzymuje kontakt z cytoplazm¹ i plastydem swojej dawnej komórki, jak i z komórk¹ oraz j¹drem nowego gospo- darza (42).

2.4. Wysoko uorganizowane protisty mog¹ce s³u¿yæ jako modele dla organi- zmów wielokomórkowych

Projekty sekwencjonowania genomów protistów o z³o¿onej budowie i zaawan- sowanych procesach komórkowych maj¹ na celu opracowanie systemów modelo- wych, s³u¿¹cych do zrozumienia zjawisk zachodz¹cych u znacznie bardziej skompli- kowanych organizmów wielokomórkowych. Z tego powodu zsekwencjonowano na- stêpuj¹ce genomy: 1) orzêsków Paramecium tetraurelia (pantofelek), 2) Tetrahymena thermophila, 3) ameby Dictyostelium discoideum oraz 4) choanoflagellata Monosiga brevicollis. Ich genomy koduj¹ wiele genów obecnych równie¿ u wielokomórkowców. U orzês- ków, podobnie jak u zwierz¹t, funkcje somatyczne i rozrodcze s¹ rozdzielone i re- alizowane przez dwa ró¿ne j¹dra: makronukleus i mikronukleus. D. discoideum wy- kszta³ci³, niezale¿nie od roœlin i zwierz¹t, formy wielokomórkowe bêd¹ce wynikiem specyficznych interakcji miêdzykomórkowych. Z kolei, M. brevicollis nale¿y do tej sa- mej linii filogenetycznej co zwierzêta.

114 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

2.4.1. Bogate w geny genomy orzêsków: Paramecium tetraurelia i Tetrahymena thermophila

Genom orzêsków jest szczególnie interesuj¹cy, poniewa¿ jest on z³o¿ony z dwóch j¹der: diploidalnego mikronukleusa – zaanga¿owanego w rozmna¿anie p³ciowe oraz poliploidalnego makronukleusa – pe³ni¹cego funkcje somatyczne (43,109,110). Ma- kronukleus powstaje z mikronukleusa w wyniku skomplikowanych procesów amplifi- kacji i delecji ró¿nych fragmentów DNA (m.in. sekwencji powtórzonych i transpozo- nów) oraz dodawania telomerów. Analizy genomowe Tetrahymena wskazuj¹, ¿e wyci- nanie materia³u genetycznego s³u¿y do pozbycia siê obcego DNA z genomu. Z powodu ma³ej iloœci DNA powtórzonego, makronukleus jest ³atwiejszy w sk³adaniu zsekwen- cjonowanych fragmentów ni¿ mikronukleus, dlatego dotychczas tylko jego sekwencje s¹ znane. Opublikowano kompletne sekwencje dwóch makronukleusów: P. tetraurelia (109) i T. thermophila (110) (zob. tak¿e tab. 2). U Paramecium i Tetrahymena zidentyfikowano bardzo du¿¹ liczbê genów jak na organizmy jednokomórkowe: ponad 27 tysiêcy – u T. thermophila i prawie 40 tysiê- cy–uP. tetraurelia, co znacznie przewy¿sza liczbê genów znalezionych u wielu wy¿szych eukariotów. Tak du¿a liczba genów jest u Tetrahymena wynikiem licznych duplikacji, które zasz³y w linii prowadz¹cej do tego gatunku, natomiast u Paramecium – konsekwencj¹ przynajmniej trzech kolejnych duplikacji ca³ego genomu (WGD, ang. Whole-Genome Duplication). Cech¹ charakterystyczn¹ tych ca³oœciowych duplikacji ge- nomu, która jest rzadko spotykana w zduplikowanych genomach innych eukariotów (jak dro¿d¿e, ryby, roœliny wy¿sze), jest du¿a konserwatywnoœæ w u³o¿eniu genów w zduplikowanych chromosomach. Inn¹ interesuj¹c¹ cech¹ genomów orzêsków jest du¿a liczba zachowanych zduplikowanych genów. Tylko 32% z nich utraci³o swojego paraloga. Stwierdzono, ¿e geny koduj¹ce bia³ka zaanga¿owane w te same szlaki me- taboliczne lub tworz¹ce te same kompleksy wykazuj¹ takie same regu³y zanikania. Wynika to z koniecznoœci zachowania w³aœciwych stosunków stechiometrycznych pomiêdzy oddzia³uj¹cych bia³kami. Wykazano równie¿, ¿e geny koduj¹ce: 1) bia³ka rybosomów, 2) komponenty cytoszkieletu, 3) histony, 4) czynnik elongacji translacji i 5) dehydrogenazê bursztynianow¹, które charakteryzuj¹ siê wysokim stopniem ekspresji, by³y preferencyjnie zachowywane po kolejnych rundach duplikacji. Wiele z nich posiada wszystkie z 8 mo¿liwych kopii. Ostatnia ca³oœciowa duplikacja genomu P. tetraurelia pokrywa siê w czasie z eksplozj¹ specjacji w obrêbie rodzaju Paramecium, która doprowadzi³a do wyodrêbnienia siê piêtnastu gatunków siostrzanych. W przy- padku T. thermophila duplikacjom podlega³y przede wszystkim geny zwi¹zane z re- agowaniem i odpowiedzi¹ na czynniki œrodowiska. Kodowane przez nie bia³ka od- powiadaj¹ za: 1) przekazywanie sygna³ów (np. kinazy), 2) wykorzystanie ró¿nych za- sobów œrodowiska (np. proteazy oraz transportery: ABC, jonowe VIC i ATPazy typu P), 3) zmianê kszta³tu i ruch komórki (np. kinezyny i dyneiny) oraz 4) wewn¹trzkomórko- wy transport b³onowy (np. bia³ka Rab). Jest interesuj¹ce, ¿e u T. thermophila jako ko- don stop wykorzystywany jest jedynie kodon UGA, który dodatkowo, w niektórych

BIOTECHNOLOGIA 4 (91) 91-130 2010 115 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ genach, mo¿e s³u¿yæ do kodowania selenocysteiny, co czyni ten gatunek pierwszym znanym, u którego wszystkie 64 kodony mog¹ byæ t³umaczone na aminokwasy. Dok³adniejsze przeszukiwania genomów orzêsków zaowocowa³y znalezieniem szes- nastu genów pochodz¹cych od glonów (111), co zgodnie z hipotez¹ chromalweolata, mia³oby œwiadczyæ o wystêpowaniu plastydu u przodka Alveolata, do których nale¿¹ orzêski (33,84,85). Jednak obecnoœæ tych genów mo¿na równie dobrze wyt³umaczyæ po- ziomymi transferami genów od glonów poch³anianych przez orzêski jako pokarm (112). Orzêski, a szczególnie Tetrahymena, s¹ ³atwe w hodowli i charakteryzuj¹ siê obecnoœci¹ wielu procesów komórkowych, które zachodz¹ równie¿ u eukariotów wy¿- szych (w³¹czajac cz³owieka), a s¹ nieobecne u innych jednokomórkowych organi- zmów modelowych, takich jak dro¿d¿e: S. cerevisiae i Schizosaccharomyces pombe.To czyni je idealnym modelem do ró¿norodnych analiz biologicznych, biomedycznych i biotechnologicznych.

2.4.2. Genom ameby Dictyostelium discoideum o ciekawych zachowaniach spo³ecznych

D. discoideum jest ameb¹ nale¿¹c¹ do œluzoroœli, która wykazuje interesuj¹ce za- chowania socjalne, polegaj¹ce na wyj¹tkowych zdolnoœciach do organizowania siê pojedynczych komórek i tworzenia form wielokomórkowych z charakterystycznymi cia³ami owocowymi zbudowanymi z trzonków, które zakoñczone s¹ skupieniami za- rodników (33,113). Organizacyjnie zajmuje ona stanowisko poœrednie pomiêdzy jedno- i wielokomórkowymi eukariotami. Z tego powodu Dictyostelium jest bardzo dobrym organizmem modelowym do badania zjawisk zwi¹zanych z: 1) kszta³towa- niem siê wielokomórkowoœci, 2) ruchem komórek, 3) przekazywaniem sygna³ów, 4) interakcjami miêdzykomórkowymi i 5) adhezj¹ komórkow¹. Komórki tej ameby s¹ równie¿ funkcjonalnym odpowiednikiem makrofagów ssaków i mog¹ s³u¿yæ za model do ich badania Genom D. discoideum (113) (zob. tak¿e tab. 2) jest bogaty w: 1) pary AT (77%), 2) transpozony wystêpuj¹ce w klastrach i 3) ró¿ne sekwencje powtórzone, z których jedna tworzy centromery. Koduje on a¿ 390 genów tRNA, które zorganizowane s¹ w pary. Z kolei, geny rRNA wystêpuj¹ na elemencie pozachromosomowym o budowie palindromowej i wielkoœci 88 kb. Czêœciowe kopie tych genów wystêpuj¹ na koñcach chromosomów i tworz¹ nietypowe telomery. Genom Dictyostelium charakteryzuje siê du¿¹ gêstoœci¹ kodowania (62%) oraz du¿¹ liczb¹ genów, która porównywalna jest z liczb¹ genów u organizmów wielokomórkowych. Jednak w dok³adniejszych anali- zach wykazano, ¿e 20% genów zosta³o niedawno zduplikowanych. Introny i sekwencje miêdzygenowe s¹ krótkie. Œrednia d³ugoœæ intronu wynosi 146 bp, podczas gdy u cz³owieka – 3365 bp. W 34% bia³ek wystêpuj¹ d³ugie ci¹gi powtarzaj¹cych siê ami- nokwasów, mog¹ce s³u¿yæ jako model do badania np. chorób neurodegeneracyjnych u cz³owieka, które zwi¹zane s¹ z ekspansj¹ takich powtórzeñ. Za pomoc¹ D. discoideum

116 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów mog¹ byæ badane równie¿ inne choroby cz³owieka, poniewa¿ w jego genomie zidenty- fikowano 64 geny homologiczne do genów cz³owieka zwi¹zanych z ró¿nymi choroba- mi. Genów tych jest wiêcej ni¿ u innego gatunku modelowego – dro¿d¿y S. cerevisiae. Genom Dictyostelium koduje szczególnie du¿o syntaz poliketydowych, odpowie- dzialnych za produkcjê antybiotyków i metabolitów wtórnych, które eksportowane s¹ na zewn¹trz komórki przez liczne transportery ABC, pe³ni¹ce równie¿ funkcje detok- sykacyjne. W wykorzystaniu zasobów œrodowiska du¿¹ rolê odgrywaj¹ tak¿e enzymy zwi¹zane z degradacj¹ celulozy. Najciekawsze s¹ jednak bia³ka odpowiedzialne za aso- cjacje komórek D. discoideum, które tworz¹ formy wielokomórkowe, wykszta³cone nie- zale¿nie od roœlin i zwierz¹t. Wiele z tych bia³ek – charakterystycznych tylko dla zwierz¹t – zwi¹zanych jest z adhezj¹ komórek oraz przekazywaniem sygna³ów opar- tych na: 1) bia³kach G, 2) domenie SH2, 3) transporterach ABC oraz 4) licznie reprezen- towanych kinazach. Dictyostelium zawiera równie¿ du¿y zestaw innych bia³ek „zwierzê- cych” zwi¹zanych z cytoszkieletem oraz bia³ka „roœlinne” uczestnicz¹ce w odk³adaniu i metabolizowaniu celulozy. Taki hybrydowy proteom D. discoideum wskazuje, ¿e jego przodek, stoj¹cy u podstawy linii filogenetycznych prowadz¹cych do roœlin, zwierz¹t i ameb, wyposa¿ony by³ w zró¿nicowany zestaw genów.

2.4.3. Genom jednokomórkowego choanoflagellata Monosiga brevicollis blisko spokrewnionego ze zwierzêtami

Grup¹ protistów, która jest najbli¿ej spokrewniona ze zwierzêtami s¹ choanofla- gellaty znane równie¿ jako wiciowce ko³nierzykowe. Kompletna sekwencja genomu jednego z nich, M. brevicollis (114) (zob. tak¿e tab. 2), pozwala na zrozumienie, w ja- ki sposób kszta³towa³a siê wielokomórkowoœæ, oraz umo¿liwia wyobra¿enie sobie, jak móg³ wygl¹daæ jednokomórkowy przodek zwierz¹t. Chocia¿ genom Monosiga jest zwarty, to kodowane geny s¹ tylko nieco mniej bo- gate w introny ni¿ geny cz³owieka (odpowiednio 6,6 oraz 7,7 intronów na gen). Jed- nak introny M. brevicollis s¹ znacznie krótsze (œrednia d³ugoœæ – 174 bp) ni¿ intro- ny zwierz¹t i cz³owieka (zob. podrozdz. 2.4.2). Najciekawszym wynikiem analiz ge- nomu Monosiga by³o zidentyfikowanie 78 domen bia³ek, które wystêpuj¹ tylko u Choanoflagellata i Metazoa. Wiele z nich zwi¹zanych jest z przyleganiem komórek (domeny kadheryny, lektyny C, integryny a) i macierz¹ zewn¹trzkomórkow¹ (dome- ny kolagenowe lamininy, ependyminy, reeliny). Wœród tych domen bia³kowych, jest piêæ domen immunoglobulin, du¿o mniej w porównaniu z 150 do 1500 domenami obecnymi u tkankowców. Dane te wskazuj¹ na póŸn¹ ekspansjê rodziny bia³ek im- munoglobulin, ju¿ po dywergencji choanoflagellatów i zwierz¹t. U M. brevicollis szczególnie liczne s¹ domeny szlaku fosfotyrozyny, a zw³aszcza kinaz tyrozynowych (oko³o 120), które s¹ typowe dla zwierz¹t. Dane te œwiadcz¹ o ich wczesnym powstaniu, jeszcze przed rozdzieleniem siê linii wiciowców ko³nie- rzykowych i zwierz¹t. Nie znaleziono jednak sk³adników innych – typowo zwierzê-

BIOTECHNOLOGIA 4 (91) 91-130 2010 117 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ cych – szlaków przekszta³cania sygna³ów wewn¹trz komórki oraz wielu czynników transkrypcyjnych zwi¹zanych z rozwojem. Odkryto jedynie pewne komponenty szla- ków Notch i hedgehog oraz reprezentantów rodzin czynników transkrypcyjnych: p53, Myc i Sox/TCF. Na podstawie analiz genomu Monosiga wskazuje siê, ¿e przodek zwierz¹t posiada³ ju¿ kilka istotnych strukturalnych i funkcjonalnych preadaptacji, potrzebnych do ró¿- nicowania siê komórek i rozwiniêcia zaawansowanych relacji pomiêdzy nimi. Jednak bia³ka o architekturze typowej dla tkankowców, które powsta³y w wyniku tasowania eksonów, pojawi³y siê póŸniej, po rozdzieleniu siê linii choanoflagellatów i zwierz¹t. Niedawno w genomie M. brevicollis znaleziono ponad 100 genów pochodz¹cych od glonów (115). Czy to oznacza, ¿e jednokomórkowi przodkowie zwierz¹t posia- dali plastyd? Nie mo¿emy obecnie wykluczyæ takiej mo¿liwoœci, ale nale¿y pamiêtaæ, ¿e geny te mog³y zostaæ nabyte na drodze wielokrotnych poziomych transferów, którym nie musia³y towarzyszyæ stabilne endosymbiozy plastydowe (114).

3. Rozpoczête i przysz³e projekty sekwencjonowania genomów protistów

Wed³ug bazy GOLD (6), na pocz¹tku 2010 r., wœród 1248 kontynuowanych i nie opublikowanych projektów sekwencjonowania genomów eukariotów, 217 projektów by³o poœwiêconych protistom. Tak jak przedstawiono to na rysunku, protisty te repre- zentuj¹ wszystkie g³ówne linie filogenetyczne eukariotów, chocia¿ reprezentacja ta nie jest jednakowa. Dominuj¹ projekty poœwiêcone alweolatom (w szczególnoœci api- kompleksom paso¿ytniczym) oraz zielenicom i stramenopilom z grupy Ochrophyta, które maj¹ znaczenie ekologiczne. Najs³abiej reprezentowane s¹ Rhizaria i Hacrobia, obejmuj¹ce gatunki s³abo poznane zarówno pod wzglêdem taksonomicznym, jak i molekularnym. Jednak prawie 40% wszystkich projektów poœwiêconych protistom, to projekty EST, a nie genomowe. Dla porównania, projekty EST nie protistów stanowi¹ oko³o 25%. Projekty EST pozwol¹ niew¹tpliwie na szybkie i tanie uzyskanie potencjal- nych sekwencji koduj¹cych bia³ka, ale nie ods³oni¹ ca³ej struktury genomów analizo- wanych protistów. Na stronie internetowej bazy GOLD (http://www.genomesonline.org) mo¿na znaleŸæ ³¹cza do instytucji sekwencjonuj¹cych okreœlone genomy oraz stron poœwiêconych poszczególnym projektom, na których zgromadzono informacje do- tycz¹ce sekwencjonowanych organizmów, stanu poznania ich genomów oraz uzasad- nienia realizowanych projektów. Poni¿ej charakteryzujemy niektóre z tych projektów.

3.1. Genomy paso¿ytów

Najwiêcej nowych projektów genomowych dotyczy paso¿ytów cz³owieka i ssa- ków, w tym wielu gatunków udomowionych. Protisty te nale¿¹ do: 1) Apicomplexa (rodzaje: Babesia, Crytposporidium, Eimeria, Neospora caninum, Plasmodium oraz

118 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

Toxoplasma gondii), 2) Amoebozoa (Acanthamoeba castellanii), 3) Excavata (rodzaje: Leishmania, Trypanosoma oraz Trichomonas vaginalis) i 4) Stramenopila (Blastocystis hominis). Pomimo poznania genomów niektórych z tych paso¿ytów, w wielu przy- padkach, sekwencjonowane s¹ nadal genomy spokrewnionych z nimi gatunków lub nale¿¹cych do nich szczepów. Porównania zsekwencjonowanych genomów pozwol¹ znaleŸæ subtelne ró¿nice na poziomie genomowym, decyduj¹ce o ró¿nej inwazyjno- œci i patogennoœci poszczególnych gatunków i szczepów. Ze wzglêdu na problemy z hodowaniem protistów paso¿ytniczych, do sekwencjonowania wybrane s¹ tak¿e gatunki nieinwazyjne, blisko spokrewnione z formami paso¿ytniczymi, lub gatunki paso¿ytuj¹ce na organizmach ³atwych w hodowli (np. ameby: Entamoeba dispar, E. invadens, E. moshkovskii, E. terrapinae czy ekskawat Naegleria gruberi). Du¿e znaczenie ma równie¿ poznanie genomów gatunków paso¿ytuj¹cych na in- nych zwierzêtach ni¿ ssaki, które odgrywaj¹ wa¿n¹ rolê w gospodarce, rolnictwie, hodowli i ekosystemach naturalnych. Do takich paso¿ytów nale¿¹: 1) skoczkowiec Batrachochytrium dendrobatidis (powoduj¹cy œmiertelne uszkodzenia w uk³adzie od- dechowym i nerwowym p³azów), 2) orzêsek Ichthyophthirius multifiliis (odpowiedzialny za bardzo zaraŸliw¹ i czêst¹ chorobê ryb zwan¹ ichtioftirioz¹), 3) alweolat Perkinsus marinus (powoduj¹cy du¿e spadki liczebnoœci populacji ostryg) oraz 4) ekskawaty Spironucleus vortens (zasiedlaj¹cy przewód pokarmowy ryb) i 5) Crithidia deanei (pa- so¿ytuj¹ca na owadach, w tym na pszczo³ach). Istotne jest poznanie genomów mi- krosporidii, infekuj¹cych owady, skorupiaki i ryby. Szczególnie wa¿ne s¹ mikrospo- ridie z rodzaju Nosema, które powoduj¹ ogromne straty w hodowlach jedwabników i pszczó³. Kilka projektów poœwiêconych jest paso¿ytom roœlin nale¿¹cym do Oomycetes (Aphanomyces, Peronospora, Phytophthora), które wyrz¹dzaj¹ powa¿ne szkody w rol- nictwie i ekosystemach naturalnych. Dziêki wymienionym projektom bêdzie mo¿liwe odkrycie nowych genów zwi¹- zanych z patogennoœci¹, a tak¿e zrozumienie specyficznych mechanizmów infekcji, co mo¿e przyczyniæ siê do bardziej skutecznego zapobiegania zaka¿eniom wywo- ³ywanym przez te paso¿yty i ich efektywnego zwalczania.

3.2. Genomy gatunków istotnych ekologicznie

Niezwykle istotne s¹ rozpoczête projekty sekwencjonowania genomów gatun- ków o du¿ym znaczeniu ekologicznym, które nale¿¹ do ró¿nych grup glonów, ta- kich jak: 1) bruzdnice (Dinoflagellata), 2) krasnorosty (Rhodophyta), 3) zielenice (Chlorophyta), 4) haptofity (Haptophyta) oraz 5) stramenopile z grupy Ochrophyta (w tym okrzemki). Wiele z tych gatunków jest kosmopolitycznych, a czêœæ nale¿y do pikoplanktonu (116). Nale¿y podkreœliæ ich niezmiernie du¿y udzia³ w produkcji pierwotnej ekosystemów oraz obiegu wêgla (a zw³aszcza wi¹zaniu ditlenku wêgla) (117,118), co ma daleko id¹ce konsekwencje dla klimatu. Wœród glonów tych, szcze- gólne miejsce zajmuj¹ okrzemki, które wi¹¿¹ 20% globalnego wêgla nieorganiczne-

BIOTECHNOLOGIA 4 (91) 91-130 2010 119 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ go, generuj¹c jednoczeœnie 40% wêgla organicznego produkowanego w oceanach (119), co ma podstawowe znaczenie dla funkcjonowania ekosystemów morskich. Na uwagê zas³uguje projekt genomowy poœwiêcony okrzemce Fragilariopsis cylindrus, sta- nowi¹cej podstawê ekosystemów mórz polarnych, gdzie fotosynteza roœlin wy¿- szych jest bardzo ograniczona. Regiony polarne s¹ najbardziej czu³e na zmiany kli- matu i odpowiadaj¹ na to topnieniem lodowców. Celem projektu jest poznanie przystosowañ F. cylindrus do bytowania w niskich temperaturach i jej reakcji na zmiany klimatyczne. Innym istotnym glonem polarnym jest haptofit Phaeocystis antarctica, którego genom jest równie¿ sekwencjonowany. Oprócz roli w globalnym obiegu wêgla, uczestniczy on równie¿ w cyklu siarki, emituj¹c 3-dimetylosulfonio- propionian (DMSP), który jest prekursorem dimetylosiarczku (DMS) (120,121). DMS jest bardzo lotny, a jego aerozole wp³ywaj¹ na formowanie siê chmur i, w konse- kwencji, na klimat. Poznanie szlaków metabolicznych zaanga¿owanych w tworzenie DMSP i DMS mo¿e pomóc przewidywaæ stopieñ zaawansowania procesu globalnego ocieplenia. Niektóre gatunki glonów intensywnie siê dziel¹ tworz¹c tzw. zakwity, co nie jest obojêtne dla ekosystemów naturalnych, powoduj¹c ich zubo¿enie przez: zmniejszenie natê¿enia œwiat³a, spadek poziomu tlenu i produkcjê toksyn (122). Z gatunków two- rz¹cych zakwity, obecnie sekwencjonowane s¹ genomy: okrzemki Pseudo-nitzschia multiseries oraz bruzdnic, takich jak: Karenia brevis i Alexandrium tamarense. Produkuj¹ one neurotoksyny wywo³uj¹ce choroby, a nawet przypadki œmiertelne u cz³owieka. Po- nadto s¹ one odpowiedzialne za masowe giniêcie zwierz¹t morskich, w tym gatunków hodowlanych, np. ma³¿y. W przypadku glonu Aureococcus anophagefferens (nale¿¹cego do Ochrophyta) zakwity równie¿ doprowadzaj¹ do masowego obumierania planktonu, zostery morskiej i ma³¿y, co powoduje du¿e straty w gospodarce morskiej. Aby zrozumieæ i kontrolowaæ ca³e cykle troficzne, zapocz¹tkowano projekty ge- nomowe heterotroficznych (Paraphysomonas, Spumella) i miksotroficznych (Ochromonas) stramenopili z grupy Ochrophyta, które od¿ywij¹ siê fitoplanktonem i reguluj¹ jego iloœæ, a, w konsekwencji, wp³ywaj¹ na obieg wêgla w przyrodzie. Genomy haptofi- tów: Emiliania huxleyi i Isochrysis galbana wybrano do sekwencjonowania m.in. z po- wodu ich du¿ego znaczenia jako Ÿród³a pokarmu w akwakulturach: ma³¿y, krewetek i innych morskich organizmów. Zak³ada siê, ¿e wiedza o ich genomach umo¿liwi zwiêkszenie produktywnoœci tych hodowli. Sekwencjonuje siê równie¿ genomy ró¿- nych ekotypów zielenicy Ostreococcus o zró¿nicowanych wymaganiach œrodowisko- wych, np. zwi¹zanych z intensywnoœci¹ œwiat³a. Projekty te maj¹ wyjaœniæ, jakie ce- chy ich ma³ych genomów (zob. podrozdz. 2.2.1) wi¹¿¹ siê z adaptacj¹ do zró¿nico- wanych nisz ekologicznych. Du¿ym problemem ekologicznym pozostaje od wielu lat blakniêcie koralowców (123,124), spowodowane pozbywaniem siê lub obumieraniem bruzdnic symbiotycz- nych z rodzaju Symbiodinium zwanych zooksantellami. Zooksantelle odpowiedzialne s¹ za od¿ywianie polipów i deponowanie wêglanu wapnia. Dlatego spadek ich li- czebnoœci prowadzi do obumierania rafy jako ca³ego ekosystemu. Przypuszcza siê,

120 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

¿e rozpoczête projekty genomowe wyjaœni¹ naturê zwi¹zku symbiotycznego po- miêdzy koralowcami a zooksantellami, a tym samym mechanizmy bledniêcia kora- lowców, co mo¿e pomóc w zapobieganiu tym katastrofalnym dla ekosystemów mor- skich zjawiskom. Celem sekwencjonowania genomów gatunków wa¿nych ekologicznie jest rów- nie¿ znalezienie dobrych markerów do oceny zmian zachodz¹cych w ekosystemach. Ponadto dane te mog¹ pomóc w lepszym poznaniu, a byæ mo¿e nawet w przewidy- waniu i kontrolowaniu, wielu wa¿nych procesów ekologicznych.

3.3. Genomy organizmów modelowych

Czêœæ projektów poœwiêcona jest tzw. organizmom modelowym, s³u¿¹cym do badania ró¿norodnych zjawisk biologicznych na poziomie komórkowym i moleku- larnym. Przyk³adem mog¹ byæ projekty poœwiêcone protistom fotosyntetyzujacym, takim jak: ekskawat Euglena gracilis oraz zielenice: C. reinhardtii i Volvox carteri. Interesuj¹ce bêdzie porównanie genomu C. reinhardtii (zob. podrozdz. 2.3.1) z genomem V. carteri. Pierwszy z tych gatunków jest jednokomórkowy i wytwarza gamety podobne morfologicznie, natomiast drugi tworzy kolonie z komórkami wy- specjalizowanymi do funkcji wegetatywnych i generatywnych, przy czym komórki p³ciowe zró¿nicowane s¹ na nieruchliw¹ komórkê jajow¹ i mobilny plemnik. Pomi- mo tych ró¿nic, oba gatunki rozdzieli³y siê stosunkowo niedawno (oko³o 50 milio- nów lat temu) i wykazuj¹ du¿e podobieñstwo sekwencji koduj¹cych. Dlatego istotne bêdzie wykrycie zmian genomowych, które doprowadzi³y do tak du¿ego zró¿nico- wania fenotypowego oraz specjalizacji komórkowej i p³ciowej pomiêdzy C. reinhardtii i carteri. Chocia¿ poznano ju¿ sekwencjê genomu makronukleusa u orzêska T. thermophila (zob. podrozdz. 2.4.1), to jednak jest on sekwencjonowany w jego ró¿nych szcze- pach. Pozwoli to na poznanie zró¿nicowania molekularnego makronukleusa oraz cech charakterystycznych dla poszczególnych szczepów, hodowanych w ró¿nych warunkach m.in. stresowych. Uzyskane dziêki temu informacje bêd¹ pomocne w licznych zastosowaniach ekotoksykologicznych tego orzêska. Powa¿nym wyzwa- niem jest zsekwencjonowanie mikronukleusa ze wzglêdu na du¿¹ zawartoœæ w nim sekwencji powtórzonych. Jednak poznanie jego sekwencji da pe³ny obraz struktury i funkcji ca³ego genomu j¹drowego u orzêsków. Zsekwencjonowanie genomów dwóch przedstawicieli œluzoroœli: Physarum polycephalum i Dictyostelium purpureum pomo¿e z pewnoœci¹ poznaæ pod³o¿e gene- tyczne wielu interesuj¹cych procesów komórkowych. P. polycephalum jest organi- zmem wzorcowym w badaniach ruchu komórki, natomiast D. purpureum, podobnie jak D. discoideum o poznanym ju¿ genomie (patrz podrozdz. 2.4.2), s³u¿y jako model do badania interakcji miêdzykomórkowych.

BIOTECHNOLOGIA 4 (91) 91-130 2010 121 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³

3.4. Genomy u¿yteczne w biotechnologii

Wiele genomów sekwencjonowanych jest ze wzglêdu na ich potencjalne wyko- rzystanie do celów biotechnologicznych. Zielenica Botryococcus braunii wytwarza wêglowodory (a¿ do 85% suchej masy), które mog¹ byæ przekszta³cane na biopali- wo (125,126). Niestety, dotychczas bardzo niewiele wiadomo o genach (i kodowa- nych przez nie enzymach), które zwi¹zane s¹ z syntez¹ tych zwi¹zków. Na uwagê zas³uguje równie¿ skoczkowiec Piromyces sp. E2 (grupa Chytridiomycota) (33). By- tuje on w uk³adzie pokarmowym ssaków roœlino¿ernych rozk³adaj¹c pokarm ro- œlinny, a jego mitochondria uleg³y przekszta³coniu w hydrogenosomy produkuj¹ce wodór i ATP (zob. podrozdz. 2.1.1). Niektóre geny tego gatunku s¹ ju¿ wykorzy- stywane w biotechnologii poprzez ich ekspresjonowanie w komórkach dro¿d¿y S. cerevisiae w celu produkcji etanolu (127,128). Poznanie genomu Piromyces po- zwoli tak¿e na jego szersze wykorzystanie do produkcji wodoru m.in. jako Ÿród³a energii. Wspomniano ju¿, ¿e sekwencjonowane s¹ równie¿ genomy ró¿nych szczepów zielenicy C. reinhardtii (jeden szczep zosta³ ju¿ zsekwencjonowany, zob. podrozdz. 2.3.1). Planuje siê, aby gatunek ten wykorzystywaæ zarówno w oczysz- czaniu gleby z metali ciê¿kich, jak i do wytwarzania wodoru, stosowanego do pro- dukcji biopaliw (129). Genom krasnorostu Chondrus crispus (chrz¹stnica kêdzierzawa lub mech irlandz- ki) jest sekwencjonowany ze wzglêdu na jego du¿e znaczenie w produkcji karagenu zawieraj¹cego polisacharydy oraz niewielkie iloœci jodu i bromu (130,131). Zwi¹zek ten stosowany jest w wielu ga³êziach przemys³u (np. piwowarskiego, spo¿ywczego i kosmetycznego) oraz w lecznictwie do wytwarzania galaret i ¿eli. Ponadto odzna- cza siê on du¿¹ aktywnoœci¹ biologiczn¹ bêd¹c m.in. immunostymulatorem. Du¿e nadzieje wi¹¿e siê równie¿ z poznaniem genomu innego krasnorostu – Porphyra purpurea. Planuje siê zwiêkszenie jego produkcji, poniewa¿ jest on powszechnie wy- korzystywany w krajach azjatyckich w celach konsumpcyjnych, np. do zawijania sus- hi (132). Interesuj¹ce bêdzie tak¿e poznanie zestawu genów wspomnianego ju¿ ter- mofilnego i kwasolubnego krasnorostu G. sulphuraria (zob. podrozdz. 2.3.2), które umo¿liwiaj¹ jemu wzrost na ponad 50 ró¿nych Ÿród³ach wêgla, w tym na rzadkich wêglowodanach i alkoholach cukrowych (133). Geny te mog¹ znaleŸæ zastosowanie w ró¿nych dzia³ach biotechnologii. Nale¿y jeszcze wspomnieæ o znaczeniu biotechnologicznym orzêska T. thermophila. Poznanie genomu jego wielu szczepów bêdzie bardzo pomocne w konstrukcji linii komórkowych ekspresjonuj¹cych ró¿ne bia³ka, a szczególnie celulazy (konieczne w produkcji biopaliw) oraz bia³ka chelatuj¹ce metale (istotne w biorekultywacji œcie- ków przemys³owych ska¿onych toksycznymi metalami ciê¿kimi).

122 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

3.5. Genomy wa¿ne ewolucyjnie

Istotny – z punktu widzenia ewolucyjnego – jest projekt dotycz¹cy powstania wielokomórkowoœci u zwierz¹t (OMP, ang. Origins of Multicellularity Project) (134). Ce- lem tego przedsiêwziêcia jest wyjaœnienie zjawiska wielokomórkowoœci w swietle ge- nomów jednokomórkowych protistów, które s¹ blisko spokrewnione z organizmami tkankowymi. Sekwencjonowaniu poddano w zwi¹zku z tym genomy gatunków na- le¿¹cych do: Apusozoa, Mesomycetozoa, Nucleariida i Choanoflagellatea (dotychczas znany jest kompletny genom tylko jednego gatunku nale¿¹cego do Choanoflagellatea, zob. podrozdz. 2.4.3). Poznanie genomu Amastigomonas sp., z grupy Apusoza, pomo¿e rozwi¹zaæ niejasne zwi¹zki filogenetyczne tej grupy z innymi eukariotami (19,135-137). Interesuj¹ce wnioski ewolucyjne dotycz¹ce ewolucji roœlin wy¿szych mog¹ zostaæ sformu³owane podczas analizy genomu Chara vulgaris nale¿¹cej do ramienic – gru- py glonów najbli¿ej spokrewnionej z roœlinami l¹dowymi (138). Planuje siê poznanie genomów j¹drowych kryptofitów (np. Guillardia theta) i chlorarachniofitów (np. Bigelowiella natans), które naby³y plastydy na drodze wtórnej endosymbiozy odpowiednio od kra- snorostów i zielenic (42,95,96). Genomy nukleomorfów (zredukowane j¹dra eukario- tycznych dawców plastydów) zosta³y ju¿ poznane (zob. podrozdz. 2.3.3), a zsekwen- cjonowanie genomów j¹drowych tych glonów, razem z genomami przedstawicieli in- nych grup zawieraj¹cych plastydy z³o¿one (np. haptofity i bruzdnice), da pe³niejszy obraz zjawisk zachodz¹cych w genomach podczas wtórnych endosymbioz (np. trans- fer genów z genomów endosymbionta do genomu j¹drowego gospodarza) (36,39, 139,140). Dostêpnoœæ kompletnych sekwencji genomów kryptofitów, a tak¿e hapto- fitów, dostarczy du¿ej liczby sekwencji koduj¹cych, niezbêdnych do przeprowadze- nia rzetelnych analiz filogenetycznych maj¹cych na celu wyjaœnienie wci¹¿ niejasnych powi¹zañ Hacrobia z pozosta³ymi supergrupami eukariotów (22,24-28). Posiadanie kompletnych sekwencji genomów wielu gatunków, reprezentuj¹cych ró¿ne linie ewolucyjne w obrêbie domeny Eukaryota, umo¿liwi tworzenie drzew fi- logenetycznych na bardzo du¿ych zbiorach sekwencji, dziêki czemu uzyskiwane wy- niki bêd¹ bardziej wiarygodne. Dostêpnoœæ tak obszernego Ÿród³a informacji oferu- je wiêkszy wybór sekwencji do analiz filogenetycznych, wœród których znacznie ³atwiej jest znaleŸæ sekwencje konserwatywne i ortologiczne, które s¹ najbardziej adekwatne do tego typu badañ. Kompletne sekwencje wielu genomów umo¿liwi¹ równie¿ odrzucenie genów, które podlega³y duplikacjom lub poziomemu transfero- wi i zaburzaj¹ analizy filogenetyczne. Jedynie zakrojone na szerok¹ skalê projekty sekwencjonowania nowych genomów, w po³¹czeniu z nowymi metodami filogeno- micznymi (141-143), pozwol¹ na dok³adniejsze wyjaœnienie zwi¹zków filogenetycz- nych pomiêdzy ró¿nymi liniami ewolucyjnymi w obrêbie Eukaryota. Konieczne jest wobec tego poznanie sekwencji genomów g³ównych organizmów, tj. reprezentan- tów wszystkich wa¿niejszych linii filogenetycznych. Dobrym przyk³adem na znaczenie projektów genomowych w odtwarzaniu praw- dziwych powi¹zañ filogenetycznych jest mikrosporidium E. cuniculi: jednokomórkowy, ob-

BIOTECHNOLOGIA 4 (91) 91-130 2010 123 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ ligatoryjny paso¿yt wewn¹trzkomórkowy ssaków, w tym cz³owieka (zob. podrozdz. 2.1.1). Pocz¹tkowo uwa¿ano, ¿e gatunek ten, podobnie jak inne mikrosporidie, nigdy nie posiada³ mitochondrium (144). Na wczesnych drzewach filogenetycznych, opar- tych g³ównie na ma³ej i du¿ej podjednostce j¹drowego rDNA, paso¿yty te grupowa³y siê z innymi – przypuszczalnie równie¿ niemitochondrialnymi – eukariotami zali- czanymi obecnie do Excavata i Amoebozoa (144-147). Sta³o siê to podstaw¹ do wyod- rêbnienia nadkrólestwa Archezoa (144). Zak³adano, ¿e eukarioty te oddzieli³y siê jesz- cze przed nabyciem mitochondriów i reprezentuj¹ fazê przedmitochondrialn¹ w ewo- lucji Eukaryota. Do ostatecznego odrzucenia tej hipotezy przyczyni³y siê filogenezy oparte na danych pochodz¹cych z kompletnie zsekwencjonowanego genomu E. cuniculi (44,148). Dziêki kompletnej sekwencji jego genomu wybrano prawie 100 genów o naj- wolniejszym tempie dywergencji i uzyskano filogenezy jednoznacznie grupuj¹ce te geny z genami grzybów, a nie z genami ekskawatów czy ameb. Wczeœniejsze analizy filogenetyczne, na których mikrosporidie odga³êzia³y siê u podstawy drzewa Eukaryota, konstruowano w oparciu na szybciej ewoluuj¹cych sekwencjach, które s¹ szczególnie podatne na tzw. efekt przyci¹gania d³ugich ga³êzi i daj¹ fa³szywy obraz zwi¹zków filo- genetycznych (149-151). Ponadto u wszystkich przedstawicieli Archezoa, w³¹czaj¹c Microsporidia, odkryto zmodyfikowane mitochondria w postaci mitosomów i hydro- genosomów (zob. podrozdz. 2.1.1). Na podstawie tych danych jasno pokazano, ¿e przodek wszystkich eukariotów posiada³ mitochondrium (152,153).

3.6. Niezwykle du¿e genomy bruzdnic i ameb

Sekwencjonowanie genomów niektórych protistów jest du¿ym wyzwaniem ze wzglêdu na ich wielkoœæ. Szczególnie du¿e genomy posiadaj¹ bruzdnice (Dinoflagellata) – jednokomórkowe glony odgrywaj¹ce istotn¹ rolê ekologiczn¹ (tab. 1). Typowy genom bruzdnic jest wiêkszy ni¿ dotychczas zsekwencjonowane genomy eukario- tów (154). Najmniejszy genom Symbiodinium spp. ma wielkoœæ 2,9 Gb, a najwiêkszy Prorocentrum micans – a¿ 244,5 Gb. Problemem jest nie tyle sama wielkoœæ genomu, co du¿a frakcja DNA powtórzonego oraz wysoka liczba (nawet do 5000) zdupliko- wanych genów o bardzo podobnych sekwencjach (155), co utrudnia sk³adanie krót- kich, zsekwencjonowanych fragmentów genomu. Szacowana liczba genów kodu- j¹cych bia³ka w najmniejszym (Symbiodinium spp.) i najwiêkszym (P. micans) genomie bruzdnic wynosi odpowiednio 38,2 i 87,7 tys. (155), czyli wiêcej ni¿ u wysoko uor- ganizowanych organizmów tkankowych. Jednak, bior¹c pod uwagê liczne duplika- cje obserwowane w genomach bruzdnic, mo¿na s¹dziæ, ¿e tak du¿a liczba genów odzwierciedla raczej nadmiar informacji ni¿ funkcjonalne zró¿nicowanie i z³o¿o- noœæ kodowanych proteomów. Poniewa¿ zduplikowane geny s¹ czêsto przekszta³- cane w pseudogeny i ostatecznie tracone, albo te¿ ulegaj¹ dywergencji funkcjonal- nej, utrzymywanie tak du¿ej liczby kopii genów w genomie bruzdnic mo¿e jednak wskazywaæ na pewne ich zwi¹zki z adaptacj¹ do szerokiego zakresu strategii tro-

124 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów ficznych realizowanych w ró¿nych niszach ekologicznych. Dlatego poznanie przy- najmniej czêœci ich genomów mo¿e ods³oniæ nieznane jeszcze zale¿noœci pomiêdzy struktur¹ genomu a zdolnoœciami adaptacyjnymi organizmów. Znan¹ od dawna osobliw¹ cech¹ bruzdnic jest brak nukleosomów i histonów. U protistów tych za kondensacjê DNA odpowiadaj¹ bia³ka HLP (ang. Histone-Like Protein), które pod wzglêdem struktury drugorzêdowej przypominaj¹ bia³ka bakte- ryjne: HLP oraz HU (156-158). Podzia³ j¹dra jest nietypowy, np. nie zanika b³ona j¹drowa, a ich chromosomy s¹ stale skondensowane, nawet w interfazie (159,160). Poznanie genomu bruzdnic mo¿e pomóc w zrozumieniu jak zorganizowana, kopio- wana i odczytywana jest informacja genetyczna u tych organizmów. Jeszcze wiêkszym przedsiêwziêciem mo¿e byæ sekwencjonowanie genomów niektórych ameb (Amoebozoa). Wielkoœci najwiêkszych genomów zosta³y oszaco- wane na: 290 Gb – u Amoeba proteus, 670 Gb – u dubium (= A. dubia) i 1370 Gb – u Chaos chaos (161). Nale¿y jednak do tych szacunków podchodziæ z os- tro¿noœci¹, poniewa¿ by³y one oparte na niezbyt dok³adnych analizach biochemicz- nych iloœci ca³kowitego DNA komórkowego, który najprawdopodobniej zawiera³ znaczne iloœci DNA mitochondrialnego. Inne badania przeprowadzone na A. proteus ró¿ni¹ siê o rz¹d wielkoœci w porównaniu do wczeœniejszych obliczeñ (162). W ba- daniach tych wykazano równie¿, ¿e genom A. proteus sk³ada siê z 500 do 1000 ma³ych chromosomów i najprawdopodobniej jest poliploidalny.

4. Podsumowanie

Protisty stanowi¹ dominuj¹ce i bardzo zró¿nicowane grupy na drzewie ¿ycia eu- kariotów. Poznanie ich genomów jest istotne dla jego kompletnego zrekonstruowa- nia i zrozumienia podstawowych etapów w ewolucji eukariotów, takich jak: 1) po- wstanie j¹dra komórkowego, systemu wewn¹trzb³onowego i cytoszkieletu, 2) naby- cie i ewolucja mitochondriów oraz plastydów, 3) ewolucja p³ciowoœci, 4) powstanie wielokomórkowoœci oraz 5) ewolucja szlaków rozwojowych. Nale¿y tu równie¿ wspomnieæ o bardziej generalnych zagadnieniach, czyli naturze i mechanizmach po- wstawania nowych gatunków oraz przyczynach zdarzeñ makroewolucyjnych, które prowadz¹ do wyodrêbniania siê nowych linii filogenetycznych. Genomy organiz- mów modelowych wzbogac¹ znacznie nasz¹ wiedzê o strukturze i funkcjonowaniu genomów, ekspresji poszczególnych genów oraz wielu innych zjawiskach zacho- dz¹cych na poziomie molekularnym. Szczególnie istotne jest poznanie genomów paso¿ytów tak, aby dok³adnie zrozumieæ mechanizmy ich infekcji, a nastêpnie opra- cowaæ skuteczne sposoby zapobiegania im i leczenia wywo³ywanych chorób. Dziêki poznaniu genomów protistów istotnych ekologicznie lepiej zrozumiemy skompliko- wane procesy zachodz¹ce w ró¿nych ekosystemach. Nowe sekwencje genomów protistów pozwol¹ równie¿ odkryæ nieznane dot¹d bia³ka oraz szlaki i cykle meta- boliczne, które mog¹ w istotny sposób wp³yn¹æ na rozwój biotechnologii. Odczyta-

BIOTECHNOLOGIA 4 (91) 91-130 2010 125 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³ nie sekwencji genomów jest jednak dopiero pocz¹tkiem w zrozumieniu ca³ej z³o- ¿onoœci eukariotów i prze³o¿eniu tej wiedzy na praktyczne zastosowania.

Literatura

1. Fleischmann R. D., Adams M. D., White O., Clayton R. A., Kirkness E. F., Kerlavage A. R., Bult C. J., Tomb J., Dougherty B. A., Merrick J. M., et al., (1995), Science, 269, 496-512. 2. Mackiewicz P., Zakrzewska-Czerwiñska J., Cebrat S., (2005), Biotechnologia, 3, 7-21. 3. Shendure J., Mitra R. D., Varma C., Church G. M., (2004), Nat. Rev. Genet., 5, 335-344. 4. Metzker M. L., (2005), Genome Res., 15, 1767-1776. 5. Metzker M. L., (2010), Nat. Rev. Genet.,11, 31-46. 6. Liolios K., Chen I. M., Mavromatis K., Tavernarakis N., Hugenholtz P., Markowitz V. M., Kyrpides N. C., (2010), Nucleic Acids Res., 38 (Database issue), D346-D354. 7. Goffeau A., Barrell B. G., Bussey H., Davis R. W., Dujon B., Feldmann H., Galibert F., Hoheisel J. D., Jacq C., Johnston M., et al., (1996), Science, 274, 563-567. 8. C. elegans Sequencing Consortium, (1998), Science, 282, 2012-2018. 9. Adams M. D., Celniker S. E., Holt R. A., Evans C. A., Gocayne J. D., Amanatides P. G., Scherer S. E., Li P. W., Hoskins R. A., Galle R. F., et al., (2000), Science, 287, 2185-2195. 10. Arabidopsis Genome Initiative, (2000), Nature, 408, 796-815. 11. Lander E. S., Linton L. M., Birren B., Nusbaum C., Zody M. C., Baldwin J., Devon K., Dewar K., Doyle M., FitzHugh W., et al., (2001), Nature, 409, 860-921. 12. Venter J. C., Adams M. D., Myers E. W., Li P. W., Mural R. J., Sutton G. G., Smith H. O., Yandell M., Evans C. A., Holt R. A., Gocayne J. D., et al., (2001), Science, 291, 1304-1351. 13. Margulis L., Schwartz K. V., (1988), Five Kingdoms. An Illustrated Guide to the Phyla of Life on Earth, W. H. Freeman and Company, New York. 14. Cavalier-Smith T., (1998), Biol. Rev., 73, 203-266. 15. Scamardella J. M., (1999), Inter. Microbiol., 2, 207-221. 16. Cavalier-Smith T., (1981), Biosystems, 14, 461-481. 17. Cavalier-Smith T., (2002), Int. J. Syst. Evol. Microbiol., 52, 297-354. 18. Burki F., Pawlowski J., (2006), Mol. Biol. Evol., 23, 1922-1930. 19. Moreira D., von der Heyden S., Bass D., Lopez-Garcia P., Chao E., Cavalier-Smith T., (2007), Mol. Phylogenet. Evol., 44, 255-266. 20. Patron N. J., Inagaki Y., Keeling P. J., (2007), Curr. Biol., 17, 887-891. 21. Cavalier-Smith T., (2010), Biol. Lett., 6, 342-345. 22. Hackett J. D., Yoon H. S., Li S., Reyes-Prieto A., Rummele S. E., Bhattacharya D., (2007), Mol. Biol. Evol., 24, 1702-1713. 23. Rodriguez-Ezpeleta N., Brinkmann H., Burger G., Roger A. J., Gray M. W., Philippe H., Lang B. F., (2007), Curr. Biol., 17, 1420-1425. 24. Shalchian-Tabrizi K., Minge M. A., Espelund M., Orr R., Ruden T., Jakobsen K. S., Cavalier-Smith T., (2008), PLoS One, 3, e2098. 25. Burki F., Shalchian-Tabrizi K., Pawlowski J., (2008), Biol. Lett., 4, 366-369. 26. Burki F., Inagaki Y., Bråte J., Archibald J. M., Keeling P. J., Cavalier-Smith T., Sakaguchi M., Hashimo- to T., Horak A., Kumar S., et al., (2009), Gen. Biol. Evol., 27, 231-238. 27. Minge M. A., Silberman J. D., Orr R. J., Cavalier-Smith T., Shalchian-Tabrizi K., Burki F., Skjaeveland A., Jakobsen K. S., (2009), Proc. Biol. Sci., 276, 597-604. 28. Okamoto N., Chantangsi C., Horák A., Leander B. S., Keeling P. J., (2009), PLoS One, 4, e7080. 29. Hampl V., Hug L., Leigh J. W., Dacks J. B., Lang B. F., Simpson A. G., Roger A. J., et al., (2009), Proc. Natl. Acad. Sci. USA., 106, 3859-3864. 30. Baldauf S. L., (2003), Science, 300, 1703-1706.

126 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

31. Cavalier-Smith T., (2004), Proc. Biol. Sci., 271, 1251-1262. 32. Simpson A. G., Roger A. J., (2004), Curr. Biol., 14, R693-R696. 33. Adl S. M., Simpson A. G., Farmer M. A., Andersen R. A., Anderson O. R., Barta J. R., Bowser S. S., Bru- gerolle G., Fensome R. A., Fredericq S., et al., (2005), J. Eukaryot. Microbiol., 52, 399-451. 34. Keeling P. J., Burger G., Durnford D. G., Lang B. F., Lee R. W., Pearlman R. E., Roger A. J., Gray M. W., (2005), Trends Ecol. Evol., 20, 670-676. 35. Baldauf S. L., (2008), J. Syst. Evol., 46, 263-273. 36. Timmis J. N., Ayliffe M. A., Huang C. Y., Martin W., (2004), Nat. Rev. Genet., 5, 123-135. 37. Cavalier-Smith T., (2005), Ann. Bot., 95, 147-175. 38. Cavalier-Smith T., (2006), Proc. Biol. Sci., 273, 1943-1952. 39. Keeling P. J., Palmer J. D., (2008), Nat. Rev. Genet., 9, 605-618. 40. Martin W., Koonin E. V., (2006), Nature, 440, 41-45. 41. Body³ A., Mackiewicz P., Stiller J. W., (2009), Bioessays, 31, 1219-1232. 42. Moore C. E., Archibald J. M., (2009), Annu. Rev. Genet., 43, 251-264. 43. McGrath C. L., Zufall R. A.., Katz L. A., (2006), in: Genomics and Evolution of Microbial Life, Eds. Katz L. A., Bhattacharya D., Oxford University Press, New York. 44. Katinka M. D., Duprat S., Cornillot E., Méténier G., Thomarat F., Prensier G., Barbe V., Peyretaillade E., Brottier P., Wincker P., et al., (2001), Nature, 414, 450-453. 45. Carlton J. M., Hirt R. P., Silva J. C., Delcher A. L., Schatz M., Zhao Q., Wortman J. R., Bidwell S. L., Al- smark U. C., Besteiro S., et al., (2007), Science, 315, 207-212. 46. Morrison H. G., McArthur A. G., Gillin F. D., Aley S. B., Adam R. D., Olsen G. J., Best A. A., Cande W. Z., Chen F., Cipriano M. J., et al., (2007), Science, 317, 1921-1926. 47. Franzén O., Jerlström-Hultqvist J., Castro E., Sherwood E., Ankarklev J., Reiner D. S., Palm D., An- dersson J. O., Andersson B., Svärd S. G., (2009), PLoS Pathog., 5, e1000560. 48. Loftus B., Anderson I., Davies R., Alsmark U. C., Samuelson J., Amedeo P., Roncaglia P., Berriman M., Hirt R. P., Mann B. J., et al., (2005), Nature, 433, 865-868. 49. Caler E., Lorenzi H., (2010), in: Anaerobic Parasitic Protozoa: Genomics and Molecular Biology, Eds. Clark C. G., Johnson P. J., Adam R. D., Caister Academic Press Ltd., Norwich, GB. 50. van der Giezen M., (2009), J. Eukaryot. Microbiol., 56, 221-231. 51. Shiflett A. M., Johnson P. J., (2010), Annu. Rev. Microbiol., (w druku). 52. Lau A. O., (2009), Mol. Biochem. Parasitol., 164, 1-8. 53. Templeton T. J., Iyer L. M., Anantharaman V., Enomoto S., Abrahante J. E., Subramanian G. M., Hoffman S. L., Abrahamsen M. S., Aravind L., (2004), Genome Res., 14, 1686-1695. 54. Gardner M. J., Hall N., Fung E., White O., Berriman M., Hyman R. W., Carlton J. M., Pain A., Nelson K. E., Bowman S., et al., (2002), Nature, 419, 498-511. 55. Carlton J. M., Adams J. H., Silva J. C., Bidwell S. L., Lorenzi H., Caler E., Crabtree J., Angiuoli S. V., Merino E. F., Amedeo P., et al., (2008), Nature, 455, 757-763. 56. Pain A., Böhme U., Berry A. E., Mungall K., Finn R. D., Jackson A. P., Mourier T., Mistry J., Pasini E. M., Aslett M. A., et al., (2008), Nature, 455, 799-803. 57. Carlton J. M., Angiuoli S. V., Suh B. B., Kooij T. W., Pertea M., Silva J. C., Ermolaeva M. D., Allen J. E., Selengut J. D., Koo H. L., et al., (2002), Nature, 419, 512-519. 58. Xu P., Widmer G., Wang Y., Ozaki L. S., Alves J. M., Serrano M. G., Puiu D., Manque P., Akiyoshi D., Mackey A. J., et al., (2004), Nature, 431, 1107-1112. 59. Abrahamsen M. S., Templeton T. J., Enomoto S., Abrahante J. E., Zhu G., Lancto C. A., Deng M., Liu C., Widmer G., Tzipori S., et al., (2004), Science, 304, 441-445. 60. Pain A., Renauld H., Berriman M., Murphy L., Yeats C. A., Weir W., Kerhornou A., Aslett M., Bishop R., Bouchier C., et al., (2005), Science, 309, 131-133. 61. Gardner M. J., Bishop R., Shah T., de Villiers E. P., Carlton J. M., Hall N., Ren Q., Paulsen I. T., Pain A., Berriman M., et al., (2005), Science, 309, 134-137. 62. Brayton K. A., Lau A. O., Herndon D. R., Hannick L., Kappmeyer L. S., Berens S. J., Bidwell S. L., Brown W. C., Crabtree J., Fadrosh D., et al., (2007), PLoS Pathog., 3, e148. 63. Endo T., Ikeo K., Gojobori T., (1996), Mol. Biol. Evol., 13, 685-690.

BIOTECHNOLOGIA 4 (91) 91-130 2010 127 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³

64. Graham S. P., Pellé R., Honda Y., Mwangi D. M., Tonukari N. J., Yamage M., Glew E. J., de Villiers E. P., Shah T., Bishop R., et al., (2006), Proc. Natl. Acad. Sci. USA., 103, 3286-3291. 65. Dobbelaere D. A., Küenzi P., (2004), Curr. Opin. Immunol., 16, 524-530. 66. Seeber F., Soldati-Favre D., (2010), Int. Rev. Cell. Mol. Biol., 281, 161-228. 67. Lau A. O., McElwain T. F., Brayton K. A., Knowles D. P., Roalson E. H., (2009), Exp. Parasitol., 123, 236-243. 68. Janouskovec J., Horák A., Oborník M., Lukes J., Keeling P. J., (2010), Proc. Natl. Acad. Sci. USA., 107, 10949-10954. 69. Tonkin C. J., Kalanon M., McFadden G. I., (2008), Traffic, 9, 166-175. 70. Huang J., Mullapudi N., Lancto C. A., Scott, M., Abrahamsen, M. S., Kissinger J. C., (2004), Genome Biol., 5, R88. 71. El-Sayed N. M., Myler P. J., Blandin G., Berriman M., Crabtree J., Aggarwal G., Caler E., Renauld H., Worthey E. A., Hertz-Fowler C., et al., (2005), Science, 309, 404-409. 72. Berriman M., Ghedin E., Hertz-Fowler C., Blandin G., Renauld H., Bartholomeu D. C., Lennard N. J., Caler E., Hamlin N. E., Haas B., et al., (2005), Science, 309, 416-422. 73. El-Sayed N. M., Myler P. J., Bartholomeu D. C., Nilsson D., Aggarwal G., Tran A. N., Ghedin E., Wor- they E. A., Delcher A. L., Blandin G., et al., (2005), Science, 309, 409-415. 74. Peacock C. S., Seeger K., Harris D., Murphy L., Ruiz J. C., Quail M. A., Peters N., Adlem E., Tivey A., Aslett M. (2007), Nat. Genet., 39, 839-847. 75. Ivens A. C., Peacock C. S., Worthey E. A., Murphy L., Aggarwal G., Berriman M., Sisk E., Rajandream M. A., Adlem E., Aert R., et al., (2005), Science, 309, 436-442. 76. El-Sayed N., Ghedin E., Song J., MacLeod A., Bringaud F., Larkin C., Wanless D., Peterson J., Hou L., Taylor S., et al., (2003), Nucleic Acids Res., 31, 4856-4863. 77. Hall N., Berriman M., Lennard N., Harris B., Hertz-Fowler C., Bart-Delabesse E., Gerrard C., Atkin R., Barron A., Bowman S., et al., (2003), Nucleic Acids Res., 31, 4864-4873. 78. Worthey E., Martinez-Calvillo S., Schnaufer A., Aggarwal G., Cawthra J., Fazelinia G., Fong C., Fu G., Hassebrock M., Hixson G., (2003), Nucleic Acids Res., 31, 4201-4210. 79. Opperdoes F. R., Michels P. A., (2007), Trends Parasitol., 23, 470-476. 80. Leander B. S., (2004), Trends Microbiol., 12, 251-258. 81. Body³ A., Mackiewicz P., Milanowski R., (2010), J. Parasitol., 96, 465-475. 82. Haas B. J., Kamoun S., Zody M. C., Jiang R. H., Handsaker R. E., Cano L. M., Grabherr M., Kodira C. D., Raffaele S., Torto-Alalibo T., (2009), Nature, 461, 393-398. 83. Tyler B. M., Tripathy S., Zhang X., Dehal P., Jiang R. H., Aerts A., Arredondo F. D., Baxter L., Bensas- son D., Beynon J. L., (2006), Science, 313, 1261-1266. 84. Cavalier-Smith T., (1999), J. Eukaryot. Microbiol., 46, 347-366. 85. Keeling P. J., (2009), J. Eukaryot. Microbiol., 56, 1-8. 86. Stiller J. W., Huang J., Ding Q., Tian J., Goodwillie C., (2009), BMC Genomics, 10, 484. 87. Lewis L. A., McCourt R. M., (2004), Am. J. Bot., 91, 1535-1556. 88. Behrenfeld M. J., Falkowski P. G., (1997), Limnol. Oceanogr., 42, 1-20. 89. Worden A. Z., Nolan J. K., Palenik B., (2004), Limnol. Oceanogr., 49, 168-179. 90. Palenik B., Grimwood J., Aerts A., Rouzé P., Salamov A., Putnam N., Dupont C., Jorgensen R., Derelle E., Rombauts S., (2007), Proc. Natl. Acad. Sci. USA., 104, 7705-7710. 91. Derelle E., Ferraz C., Rombauts S., Rouzé P., Worden A. Z., Robbens S., Partensky F., Degroeve S., Echeynié S., Cooke R., et al., (2006), Proc. Natl. Acad. Sci. USA., 103, 11647-11652. 92. Worden A. Z., Lee J. H., Mock T., Rouzé P., Simmons M. P., Aerts A. L., Allen A. E., Cuvelier M. L., Derelle E., Everett M. V., (2009), Science, 324, 268-272. 93. Bowler C., Allen A. E., Badger J. H., Grimwood J., Jabbari K., Kuo A., Maheswari U., Martens C., Mau- mus F., Otillar R. P., et al., (2008), Nature, 456, 239-244. 94. Armbrust E. V., Berges J. A., Bowler C., Green B. R., Martinez D., Putnam N. H., Zhou S., Allen A. E., Apt K. E., Bechner M., et al., (2004), Science, 306, 79-86. 95. Archibald J. M., (2009), Curr. Biol., 19, R81-R88. 96. Vesteg M., Vacula R., Krajcovic J., (2009), Folia Microbiol. (Praha), 54, 303-321. 97. Parkinson J., Gordon R., (1999), Trends Biotechnol., 17, 190-196.

128 PRACE PRZEGL¥DOWE Genomika protistów – bardzo zró¿nicowanych, ale s³abo poznanych eukariotów

98. Gordon R., Parkinson J., (2005), J. Nanosci. Nanotechnol., 5, 35-40. 99. Oudot-Le Secq M. P., Grimwood J., Shapiro H., Armbrust E. V., Bowler C., Green B. R., (2007), Mol. Genet. Genomics, 277, 427-439. 100. Bolte K., Bullmann L., Hempel F., Bozarth A., Zauner S., Maier U. G., (2009), J. Eukaryot. Micro- biol., 56, 9-15. 101. Moustafa A., Beszteri B., Maier U. G., Bowler C., Valentin K., Bhattacharya D., (2009), Science, 324, 1724-1726. 102. Merchant S. S., Prochnik S. E., Vallon O., Harris E. H., Karpowicz S. J., Witman G. B., Terry A., Sa- lamov A., Fritz-Laylin L. K., Maréchal-Drouard L., et al., (2007), Science, 318, 245-250. 103. Matsuzaki M., Misumi O., Shin-I T., Maruyama S., Takahara M., Miyagishima S. Y., Mori T., Nishi- da K., Yagisawa F., Nishida K., et al., (2004), Nature, 428, 653-657. 104. Nozaki H., Takano H., Misumi O., Terasawa K., Matsuzaki M., Maruyama S., Nishida K., Yagisawa F., Yoshida Y., Fujiwara T., (2007), BMC Biol., 5, 28. 105. Cavalier-Smith T., (2000), Trends Plant. Sci., 5, 174-182. 106. Douglas S., Zauner S., Fraunholz M., Beaton M., Penny S., Deng L. T., Wu X., Reith M., Cava- lier-Smith T., Maier U. G., (2001), Nature, 410, 1091-1096. 107. Lane C. E., van den Heuvel K., Kozera C., Curtis B. A., Parsons B. J., Bowman S., Archibald J. M., (2007), Proc. Natl. Acad. Sci. USA., 104, 19908-19913. 108. Gilson P. R., Su V., Slamovits C. H., Reith M. E., Keeling P. J., McFadden G. I., (2006), Proc. Natl. Acad. Sci. USA., 103, 9566-95671. 109. Aury J. M., Jaillon O., Duret L., Noel B., Jubin C., Porcel B. M., Ségurens B., Daubin V., Anthouard V., Aiach N., et al., (2006), Nature, 444, 171-178. 110. Eisen J. A., Coyne R. S., Wu M., Wu D., Thiagarajan M., Wortman J. R., Badger J. H., Ren Q., Ame- deo P., Jones K. M., et al., (2006), PLoS Biol., 4, e286. 111. Reyes-Prieto A., Moustafa A., Bhattacharya D., (2008), Curr. Biol., 18, 956-962. 112. Body³ A., Stiller J. W., Mackiewicz P., (2009), Trends Ecol. Evol., 24, 119-121. 113. Eichinger L., Pachebat J. A., Glöckner G., Rajandream M. A., Sucgang R., Berriman M., Song J., Ol- sen R., Szafranski K., Xu Q., et al., (2005), Nature, 435, 43-57. 114. King N., Westbrook M. J., Young S. L., Kuo A., Abedin M., Chapman J., Fairclough S., Hellsten U., Isogai Y., Letunic I., (2008), Nature, 451, 783-788. 115. Sun G., Yang Z., Ishwar A., Huang J., (2010), Mol. Biol. Evol., (w druku). 116. Vaulot D., Eikrem W., Viprey M., Moreau H., (2008), FEMS Microbiol. Rev., 32, 795-820. 117. Falkowski P. G., Barber R. T., Smetacek V., (1998), Science, 281, 200-206. 118. Field C. B., Behrenfeld M. J., Randerson J. T., Falkowski P., (1998), Science, 281, 237-240. 119. Nelson D. M., Treguer P., Brzezinski M. A., Leynaert A., Queguiner B., (1995), Global Biogeochem. Cycles, 9, 359-372. 120. Hefu Y., Kirst G. O., (1997), Polar Biol., 18, 402-409. 121. Stefels J., van Boekel W. H. M., (1993), Mar. Ecol. Prog. Ser., 97, 11-18. 122. Sellner K. G., Doucette G. J., Kirkpatrick G. J., (2003), J. Ind. Microbiol. Biotechnol., 30, 383-406. 123. Douglas A. E., (2003), Mar. Pollut. Bull., 46, 385-392. 124. Berkelmans R., De’ath G., Kininmonth S., Skirving W. J., (2004), Coral Reefs, 23, 74-83. 125. Hillen L. W., Pollard G., Wake L. V., White N., (1982), Biotechnol. Bioeng., 24, 193-205. 126. Metzger P., Largeau C., (2005), Appl. Microbiol. Biotechnol., 66, 486-496. 127. Kuyper M., Harhangi H. R., Stave A. K., Winkler A. A., Jetten M. S., de Laat W. T., den Ridder J. J., Op den Camp H. J., van Dijken J. P., Pronk J. T., (2003), FEMS Yeast Res., 4, 69-78. 128. van Maris A. J., Winkler A. A., Kuyper M., de Laat W. T., van Dijken J. P., Pronk J. T., (2007), Adv. Biochem. Eng. Biotechnol., 108, 179-204. 129. Rupprecht J., (2009), J. Biotechnol., 142, 10-20. 130. Chopin T., (1986), Can. Tech. Rep. Fish Aquat. Sci., 1514, 1-69. 131. Chopin T., Gallant T., Davison I., (1995), J. Phycol., 31, 283-293. 132. Mumford T. F., Miura A., (1988), in: Algae and Human Affairs, Eds. Lembi C. A., Waaland J. R., 87-117, Cambridge University Press, Cambridge.

BIOTECHNOLOGIA 4 (91) 91-130 2010 129 Pawe³ Mackiewicz, Przemys³aw Gagat, Andrzej Body³

133. Barbier G., Oesterhelt C., Larson M. D., Halgren R. G., Wilkerson C., Garavito R. M., Benning C., Weber A. P., (2005), Plant Physiol., 137, 460-474. 134. Ruiz-Trillo I., Burger G., Holland P. W., King N., Lang B. F., Roger A. J., Gray M. W., (2007), Trends Genet., 23, 113-118. 135. Cavalier-Smith T., Chao E. E., (1995), Proc. R. Soc. Lond. B, 261, 1-6. 136. Stechmann A., Cavalier-Smith T., (2003), Curr. Biol., 13, R665-R666. 137. Kim E., Simpson A. G., Graham L. E., (2006), Mol. Biol. Evol., 23, 2455-2466. 138. McCourt R. M., Delwiche C. F., Karol K. G., (2004), Trends Ecol. Evol., 19, 661-666. 139. Reyes-Prieto A., Weber A. P., Bhattacharya D., (2007), Annu. Rev. Genet., 41, 147-168. 140. Keeling P. J., (2009b), Methods Mol. Biol., 532, 501-515. 141. Delsuc F., Brinkmann H., Philippe H., (2005), Nat. Rev. Genet., 6, 361-375. 142. Ciccarelli F. D., Doerks T., von Mering C., Creevey C. J., Snel B., Bork P., (2006), Science, 311, 1283-1287, Erratum in: Science, (2006), 312, 697. 143. Leigh J. W., Susko E., Baumgartner M., Roger A. J., (2008), Syst. Biol., 57, 104-115. 144. Cavalier-Smith T., (1993), Microbiol. Rev., 57, 953-994. 145. Leipe D., Gunderson J. H., Nerad T. A., Sogin M. L., (1993), Mol. Biochem. Parasitol., 59, 41-48. 146. Vossbrinck C. R., Maddox J. V., Friedman S., Debrunner-Vossbrinck B. A., Woese C. R., (1987), Na- ture, 326, 411-414. 147. Sogin M. L., Gunderson J., Elwood H., Alonso R., Peattie D., (1989), Science, 243, 75-77. 148. Thomarat F., Vivares C. P., Gouy M., (2004), J. Mol. Evol., 59, 780-791. 149. Stiller J. W., Hall B. D., (1999), Mol. Biol. Evol., 16, 1270-1279. 150. Philippe H., (2000), Protist, 151, 307-316. 151. Brinkmann H., van der Giezen M., Zhou Y., Poncelin de Raucourt G., Philippe H., (2005), Syst. Biol., 54, 743-757. 152. Martin W., Müller M., (1998), Nature, 392, 37-41. 153. Embley T. M., Martin W., (2006), Nature, 440, 623-630. 154. Hackett J. D., Anderson D. M., Erdner D. L., Bhattacharya D., (2004), Am. J. Bot., 91, 1523-1534. 155. Hou Y., Lin S., (2009), PLoS One, 4, e6978. 156. Rizzo P. J., Noodén L. D., (1972), Science, 176, 796-797. 157. Wong J. T., New D. C., Wong J. C., Hung V. K., (2003), Eukaryot. Cell., 2, 646-650. 158. Hackett J. D., Scheetz T. E., Yoon H. S., Soares M. B., Bonaldo M. F., Casavant T. L., Bhattacharya D., (2005), BMC Genomics, 6, 80. 159. Livolant F., Bouligand Y., (1978), Chromosoma, 68, 21-44. 160. Costas E., Goyanes V., (2005), Genome Res., 109, 268-275. 161. Friz C. T., (1968), Comp. Biochem. Physiol., 26, 81-90. 162. Byers T. J., (1986), Int. Rev. Cytol., 99, 311-341.

130 PRACE PRZEGL¥DOWE