Identyfikacja Domen WG/GW Zaangażowanych W Wiązanie Białek Argonaute Oraz Analiza Mechanizmów Molekularnych Odpowiedzialnych Za Ich Zmienność

Identyfikacja Domen WG/GW Zaangażowanych W Wiązanie Białek Argonaute Oraz Analiza Mechanizmów Molekularnych Odpowiedzialnych Za Ich Zmienność

Wydział Biologii Uniwersytet im. Adama Mickiewicza w Poznaniu Rozprawa doktorska Identyfikacja domen WG/GW zaangażowanych w wiązanie białek Argonaute oraz analiza mechanizmów molekularnych odpowiedzialnych za ich zmienność Andrzej Zieleziński Praca napisana pod kierunkiem Prof. dr. hab. Wojciecha Karłowskiego w Pracowni Bioinformatyki Instytutu Biologii Molekularnej i Biotechnologii Poznań, 2014 Podziękowania Składam serdeczne podziękowania mojemu Promotorowi Panu prof. dr. hab. Wojciechowi Karłowskiemu za intelektualne inspiracje oraz wiedzę, jaką przekazał mi w okresie studiów doktoranckich, a także twórcze rozwinięcie moich zainteresowań naukowych, tak abym mógł przygotować niniejszą dysertację Dziękuję również Koleżankom i Kolegom z Pracowni Bioinformatyki, w szczególności dr. Maciejowi Szymańskiemu, dr. Markowi Żywickiemu oraz mgr Sylwii Alabie za pomoc w kwestiach naukowych, a także pouczające dyskusje Finansowanie Niniejsza praca powstała przy finansowym udziale: 1. Narodowego Centrum Nauki (grant 2011/03/N/NZ2/01440 dla A.Z.) 2. Wydziału Biologii Uniwersytetu im. Adama Mickiewicza w Poznaniu (grant GDWB-09/2011, dla A.Z.) 3. Wojewódzkiego Urzędu Pracy (stypendium w ramach projektu „Wsparcie stypendialne dla doktorantów na kierunkach uznanych za strategiczne z punktu widzenia rozwoju Wielkopolski” w ramach programu 8.2.2. Programu Operacyjnego Kapitał Ludzki) Publikacje autora związane z pracą doktorską 1. Zielezinski A & Karlowski WM. Tyrosine-tryptophan substitution switches on the rapid evolution of WG/GW domain in RRM AGO-binding proteins from Arabidopsis and rice. [publikacja w przygotowaniu] 2. Zielezinski A & Karlowski WM. Whub: a comprehensive knowledgebase portal for AGO-binding protein research Nucleic Acids Research [artykuł wysłany do redakcji] 3. Zielezinski A & Karlowski WM. Agos - -a universal web tool for GW Argonaute-binding domain prediction. Bioinformatics. 27(9). 2011 4. Karlowski WM, Zielezinski A, Carrère J, Pontier D, Lagrange T, Cooke R. Genome-wide computational identification of WG/GW Argonaute-binding proteins in Arabidopsis. Nucleic Acids Research. 38(13). 2010 Spis treści Streszczenie.......................................................................................................................................6 1. Wstęp.............................................................................................................................................8 1.1. Białka WG/GW w procesie RNAi.........................................................................................9 1.2. Rola domeny WG/GW w wiązaniu białek z rodziny Argonaute.........................................12 1.3. Specyfika domen WG/GW..................................................................................................16 2. Cel pracy.....................................................................................................................................19 3. Metody........................................................................................................................................20 3.1. Metody identyfikacji domen WG/GW.................................................................................20 3.1.1. Metoda kompozycyjna I i II generacji.........................................................................20 3.1.2. Metoda profilu PSSM...................................................................................................22 3.1.3. Metoda wykorzystująca nauczanie maszynowe...........................................................24 3.2. Analiza filogenetyczna.........................................................................................................25 3.3. Technologie wykorzystane w aplikacjach internetowych....................................................27 4. Wyniki.........................................................................................................................................28 4.1. Identyfikacja de novo domen wiążących białka AGO.........................................................28 4.1.1. Metoda przewidywania domen WG/GW oparta na kompozycji aminokwasów.........28 4.1.2. Nowe białka wiążące AGO w genomie Arabidopsis thaliana.....................................33 4.1.3. Wirtualna symulacja eksperymentu wymiany domen WG/GW..................................38 4.1.4. Metoda detekcji pojedynczych motywów wiążących AGO.........................................40 4.1.5. Nowe białka wiążące AGO u Eukariota.......................................................................44 4.1.6. Meta-genomowe przewidywanie domen WG/GW u Prokariota i wirusów.................48 4.2. Programy do adnotacji i analizy domen WG/GW...............................................................56 4.2.1. Whub - portal internetowy do badań nad motywami zaangażowanymi w RNAi........57 4.2.2. Agos - skaner on-line identyfikacji potencjalnych miejsc wiązania AGO...................62 4.2.3. Wsearch / i-Wsearch - programy identyfikacji funkcjonalnych W-motywów.............65 4.2.4. Projektowanie in silico sekwencji domen w formie gry internetowej.........................69 4.3. Molekularne mechanizmy powstawania i zmienności domen WG/GW.............................71 4.3.1. Tandemowe i segmentowe duplikacje genów oraz alternatywny splicing...................73 4.3.2. Tempo mutacji niesynonimicznych i synonimicznych.................................................79 4.3.3. Analiza konwersji genów i/lub rekombinacji...............................................................85 4.3.4. Powstawanie de novo domeny WG/GW......................................................................87 5. Dyskusja......................................................................................................................................91 6. Podsumowanie..........................................................................................................................101 Wykaz skrótów..............................................................................................................................102 Spis rysunków i tabel.....................................................................................................................103 Bibliografia....................................................................................................................................105 Streszczenie Wstęp. Domeny białkowe WG/GW złożone z licznie występujących par tryptofanu (W) i glicyny (G) są niezbędne do wiązania białek Argonaute (AGO) w procesie interferencji RNA (RNAi). Bardzo niski stopień podobieństwa sekwencji domen WG/GW, różna długość ich sekwencji (22-700 reszt), zmienna liczba powtórzeń motywu WG/GW (1-45) uniemożliwiają wiarygodne określenie ich relacji homologicznych, a także są źródłem trudności podczas ich identyfikacji tradycyjnymi metodami przewidywania domen i motywów białkowych. Cel pracy. Celem niniejszej pracy jest identyfikacja nowych białek zawierających domenę WG/GW wiążącą AGO oraz zbadanie mechanizmów molekularnych warunkujących ich zróżnicowanie. Metody. Stworzone programy adnotacji domen wiążących AGO zostały napisane w języku Python. Zakres badań filogenetycznych sprowadzono do konserwatywnych fragmentów białek oddziałujących z AGO. Wyniki. Opracowano trzy metody identyfikacji de novo domen WG/GW (Agos, Wsearch, i-Wsearch) zaimplementowane w formie ogólnodostępnych aplikacji internetowych i programów przeznaczonych do uruchomienia na lokalnym komputerze, które stanowią pierwsze bioinformatyczne narzędzia służące do adnotacji domen wiążących AGO. Wynikiem ich zastosowania są listy rankingowe nowych genów kodujących potencjalne domeny WG/GW u Eukariota, z których część została już potwierdzona eksperymentalnie (WGRP1, SDE3, hnRNP). Skanowanie genomów Prokariota pozwoliło także zidentyfikować sekwencje pierwszych potencjalnych domen WG/GW w tym królestwie, które w większości występują u gatunków archeonów i bakterii kodujących białka Argonaute. Również wśród wirusów - 6 - infekujących rośliny i zwierzęta znalezione zostały statystycznie istotne motywy WG/GW, które mogą oddziaływać z białkami AGO komórki gospodarza w celu przełamania jego systemu odporności zależnego od RNAi. Z rekonstrukcji filogenetycznej i analizy porównawczej domen WG/GW, przeprowadzonej w wielogenowej rodzinie białek hnRNP, wynika, że sekwencje genomowe domen wiążących AGO stanowią ekstremalny przypadek polimorfizmu genetycznego. Oprócz tandemowych i segmentowych duplikacji oraz alternatywnego splicingu, fragmenty sekwencji kodujących motywy WG/GW znajdują się pod działaniem pozytywnej selekcji przyspieszającej utrwalanie substytucji aminokwasowych, które dodatkowo podlegają licznym przetasowaniom między paralogami na drodze częstych rekombinacji i nierównego crossing-over. Przeprowadzając wirtualną symulację eksperymentu polegającego na wymianie domen WG/GW między niespokrewnionymi roślinnymi i zwierzęcymi białkami wiążącymi AGO wykazano, że mimo wysokiego zróżnicowania długości i stopnia zachowania sekwencji tych domen, ich specyficzna kompozycja aminokwasowa jest zachowana u wszystkich organizmów eukariotycznych. Filogenia domen WG/GW oraz analiza ich składu aminokwasowego sugerują, że zarówno zwierzęce, jak i roślinne domeny wiążące AGO, występujące w różnych rodzinach białkowych, powstają z regionów białek inherentnie nieuporządkowanych (IDP, ang. intrinsically disordered proteins) obejmujących także regiony glicynobogate. Ponadto wykazano, że uniwersalną cechą eukariotycznych domen wiążących AGO są wielokrotne - najczęściej

View Full Text

Details

  • File Type
    pdf
  • Upload Time
    -
  • Content Languages
    English
  • Upload User
    Anonymous/Not logged-in
  • File Pages
    116 Page
  • File Size
    -

Download

Channel Download Status
Express Download Enable

Copyright

We respect the copyrights and intellectual property rights of all users. All uploaded documents are either original works of the uploader or authorized works of the rightful owners.

  • Not to be reproduced or distributed without explicit permission.
  • Not used for commercial purposes outside of approved use cases.
  • Not used to infringe on the rights of the original creators.
  • If you believe any content infringes your copyright, please contact us immediately.

Support

For help with questions, suggestions, or problems, please contact us