Functional Impact of Polymorphic Inversions in the Human Genome

Functional Impact of Polymorphic Inversions in the Human Genome ) +/### -- Doctor of Philosophyphy – UniversitatUniversitat Autònoma dede Barcelona – 2014 Doctor of Philosophy – Universitat Autònoma de Barcelona – 2014 “I've paid my dues Time after time. I've done my sentence But committed no crime. And bad mistakes ‒ I've made a few. I've had my share of sand kicked in my face But I've come through. […] But it's been no bed of roses, No pleasure cruise. […] We are the champions.” Queen “The most practical solution is a good theory.” Albert Einstein “The good thing about science is that it's true whether or not you believe in it.” Neil deGrasse Tyson Memòria presentada per Meritxell Oliva Pavia per optar al grau de Doctora en Genètica per la Universitat Autònoma de Barcelona Aquesta Tesi Doctoral ha estat realitzada sota la direcció del Dr. Mario Cáceres Aguilar a l’Institut de Biotecnologia i de Biomedicina de la Universitat Autònoma de Barcelona Mario Cáceres Aguilar Meritxell Oliva Pavia El Director de la Tesi L’Autora Doctor of Philosophy – Universitat Autònoma de Barcelona – 2014 CONTENTS "%&.#$%+* *+&)- + &%*%)&%0$* %/& ,)* - %/&+#* - ) - >4> %-)* &%#** + &%%$% *$*&&) % B >4? %-)* &%+*&%)&$ %+ &%2-&#,+ &%%*' + &% E >4@ %-)* &%'&* + &%#%$,++ &%#+*&%%* >@ >4@4> )+$,++ &%#+ >A >4@4? &* + &%#+ >B >4@4@ ) *'&* + &%+&,)+))))%$%+* >D >4A +&*&) %-)* &% *&-)0%%&+0' % >E >4A4> ) + &%#$+&* >E >4A4? ++5&5+5)+%&$ $+&* >F ?4> %&$ -) + &% %+,$%%&$ ?F ?4>4> ' '')&!+ @> ?4>4? >===%&$*)&!+ @> ?4>4@ ')&!+ @? ?4>4A +**%)'&* +&) *&*+),+,)#-) + &% @@ ?4? ,%+ &%&+,$%%&$ @B ?4?4> %+ +)$ %%+*&%/')** &%3/')** &%,%+ ++ -) + & 8 *9@C ?4?4? * %,$%*3*+, *2+**%)'&* +&) * @D ?4?4@ *% ** A> ?4?4A $+&* AA i @4> -)- . AB @4? %-)* &%&) %* %,$%*3$% *$*&&)$+ &%%),))%& %-)* &% $,++ &%#-%+* AC @4@ ,$%'&#0$&)' %-)* &%*3.##5*+, ** AF @4@4> E'?@4> %-)* &% B= @4@4? >D(?>4@> %-)* &% B> @4A %-)* &%*%,$% *** B@ @4A4> %&$5. **& + &%*+, * BA @4B /'% %"%&.#& %-)* &%* %+,$%%&$3+ %-')&!+ BB >4> %$)" %&GRIAL %*+#+)%+ - 5*$+&*&) %-)* &%') + &%E @ >4? %$%+&+ %-)* &%+#&,3 #+) %#*'&* + -') + &%*%-# + &%& %-)+) &%% +* EF >4?4> $'# + &%& %-)* &%') + &%**,''&)+0,'# +&*$ *4 F= >4?4? )++,#&*$ ' )5%++ &%0$ **') $ %%#0* *F> >4?4@ ++ &%&#*'&* + - %-)* &%') + &%*0)$'' %&&*$ ' )%*FB 1.3 GRIAL %-)* &%% +*-# + &% FF >4@4> * %-=A=F >== >4@4? * %-=A>= >=? i ?4> #+ &%&% +'&#0$&)' %-)* &%*%') +,%+ &%#+* >=D ?4? )%+ #/')** &%%#0* * >>? ?4@ %#0* *&%.##5*+, %-)* &%* >?= ?4A %-)* &%5 %#0** >?D @4> * %-==BE %-)* &% >@D @4>4> ,))%2'&',#+ &% *+) ,+ &%%-&#,+ &%)0 *+&)0 >@F @4>4? ,%+ &%#)+) 1+ &% >A= @4? * %-=>?A %-)* &% >BB @4?4> ,))%2'&',#+ &% *+) ,+ &%%-&#,+ &%)0 *+&)0 >BB @4?4? ,%+ &%#)+) 1+ &% >BD @4@ +) %-)* &%% +* >CB A4> +5%#0**& **%&$'#/'%&+0'-) %+***& ++& %-)* &%* >DD A4? %-)* &%% +* >E= % %++#&,&,$%'&#0$&)' %-)* &%* >ED ? +&&#&0 >EF @ ,%+ &%# $'+&'&#0$&)' %-)* &%*&%%/')** &% >F? A %-)* &%*% ** ?=E i Acknowledgements Finalment. Semblava que no havia d’arribar mai. Després d’una ingesta quantitat de temps escrivint, corregint, re-escrivint, re-corregint i re-re-escrivint aquesta tesis, és un plaer indescriptible col·locar el plomí (virtual, és clar) en aquesta secció. Per on començo? Crec que l’inici del recorregut científic personal que dóna lloc a aquest treball es remunta a la decisió de cursar el màster de Bioinformàtica de la UPF (BIOINFO, 2007-2009). En aquests dos anys, a part d’adquirir els coneixements bàsics per poder fer aquesta tesis, vaig tenir el plaer de conèixer una colla d’entranyables “bioinfos” que em van acompanyar en els meus periples per comprendre l’apassionant (o no) món dels “scripts”, “pipelines” i “workflows”. Ignasi i Pau: gràcies per ensenyar-me la diferència entre “hash” i “array”, i a tu, Bàrbara, per compartir amb mi hores d’estudi i presentacions, a vosaltres Laia i Mª Dolors per no rebentar-me els timpans (tot i intentar-ho a força de crits aguts), també gràcies a tu Cristian per aportar la nota de color a l’hora de dinar amb els teus macarrons radioactius, i finalment a tu Eva, per ser única. Tu ets la culpable que relacioni bicicletes mal aparcades amb biologia estructural… No em vull oblidar de certs professors/coordinadors de BIOINFO als qui estic molt agraïda en varis aspectes: gràcies Arcadi per oferir-me el meu primer treball remunerat en recerca, que em va donar la oportunitat d’aprendre sobre genètica de poblacions i compartir, amb la gent del teu laboratori i de tot BIOEVO, interessants discussions científiques a part de xocolatines i dolços després de dinar cada dos per tres... Gràcies Olga, Rui, Ángel, Txema, Valeria, Belén, Hafid (mil gracies per tot H), Óscar, Marc, etc. Torno amb els professors de BIOINFO: gràcies Cedric per presentar l’alineament múltiple de seqüències d’una forma tan apassionant, gràcies Eduardo per fer-nos entendre les cadenes de Markov amb divertits exemples de casinos deshonestos, i finalment, merci Jordi Villà per ser una persona optimista, motivant i motivada. Després del laboratori de l’Arcadi, vaig aterrar al grup de Genòmica Comparativa del CRG liderat pel Cedric Notredame, on vaig fer les pràctiques del màster i vaig posar i treure el peu en un 1r doctorat. Dono gràcies a en Cedric per l’oportunitat donada, i també a tots els membres del seu grup i estimats “geeks” amb qui vaig coincidir: Ema B., Ema R., Jia-Ming, J.F., Paolo, Ionas, Giovanni, Mathias, Isabel, Thomas i sobretot a tu, Carsten, per ser tan bon amic. Merci per haver tingut ii la paciència de respondre les meves preguntes, donar-me un cop de mà quan em feia falta, per ser uns excel·lents companys, per participar en el “lunch club” (Jia-Ming: mai no oblidaré la teva sopa de fideus amb vedella taiwanesa. Mmmm...) i en general per ser com sou! Gràcies també als PIs i membres dels laboratoris del departament de Bioinformàtica i Genòmica del CRG: mencions especials per a en Toni Gabaldón (per ser una persona tan propera, a més a més del PI més “fiestero”), Fyodor Kondrashov (encarnació de la definició “científic” en el seu estat pur: digueu-me, qui més té articles amb el seu pare i la seva àvia???) i també per a en Roderic Guigó per dirigir amb entusiasme el departament i per donar-me consells científics (i personals) quan en necessitava. També no em vull oblidar d’en Juan Valcárcel i la Isabel Vernós, per la seva tasca de donar suport els estudiants de doctorat (jo inclosa) quan en necessiten, als “sysadmin” Óscar i la Judit, per donar-me suport (bio)informàtic, i en general, a tothom qui va contribuir a fer que la meva estada al CRG fos memorable. Al CRG vaig aprendre quelcom molt important: la recerca surt molt millor si es combina amb una “beer party” cada últim dijous de mes. Merci a tots els “CRGians” amb qui he compartit tans bons moments i converses científicoetíliques. M’agradaria anomenar-los a tots, però tinc certes llacunes... Si un encara vol veure augmentada la seva productivitat de manera espectacular, està clar que ha de participar en al torneig de vòlei platja del PRBB!!! Merci a totes les persones amb qui he compartit equip (“Geeks”, “Not only Geeks”, “Pringats”) i/o m’he enfrontat! Mai no m’hauria imaginat que guanyaria una lliga anomenada “Masters of Disaster” o “Quasi-que-no Cracks”; o que m’emocionaria al sentir aficionats (gràcies Colin, Sara, Sònia, Anne, Eric etc.) cridar fins a esgargamellar-se “Allez les geeks!!”. Qui em diria, també, que al CRG coneixeria la meva segona família? Mil gràcies a les meves “nenes”, l’Elena i l’Eli, amb qui he compartit de tot: rialles, llàgrimes, experiències nipones i en general, una amistat que espero que duri per sempre, fem el que fem i estem on estem. Gràcies a en Marc, per ser un molt bon amic amb qui he compartit xerrades de ciència i política tot assaborint experiències enogastronòmiques. Gràcies a en Peter per haver-me fet gaudir de moments inoblidables. Gràcies a l’Almer, home-enciclopèdia i inspirador d’un entrepà amb nom forani i a en Raik, el científic més aventurer i poc ortodox que he conegut. Gràcies a la Johanna per ensenyar-me que ser científica i “sex-symbol” no és incompatible. Gràcies a l’Ester pels bons “tannat-moments”. Gràcies a la Kiana, en Toni, en Tobias i la Camila. Gràcies a tots, nois! ii Vet aquí que arribo al vaixell on he navegat (a vegades amb rumb fix i a vegades a la deriva) al llarg d’aquesta tesis: el grup de Genòmica Comparativa i Funcional de l’IBB, a la UAB. Dono gràcies a tots els “grumets” amb qui he coincidit en aquesta travessia: a l’Ester, la “crack” il·luminada de les llibreries genòmiques, a la Marta per l’ajuda prestada al “wet lab”, a en David I. per la seva capacitat organitzativa tant al laboratori com fora (merci per organitzar les barbacoes i altres events de grup/departament!), a en Sergi per ser compartir alegries i penes amb la arxifamosa HsInv0102 i altres inversions, errors i encerts genotípics i per ser un alumne avantatjat en aprendre bioinformàtica a marxes forçades! Gràcies a l’Àlex, per la seva gran capacitat d’oratòria i per ser el meu company de “benchmarking” de GRIAL (entre els dos hem venut la moto que va molt bé, eh? Shhh...). Gràcies a la Sònia per l’ajuda bioinformàtica prestada i per la paciència i serenor infinites que té. Gàcies a eixe xic, l’Ignasi, per ensenyar-me un poc de valencià i per donar-me consell estadístic i suport bioinformàtic sempre que l’he necessitat. Gràcies a na Magda, una al·lota ben trempada que no se va cansar d’explicar-me una i altra vegada que rediantres és el “linkage desequilibrium”. Merci a la Carla per la seva curiositat i simpatia innata i a en David C. per ser un “crack” de la genètica de poblacions. Merci a en David V. per ser encarregar-se tan bé del “crick” i facilitar-nos la vida a tots els bioinformàtics del grup (i també al “xino” pel suport donat). Merci a la Lorena per ser tan competent i per donar-me un cop de mà sempre que l’he necessitat. Gràcies al capità del vaixell, en Mario, per fer possible INVFEST i per haver supervisat aquesta tesis.
