Output results of CLIME (CLustering by Inferred Models of Evolution)

Dataset: Num of in input set: 4 Total number of genes: 20834 Prediction LLR threshold: 0

The CLIME PDF output two sections: 1) Overview of Evolutionarily Conserved Modules (ECMs)

Top panel shows the predefined species tree.

Bottom panel shows the partition of input genes into Evolutionary Conserved Modules (ECMs), ordered by ECM strength (shown at right), and separated by horizontal lines.

Each row show one gene, where the phylogenetic profile indicates presence (blue) or absence (gray) of homologs in each species (column).

Gene symbols are shown at left. Gray color indicates that the gene is a paralog to a higher scoring gene within the same ECM (based on BLASTP E < 1e-3).

2) Details of each ECM and its expansion ECM+

Top panel shows the inferred evolutionary history on the predefined species tree. Branch color shows the gain event (blue) and loss events (red color, with brighter color indicating higher confidence in loss). Branches before the gain or after a loss are shown in gray.

Bottom panel shows the input genes that are within the ECM (blue/white rows) as well as all genes in the expanded ECM+ (green/gray rows). The ECM+ includes genes likely to have arisen under the inferred model of evolution relative to a background model, and scored using a log likelihood ratio (LLR).

PG indicates "paralog group" and are labeled alphabetically (i.e., A, B). The first gene within each paralog group is shown in black color. All other genes sharing sequence similarity (BLAST E < 1e-3) are assigned to the same PG label and displayed in gray. ECM 1 NEURL2 USP33 RBX1 VHLL Overview ofEvolutionarilyConservedModules(ECMs)

Prokaryotes Prokaryotes Last CommonAncestor E.cuniculi E.cuniculi E.histolytica E.histolytica E.dispar E.dispar G.lamblia G.lamblia T.vaginalis T.vaginalis T.brucei T.brucei T.cruzi T.cruzi L.infantum L.infantum L.major L.major L.braziliensis L.braziliensis T.gondii T.gondii Protists C.hominis C.hominis C.parvum C.parvum B.bovis B.bovis T.annulata T.annulata T.parva T.parva P.knowlesi P.knowlesi P.vivax P.vivax P.falciparum P.falciparum P.chabaudi P.chabaudi P.berghei P.berghei P.yoelii P.yoelii P.tetraurelia P.tetraurelia T.thermophila T.thermophila P.infestans P.infestans T.pseudonana T.pseudonana P.tricornutum P.tricornutum C.merolae C.merolae N.gruberi N.gruberi O.lucimarinus O.lucimarinus O.tauri O.tauri C.reinhardtii C.reinhardtii V.carteri V.carteri P.patens P.patens

S.moellendorffii Plants S.moellendorffii S.bicolor S.bicolor Z.mays Z.mays O.sativa O.sativa B.distachyon B.distachyon A.lyrata A.lyrata A.thaliana A.thaliana L.japonicus L.japonicus M.truncatula M.truncatula V.vinifera V.vinifera P.trichocarpa P.trichocarpa R.communis R.communis T.trahens T.trahens D.discoideum D.discoideum A.macrogynus A.macrogynus S.punctatus S.punctatus M.globosa M.globosa U.maydis U.maydis C.neoformans C.neoformans P.chrysosporium P.chrysosporium S.commune S.commune C.cinerea C.cinerea L.bicolor L.bicolor S.pombe S.pombe B.fuckeliana B.fuckeliana S.sclerotiorum S.sclerotiorum F.graminearum F.graminearum M.grisea M.grisea N.crassa N.crassa P.anserina P.anserina P.chrysogenum P.chrysogenum A.clavatus A.clavatus A.fumigatus A.fumigatus N.fischeri N.fischeri A.flavus A.flavus A.oryzae A.oryzae A.niger A.niger A.nidulans Fungi A.nidulans U.reesii U.reesii C.immitis C.immitis C.posadasii C.posadasii P.nodorum P.nodorum T.melanosporum T.melanosporum Y.lipolytica Y.lipolytica P.pastoris P.pastoris C.lusitaniae C.lusitaniae D.hansenii D.hansenii M.guilliermondii M.guilliermondii S.stipitis S.stipitis L.elongisporus L.elongisporus C.tropicalis C.tropicalis C.albicans C.albicans C.dubliniensis C.dubliniensis K.lactis K.lactis A.gossypii A.gossypii K.waltii K.waltii L.thermotolerans L.thermotolerans Z.rouxii Z.rouxii V.polyspora V.polyspora C.glabrata C.glabrata S.bayanus S.bayanus S.mikatae S.mikatae S.cerevisiae S.cerevisiae S.paradoxus S.paradoxus S.arctica S.arctica C.owczarzaki C.owczarzaki M.brevicollis M.brevicollis S.rosetta S.rosetta S.mansoni S.mansoni B.malayi B.malayi C.briggsae C.briggsae C.elegans C.elegans D.pulex D.pulex A.pisum A.pisum P.humanus P.humanus A.mellifera A.mellifera N.vitripennis N.vitripennis B.mori B.mori T.castaneum T.castaneum D.melanogaster D.melanogaster D.pseudoobscura D.pseudoobscura A.gambiae A.gambiae A.aegypti A.aegypti

C.quinquefasciatus Metazoa C.quinquefasciatus B.floridae B.floridae T.adhaerens T.adhaerens S.purpuratus S.purpuratus H.magnipapillata H.magnipapillata N.vectensis N.vectensis C.intestinalis C.intestinalis D.rerio D.rerio O.latipes O.latipes F.rubripes F.rubripes T.nigroviridis T.nigroviridis X.tropicalis X.tropicalis G.gallus G.gallus M.gallopavo M.gallopavo O.anatinus O.anatinus M.domestica M.domestica S.scrofa S.scrofa M.musculus M.musculus C.familiaris C.familiaris B.taurus B.taurus H.sapiens H.sapiens Strength 0.0 PG Protein USP33 RBX1 7: VCBcomplex|| 1: Cul2-RINGubiquitinligasecomplex|| Num ofECMGenes:2.Predicted0.Strength:0.0 ECM 1,Geneset"VCBcomplex",Page1

Prokaryotes Prokaryotes Last CommonAncestor E.cuniculi E.cuniculi E.histolytica E.histolytica E.dispar E.dispar G.lamblia G.lamblia T.vaginalis T.vaginalis T.brucei T.brucei T.cruzi T.cruzi L.infantum L.infantum

8: cellbody L.major L.major L.braziliensis L.braziliensis T.gondii T.gondii Protists C.hominis C.hominis C.parvum C.parvum B.bovis B.bovis T.annulata T.annulata T.parva T.parva P.knowlesi P.knowlesi P.vivax P.vivax 2: Cul3-RINGubiquitinligasecomplex|| P.falciparum P.falciparum P.chabaudi P.chabaudi P.berghei P.berghei P.yoelii P.yoelii P.tetraurelia P.tetraurelia T.thermophila T.thermophila P.infestans P.infestans T.pseudonana T.pseudonana P.tricornutum P.tricornutum C.merolae C.merolae N.gruberi N.gruberi O.lucimarinus O.lucimarinus O.tauri O.tauri C.reinhardtii C.reinhardtii V.carteri V.carteri P.patens P.patens

S.moellendorffii Plants S.moellendorffii S.bicolor S.bicolor Z.mays Z.mays O.sativa O.sativa B.distachyon B.distachyon 3: Cul4A-RINGubiquitinligasecomplex|| A.lyrata A.lyrata A.thaliana A.thaliana L.japonicus L.japonicus M.truncatula M.truncatula V.vinifera V.vinifera P.trichocarpa P.trichocarpa R.communis R.communis T.trahens T.trahens D.discoideum D.discoideum A.macrogynus A.macrogynus S.punctatus S.punctatus M.globosa M.globosa U.maydis U.maydis C.neoformans C.neoformans P.chrysosporium P.chrysosporium S.commune S.commune C.cinerea C.cinerea L.bicolor L.bicolor S.pombe S.pombe B.fuckeliana B.fuckeliana S.sclerotiorum S.sclerotiorum F.graminearum 4: Cul4B-RINGubiquitinligasecomplex|| F.graminearum M.grisea M.grisea N.crassa N.crassa P.anserina P.anserina P.chrysogenum P.chrysogenum A.clavatus A.clavatus A.fumigatus A.fumigatus N.fischeri N.fischeri A.flavus A.flavus A.oryzae A.oryzae A.niger A.niger A.nidulans Fungi A.nidulans U.reesii U.reesii C.immitis C.immitis C.posadasii C.posadasii P.nodorum P.nodorum T.melanosporum T.melanosporum Y.lipolytica Y.lipolytica P.pastoris P.pastoris C.lusitaniae C.lusitaniae D.hansenii D.hansenii M.guilliermondii M.guilliermondii

5: Cul5-RINGubiquitinligasecomplex|| S.stipitis S.stipitis L.elongisporus L.elongisporus C.tropicalis C.tropicalis C.albicans C.albicans C.dubliniensis C.dubliniensis

K.lactis K.lactis PRESENCE A.gossypii A.gossypii K.waltii K.waltii

L.thermotolerans L.thermotolerans GAIN Z.rouxii Z.rouxii V.polyspora V.polyspora C.glabrata C.glabrata S.bayanus S.bayanus S.mikatae S.mikatae S.cerevisiae S.cerevisiae S.paradoxus S.paradoxus S.arctica S.arctica C.owczarzaki C.owczarzaki M.brevicollis M.brevicollis S.rosetta S.rosetta

S.mansoni S.mansoni ABSENCE 6: SCFubiquitinligasecomplex|| B.malayi B.malayi

C.briggsae C.briggsae LOSS C.elegans C.elegans D.pulex D.pulex A.pisum A.pisum P.humanus P.humanus A.mellifera A.mellifera N.vitripennis N.vitripennis B.mori B.mori T.castaneum T.castaneum D.melanogaster D.melanogaster D.pseudoobscura D.pseudoobscura A.gambiae A.gambiae A.aegypti A.aegypti

C.quinquefasciatus Metazoa C.quinquefasciatus B.floridae B.floridae T.adhaerens

T.adhaerens 0 Log-likelihood RatioScale S.purpuratus S.purpuratus H.magnipapillata H.magnipapillata 10 N.vectensis N.vectensis C.intestinalis C.intestinalis

D.rerio D.rerio 20 O.latipes O.latipes

F.rubripes F.rubripes 30 T.nigroviridis T.nigroviridis X.tropicalis X.tropicalis 40 G.gallus G.gallus M.gallopavo M.gallopavo

O.anatinus O.anatinus 50 M.domestica M.domestica S.scrofa S.scrofa 60 M.musculus M.musculus C.familiaris C.familiaris B.taurus B.taurus H.sapiens H.sapiens LLR Notes 7 /8 1 /234567 PG D B E E E D C C B A A Protein TMEM14E NCKAP5L MANBAL C10orf32 CACNG4 NCKAP5 USHBP1 OR51D1 OR4K13 BTN3A2 OR51F2 C2orf47 SIRPB2 CRHBP PDGFA DDIT4L HHLA2 ITM2B ITM2A ITM2C SGCB DDIT4 OPTN FADD SDC3 XKR8 VHLL PKIB 27: axon|| 20: Golgi-associated vesiclemembrane|| 11: varicosity|| 1: VCBcomplex|| Num ofECMGenes:1.Predicted27 ECM 2,Geneset"VCBcomplex",Page1

Prokaryotes Prokaryotes Last CommonAncestor E.cuniculi E.cuniculi E.histolytica E.histolytica E.dispar E.dispar G.lamblia G.lamblia T.vaginalis T.vaginalis 28: Golgilumen || T.brucei T.brucei T.cruzi T.cruzi

12: CD95death-inducingsignaling complex || L.infantum L.infantum

2: endoplasmicreticulumlumen || L.major L.major L.braziliensis L.braziliensis T.gondii T.gondii Protists C.hominis C.hominis C.parvum C.parvum B.bovis B.bovis T.annulata T.annulata T.parva T.parva 29: lysosomallumen || P.knowlesi P.knowlesi P.vivax P.vivax P.falciparum P.falciparum 21: integraltoorganelle membrane|| P.chabaudi P.chabaudi P.berghei P.berghei P.yoelii P.yoelii P.tetraurelia P.tetraurelia T.thermophila T.thermophila P.infestans P.infestans T.pseudonana T.pseudonana

3: microvillus|| P.tricornutum P.tricornutum C.merolae C.merolae N.gruberi N.gruberi

30: alpha-amino-3-hydroxy-5-methyl-4-isoxazolepropionic acidselectiveglutamatereceptor complex|| O.lucimarinus O.lucimarinus

13: cellbody|| O.tauri O.tauri C.reinhardtii C.reinhardtii V.carteri V.carteri P.patens P.patens

S.moellendorffii Plants S.moellendorffii S.bicolor S.bicolor

4: plateletalphagranulelumen || Z.mays Z.mays O.sativa O.sativa

22: dystrophin-associated glycoproteincomplex || B.distachyon B.distachyon A.lyrata A.lyrata

14: death-inducingsignalingcomplex || A.thaliana A.thaliana L.japonicus L.japonicus M.truncatula M.truncatula V.vinifera V.vinifera P.trichocarpa P.trichocarpa R.communis R.communis T.trahens T.trahens D.discoideum D.discoideum A.macrogynus A.macrogynus S.punctatus S.punctatus M.globosa M.globosa U.maydis U.maydis C.neoformans C.neoformans P.chrysosporium P.chrysosporium

5: axonterminus|| S.commune S.commune C.cinerea C.cinerea L.bicolor L.bicolor S.pombe S.pombe B.fuckeliana B.fuckeliana S.sclerotiorum S.sclerotiorum F.graminearum F.graminearum 15: membraneraft|| M.grisea M.grisea N.crassa N.crassa P.anserina P.anserina 23: sarcoglycancomplex || P.chrysogenum P.chrysogenum A.clavatus A.clavatus 6: dendrite|| A.fumigatus A.fumigatus N.fischeri N.fischeri A.flavus A.flavus A.oryzae A.oryzae A.niger A.niger A.nidulans Fungi A.nidulans U.reesii U.reesii 16: neuronprojection|| C.immitis C.immitis

7: densecoregranule|| C.posadasii C.posadasii P.nodorum P.nodorum T.melanosporum T.melanosporum Y.lipolytica Y.lipolytica 31: endocyticvesicle membrane|| P.pastoris P.pastoris 24: sarcolemma || C.lusitaniae C.lusitaniae D.hansenii D.hansenii M.guilliermondii M.guilliermondii S.stipitis S.stipitis L.elongisporus L.elongisporus C.tropicalis C.tropicalis C.albicans C.albicans

17: lysosomalmembrane|| C.dubliniensis C.dubliniensis

K.lactis K.lactis PRESENCE

8: multivesicularbody|| A.gossypii A.gossypii K.waltii K.waltii 25: cytoplasmicmembrane-bounded vesicle||

L.thermotolerans L.thermotolerans GAIN Z.rouxii Z.rouxii V.polyspora V.polyspora C.glabrata C.glabrata S.bayanus S.bayanus S.mikatae S.mikatae

32: voltage-gated calcium channelcomplex S.cerevisiae S.cerevisiae S.paradoxus S.paradoxus S.arctica S.arctica C.owczarzaki C.owczarzaki M.brevicollis M.brevicollis S.rosetta S.rosetta 18: lysosome|| 9: perikaryon|| S.mansoni S.mansoni ABSENCE B.malayi B.malayi

C.briggsae C.briggsae LOSS C.elegans C.elegans D.pulex D.pulex A.pisum A.pisum P.humanus P.humanus A.mellifera A.mellifera N.vitripennis N.vitripennis B.mori 19: endosomemembrane|| B.mori 10: secretorygranule|| T.castaneum T.castaneum

26: trans-Golginetwork || D.melanogaster D.melanogaster D.pseudoobscura D.pseudoobscura A.gambiae A.gambiae A.aegypti A.aegypti

C.quinquefasciatus Metazoa C.quinquefasciatus B.floridae B.floridae T.adhaerens

T.adhaerens 0 Log-likelihood RatioScale S.purpuratus S.purpuratus H.magnipapillata H.magnipapillata 10 N.vectensis N.vectensis C.intestinalis C.intestinalis

D.rerio D.rerio 20 O.latipes O.latipes

F.rubripes F.rubripes 30 T.nigroviridis T.nigroviridis X.tropicalis X.tropicalis 40 G.gallus G.gallus M.gallopavo M.gallopavo

O.anatinus O.anatinus 50 M.domestica M.domestica S.scrofa S.scrofa 60 M.musculus M.musculus C.familiaris C.familiaris B.taurus B.taurus H.sapiens H.sapiens LLR 0.0 0.1 0.2 0.6 0.8 1.0 1.0 1.0 1.0 1.1 1.3 1.6 1.7 1.7 1.8 1.8 1.9 2.3 3.0 3.0 3.7 4.0 4.7 5.0 9.1 9.1 10.1 Notes 30 /3132 27 /2829 25 /26 22 /2324 19 /2021 17 /18 12 /13141516 5 /67891011 2 /34 1 PG E E E E E E E E E E E A A A A A A E D D C C A A B B A A Protein NEUROD6 BHLHE23 BHLHE22 PTGDR2 MRPS30 NEURL2 OR11G2 OR2A42 OR11A1 OR10A6 OR13J1 MSGN1 EDNRA OR14I1 DACH2 DACH1 ATOH7 ATOH1 OR2A1 OR1N2 BCL7C BCL7B OR1E2 OR1E1 GPR61 GPR27 NTSR2 OR1L8 OLIG3 OLIG2 OLIG1 AGER MC1R MSC ID4 1: muscle tendonjunction || Num ofECMGenes:1.Predicted153 ECM 3,Geneset"VCBcomplex",Page1

Prokaryotes Prokaryotes Last CommonAncestor E.cuniculi E.cuniculi E.histolytica E.histolytica E.dispar E.dispar G.lamblia G.lamblia T.vaginalis T.vaginalis T.brucei T.brucei T.cruzi T.cruzi L.infantum L.infantum L.major L.major L.braziliensis L.braziliensis T.gondii T.gondii Protists C.hominis C.hominis C.parvum C.parvum 2: VCBcomplex || B.bovis B.bovis T.annulata T.annulata T.parva T.parva P.knowlesi P.knowlesi P.vivax P.vivax P.falciparum P.falciparum P.chabaudi P.chabaudi P.berghei P.berghei P.yoelii P.yoelii P.tetraurelia P.tetraurelia T.thermophila T.thermophila 3: axon || P.infestans P.infestans T.pseudonana T.pseudonana P.tricornutum P.tricornutum C.merolae C.merolae N.gruberi N.gruberi O.lucimarinus O.lucimarinus O.tauri O.tauri 4: basalplasma membrane || C.reinhardtii C.reinhardtii V.carteri V.carteri P.patens P.patens

S.moellendorffii Plants S.moellendorffii S.bicolor S.bicolor Z.mays Z.mays O.sativa O.sativa B.distachyon B.distachyon A.lyrata A.lyrata A.thaliana A.thaliana L.japonicus L.japonicus M.truncatula M.truncatula V.vinifera V.vinifera P.trichocarpa P.trichocarpa R.communis R.communis T.trahens T.trahens 5: membrane raft|| D.discoideum D.discoideum A.macrogynus A.macrogynus S.punctatus S.punctatus M.globosa M.globosa U.maydis U.maydis C.neoformans C.neoformans P.chrysosporium P.chrysosporium S.commune S.commune C.cinerea C.cinerea L.bicolor L.bicolor S.pombe S.pombe B.fuckeliana

6: nuclear membrane|| B.fuckeliana S.sclerotiorum S.sclerotiorum F.graminearum F.graminearum M.grisea M.grisea N.crassa N.crassa P.anserina P.anserina P.chrysogenum P.chrysogenum A.clavatus A.clavatus A.fumigatus A.fumigatus N.fischeri N.fischeri A.flavus A.flavus A.oryzae A.oryzae A.niger A.niger A.nidulans Fungi A.nidulans 7: T-tubule || U.reesii U.reesii C.immitis C.immitis C.posadasii C.posadasii P.nodorum P.nodorum T.melanosporum T.melanosporum Y.lipolytica Y.lipolytica P.pastoris P.pastoris C.lusitaniae C.lusitaniae D.hansenii D.hansenii 8: microtubule cytoskeleton || M.guilliermondii M.guilliermondii S.stipitis S.stipitis L.elongisporus L.elongisporus C.tropicalis C.tropicalis C.albicans C.albicans C.dubliniensis C.dubliniensis

K.lactis K.lactis PRESENCE A.gossypii A.gossypii K.waltii K.waltii

L.thermotolerans L.thermotolerans GAIN Z.rouxii Z.rouxii V.polyspora V.polyspora C.glabrata C.glabrata S.bayanus S.bayanus S.mikatae S.mikatae S.cerevisiae S.cerevisiae

9: ribosome S.paradoxus S.paradoxus S.arctica S.arctica C.owczarzaki C.owczarzaki M.brevicollis M.brevicollis S.rosetta S.rosetta

S.mansoni S.mansoni ABSENCE B.malayi B.malayi

C.briggsae C.briggsae LOSS C.elegans C.elegans D.pulex D.pulex A.pisum A.pisum P.humanus P.humanus A.mellifera A.mellifera N.vitripennis N.vitripennis B.mori B.mori T.castaneum T.castaneum D.melanogaster D.melanogaster D.pseudoobscura D.pseudoobscura A.gambiae A.gambiae A.aegypti A.aegypti

C.quinquefasciatus Metazoa C.quinquefasciatus B.floridae B.floridae T.adhaerens

T.adhaerens 0 Log-likelihood RatioScale S.purpuratus S.purpuratus H.magnipapillata H.magnipapillata 10 N.vectensis N.vectensis C.intestinalis C.intestinalis

D.rerio D.rerio 20 O.latipes O.latipes

F.rubripes F.rubripes 30 T.nigroviridis T.nigroviridis X.tropicalis X.tropicalis 40 G.gallus G.gallus M.gallopavo M.gallopavo

O.anatinus O.anatinus 50 M.domestica M.domestica S.scrofa S.scrofa 60 M.musculus M.musculus C.familiaris C.familiaris B.taurus B.taurus H.sapiens H.sapiens LLR 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 Notes 9 8 5 /67 3 /4 1 /2 PG E E E E E E E G G E F F F E E E E E E E E E E E E E E E E E Protein LOC644100 ARL14EPL SEMA4G SEMA6B SEMA7A RUNDC1 OR13G1 OR2AT4 OR10A5 OR13A1 OR4K17 OR4K14 OR4C15 OR2B11 TFAP2D OR2T29 OR2W1 OR2G6 OR2C3 OR9A2 OR4K1 OR4D6 OR4A5 OR2H2 OR4P4 OR2L2 OR2F2 OR2F1 OR4L1 OR2T5 S1PR5 S1PR4 CD200 TPM2 KAL1 1: anchored tomembrane || Num ofECMGenes:1.Predicted153 ECM 3,Geneset"VCBcomplex",Page2

Prokaryotes Prokaryotes Last CommonAncestor E.cuniculi E.cuniculi E.histolytica E.histolytica E.dispar E.dispar G.lamblia G.lamblia T.vaginalis T.vaginalis T.brucei T.brucei T.cruzi T.cruzi L.infantum L.infantum L.major L.major L.braziliensis L.braziliensis T.gondii T.gondii Protists C.hominis C.hominis C.parvum 2: external sideofplasma membrane || C.parvum B.bovis B.bovis T.annulata T.annulata T.parva T.parva P.knowlesi P.knowlesi P.vivax P.vivax P.falciparum P.falciparum P.chabaudi P.chabaudi P.berghei P.berghei P.yoelii P.yoelii P.tetraurelia P.tetraurelia T.thermophila T.thermophila P.infestans P.infestans T.pseudonana T.pseudonana P.tricornutum P.tricornutum C.merolae C.merolae N.gruberi N.gruberi O.lucimarinus O.lucimarinus O.tauri O.tauri C.reinhardtii C.reinhardtii V.carteri V.carteri 3: muscle thinfilamenttropomyosin || P.patens P.patens

S.moellendorffii Plants S.moellendorffii S.bicolor S.bicolor Z.mays Z.mays O.sativa O.sativa B.distachyon B.distachyon A.lyrata A.lyrata A.thaliana A.thaliana L.japonicus L.japonicus M.truncatula M.truncatula V.vinifera V.vinifera P.trichocarpa P.trichocarpa R.communis R.communis T.trahens T.trahens D.discoideum D.discoideum A.macrogynus A.macrogynus S.punctatus S.punctatus M.globosa M.globosa U.maydis U.maydis C.neoformans C.neoformans 4: proteinaceous extracellular matrix P.chrysosporium P.chrysosporium S.commune S.commune C.cinerea C.cinerea L.bicolor L.bicolor S.pombe S.pombe B.fuckeliana B.fuckeliana S.sclerotiorum S.sclerotiorum F.graminearum F.graminearum M.grisea M.grisea N.crassa N.crassa P.anserina P.anserina P.chrysogenum P.chrysogenum A.clavatus A.clavatus A.fumigatus A.fumigatus N.fischeri N.fischeri A.flavus A.flavus A.oryzae A.oryzae A.niger A.niger A.nidulans Fungi A.nidulans U.reesii U.reesii C.immitis C.immitis C.posadasii C.posadasii P.nodorum P.nodorum T.melanosporum T.melanosporum Y.lipolytica Y.lipolytica P.pastoris P.pastoris C.lusitaniae C.lusitaniae D.hansenii D.hansenii M.guilliermondii M.guilliermondii S.stipitis S.stipitis L.elongisporus L.elongisporus C.tropicalis C.tropicalis C.albicans C.albicans C.dubliniensis C.dubliniensis

K.lactis K.lactis PRESENCE A.gossypii A.gossypii K.waltii K.waltii

L.thermotolerans L.thermotolerans GAIN Z.rouxii Z.rouxii V.polyspora V.polyspora C.glabrata C.glabrata S.bayanus S.bayanus S.mikatae S.mikatae S.cerevisiae S.cerevisiae S.paradoxus S.paradoxus S.arctica S.arctica C.owczarzaki C.owczarzaki M.brevicollis M.brevicollis S.rosetta S.rosetta

S.mansoni S.mansoni ABSENCE B.malayi B.malayi

C.briggsae C.briggsae LOSS C.elegans C.elegans D.pulex D.pulex A.pisum A.pisum P.humanus P.humanus A.mellifera A.mellifera N.vitripennis N.vitripennis B.mori B.mori T.castaneum T.castaneum D.melanogaster D.melanogaster D.pseudoobscura D.pseudoobscura A.gambiae A.gambiae A.aegypti A.aegypti

C.quinquefasciatus Metazoa C.quinquefasciatus B.floridae B.floridae T.adhaerens

T.adhaerens 0 Log-likelihood RatioScale S.purpuratus S.purpuratus H.magnipapillata H.magnipapillata 10 N.vectensis N.vectensis C.intestinalis C.intestinalis

D.rerio D.rerio 20 O.latipes O.latipes

F.rubripes F.rubripes 30 T.nigroviridis T.nigroviridis X.tropicalis X.tropicalis 40 G.gallus G.gallus M.gallopavo M.gallopavo

O.anatinus O.anatinus 50 M.domestica M.domestica S.scrofa S.scrofa 60 M.musculus M.musculus C.familiaris C.familiaris B.taurus B.taurus H.sapiens H.sapiens LLR 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 2.1 2.1 2.6 4.0 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 4.8 Notes 4 3 1 /2 PG E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E E D E Protein OR14A16 OR10Q1 OR52B2 OR51A7 OR4C13 OR52E8 OR52E4 OR51V1 OR51E2 OR51E1 OR10V1 OR51T1 OR51L1 OR4F29 OR4F21 OR4F16 OR10J1 OR14J1 OR51I2 OR51I1 OR4M2 OR4Q3 OR1G1 OR1N1 OR1D5 OR4D5 OR1C1 OR1A1 OR3A3 OR3A1 OR4E2 OR4F6 OR4F3 OR2T8 FFAR4 1: endocytic vesicle Num ofECMGenes:1.Predicted153 ECM 3,Geneset"VCBcomplex",Page3

Prokaryotes Prokaryotes Last CommonAncestor E.cuniculi E.cuniculi E.histolytica E.histolytica E.dispar E.dispar G.lamblia G.lamblia T.vaginalis T.vaginalis T.brucei T.brucei T.cruzi T.cruzi L.infantum L.infantum L.major L.major L.braziliensis L.braziliensis T.gondii T.gondii Protists C.hominis C.hominis C.parvum C.parvum B.bovis B.bovis T.annulata T.annulata T.parva T.parva P.knowlesi P.knowlesi P.vivax P.vivax P.falciparum P.falciparum P.chabaudi P.chabaudi P.berghei P.berghei P.yoelii P.yoelii P.tetraurelia P.tetraurelia T.thermophila T.thermophila P.infestans P.infestans T.pseudonana T.pseudonana P.tricornutum P.tricornutum C.merolae C.merolae N.gruberi N.gruberi O.lucimarinus O.lucimarinus O.tauri O.tauri C.reinhardtii C.reinhardtii V.carteri V.carteri P.patens P.patens

S.moellendorffii Plants S.moellendorffii S.bicolor S.bicolor Z.mays Z.mays O.sativa O.sativa B.distachyon B.distachyon A.lyrata A.lyrata A.thaliana A.thaliana L.japonicus L.japonicus M.truncatula M.truncatula V.vinifera V.vinifera P.trichocarpa P.trichocarpa R.communis R.communis T.trahens T.trahens D.discoideum D.discoideum A.macrogynus A.macrogynus S.punctatus S.punctatus M.globosa M.globosa U.maydis U.maydis C.neoformans C.neoformans P.chrysosporium P.chrysosporium S.commune S.commune C.cinerea C.cinerea L.bicolor L.bicolor S.pombe S.pombe B.fuckeliana B.fuckeliana S.sclerotiorum S.sclerotiorum F.graminearum F.graminearum M.grisea M.grisea N.crassa N.crassa P.anserina P.anserina P.chrysogenum P.chrysogenum A.clavatus A.clavatus A.fumigatus A.fumigatus N.fischeri N.fischeri A.flavus A.flavus A.oryzae A.oryzae A.niger A.niger A.nidulans Fungi A.nidulans U.reesii U.reesii C.immitis C.immitis C.posadasii C.posadasii P.nodorum P.nodorum T.melanosporum T.melanosporum Y.lipolytica Y.lipolytica P.pastoris P.pastoris C.lusitaniae C.lusitaniae D.hansenii D.hansenii M.guilliermondii M.guilliermondii S.stipitis S.stipitis L.elongisporus L.elongisporus C.tropicalis C.tropicalis C.albicans C.albicans C.dubliniensis C.dubliniensis

K.lactis K.lactis PRESENCE A.gossypii A.gossypii K.waltii K.waltii

L.thermotolerans L.thermotolerans GAIN Z.rouxii Z.rouxii V.polyspora V.polyspora C.glabrata C.glabrata S.bayanus S.bayanus S.mikatae S.mikatae S.cerevisiae S.cerevisiae S.paradoxus S.paradoxus S.arctica S.arctica C.owczarzaki C.owczarzaki M.brevicollis M.brevicollis S.rosetta S.rosetta

S.mansoni S.mansoni ABSENCE B.malayi B.malayi

C.briggsae C.briggsae LOSS C.elegans C.elegans D.pulex D.pulex A.pisum A.pisum P.humanus P.humanus A.mellifera A.mellifera N.vitripennis N.vitripennis B.mori B.mori T.castaneum T.castaneum D.melanogaster D.melanogaster D.pseudoobscura D.pseudoobscura A.gambiae A.gambiae A.aegypti A.aegypti

C.quinquefasciatus Metazoa C.quinquefasciatus B.floridae B.floridae T.adhaerens

T.adhaerens 0 Log-likelihood RatioScale S.purpuratus S.purpuratus H.magnipapillata H.magnipapillata 10 N.vectensis N.vectensis C.intestinalis C.intestinalis

D.rerio D.rerio 20 O.latipes O.latipes

F.rubripes F.rubripes 30 T.nigroviridis T.nigroviridis X.tropicalis X.tropicalis 40 G.gallus G.gallus M.gallopavo M.gallopavo

O.anatinus O.anatinus 50 M.domestica M.domestica S.scrofa S.scrofa 60 M.musculus M.musculus C.familiaris C.familiaris B.taurus B.taurus H.sapiens H.sapiens LLR 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 Notes 1 PG E C E E E E E E E E D D E E E E E E E E E E E E E E E E E E E E E E E Protein OR10W1 OR2AK2 OR2AE1 OR11H4 OR10A4 OR2A25 OR10A2 OR5H15 OR5H14 OR52K1 OR52H1 OR7E24 P2RY13 P2RY12 SKIDA1 OR5M8 OR8G5 OR9G9 OR8U8 OR8U1 OR8H2 OR7D4 OR6C1 OR6B1 OR5R1 OR5K4 OR5K2 OR5K1 OR5H1 OR1S2 OR1S1 OR6V1 OR6S1 OR5V1 OR5P3 Num ofECMGenes:1.Predicted153 ECM 3,Geneset"VCBcomplex",Page4

Prokaryotes Prokaryotes Last CommonAncestor E.cuniculi E.cuniculi E.histolytica E.histolytica E.dispar E.dispar G.lamblia G.lamblia T.vaginalis T.vaginalis T.brucei T.brucei T.cruzi T.cruzi L.infantum L.infantum L.major L.major L.braziliensis L.braziliensis T.gondii T.gondii Protists C.hominis C.hominis C.parvum C.parvum B.bovis B.bovis T.annulata T.annulata T.parva T.parva P.knowlesi P.knowlesi P.vivax P.vivax P.falciparum P.falciparum P.chabaudi P.chabaudi P.berghei P.berghei P.yoelii P.yoelii P.tetraurelia P.tetraurelia T.thermophila T.thermophila P.infestans P.infestans T.pseudonana T.pseudonana P.tricornutum P.tricornutum C.merolae C.merolae N.gruberi N.gruberi O.lucimarinus O.lucimarinus O.tauri O.tauri C.reinhardtii C.reinhardtii V.carteri V.carteri P.patens P.patens

S.moellendorffii Plants S.moellendorffii S.bicolor S.bicolor Z.mays Z.mays O.sativa O.sativa B.distachyon B.distachyon A.lyrata A.lyrata A.thaliana A.thaliana L.japonicus L.japonicus M.truncatula M.truncatula V.vinifera V.vinifera P.trichocarpa P.trichocarpa R.communis R.communis T.trahens T.trahens D.discoideum D.discoideum A.macrogynus A.macrogynus S.punctatus S.punctatus M.globosa M.globosa U.maydis U.maydis C.neoformans C.neoformans P.chrysosporium P.chrysosporium S.commune S.commune C.cinerea C.cinerea L.bicolor L.bicolor S.pombe S.pombe B.fuckeliana B.fuckeliana S.sclerotiorum S.sclerotiorum F.graminearum F.graminearum M.grisea M.grisea N.crassa N.crassa P.anserina P.anserina P.chrysogenum P.chrysogenum A.clavatus A.clavatus A.fumigatus A.fumigatus N.fischeri N.fischeri A.flavus A.flavus A.oryzae A.oryzae A.niger A.niger A.nidulans Fungi A.nidulans U.reesii U.reesii C.immitis C.immitis C.posadasii C.posadasii P.nodorum P.nodorum T.melanosporum T.melanosporum Y.lipolytica Y.lipolytica P.pastoris P.pastoris C.lusitaniae C.lusitaniae D.hansenii D.hansenii M.guilliermondii M.guilliermondii S.stipitis S.stipitis L.elongisporus L.elongisporus C.tropicalis C.tropicalis C.albicans C.albicans C.dubliniensis C.dubliniensis

K.lactis K.lactis PRESENCE A.gossypii A.gossypii K.waltii K.waltii

L.thermotolerans L.thermotolerans GAIN Z.rouxii Z.rouxii V.polyspora V.polyspora C.glabrata C.glabrata S.bayanus S.bayanus S.mikatae S.mikatae S.cerevisiae S.cerevisiae S.paradoxus S.paradoxus S.arctica S.arctica C.owczarzaki C.owczarzaki M.brevicollis M.brevicollis S.rosetta S.rosetta

S.mansoni S.mansoni ABSENCE B.malayi B.malayi

C.briggsae C.briggsae LOSS C.elegans C.elegans D.pulex D.pulex A.pisum A.pisum P.humanus P.humanus A.mellifera A.mellifera N.vitripennis N.vitripennis B.mori B.mori T.castaneum T.castaneum D.melanogaster D.melanogaster D.pseudoobscura D.pseudoobscura A.gambiae A.gambiae A.aegypti A.aegypti

C.quinquefasciatus Metazoa C.quinquefasciatus B.floridae B.floridae T.adhaerens

T.adhaerens 0 Log-likelihood RatioScale S.purpuratus S.purpuratus H.magnipapillata H.magnipapillata 10 N.vectensis N.vectensis C.intestinalis C.intestinalis

D.rerio D.rerio 20 O.latipes O.latipes

F.rubripes F.rubripes 30 T.nigroviridis T.nigroviridis X.tropicalis X.tropicalis 40 G.gallus G.gallus M.gallopavo M.gallopavo

O.anatinus O.anatinus 50 M.domestica M.domestica S.scrofa S.scrofa 60 M.musculus M.musculus C.familiaris C.familiaris B.taurus B.taurus H.sapiens H.sapiens LLR 0.9 1.1 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 1.3 Notes PG J J E E I I H E D A H Protein 100510323 100510232 BHLHA9 PLXNA4 OR2A14 ZMYM3 OR4B1 GPR31 SATB1 SATB2 OR2T1 TCF24 HES7 HEY1 1: semaphorinreceptorcomplex|| Num ofECMGenes:1.Predicted153 ECM 3,Geneset"VCBcomplex",Page5

Prokaryotes Prokaryotes Last CommonAncestor E.cuniculi E.cuniculi E.histolytica E.histolytica E.dispar E.dispar G.lamblia G.lamblia T.vaginalis T.vaginalis T.brucei T.brucei T.cruzi T.cruzi L.infantum L.infantum L.major L.major L.braziliensis L.braziliensis T.gondii T.gondii Protists C.hominis C.hominis C.parvum C.parvum B.bovis B.bovis T.annulata T.annulata T.parva 2: histonedeacetylasecomplex|| T.parva P.knowlesi P.knowlesi P.vivax P.vivax P.falciparum P.falciparum P.chabaudi P.chabaudi P.berghei P.berghei P.yoelii P.yoelii P.tetraurelia P.tetraurelia T.thermophila T.thermophila P.infestans P.infestans T.pseudonana T.pseudonana P.tricornutum P.tricornutum C.merolae C.merolae N.gruberi N.gruberi O.lucimarinus O.lucimarinus O.tauri O.tauri C.reinhardtii C.reinhardtii V.carteri V.carteri P.patens 3: nuclearmatrix|| P.patens

S.moellendorffii Plants S.moellendorffii S.bicolor S.bicolor Z.mays Z.mays O.sativa O.sativa B.distachyon B.distachyon A.lyrata A.lyrata A.thaliana A.thaliana L.japonicus L.japonicus M.truncatula M.truncatula V.vinifera V.vinifera P.trichocarpa P.trichocarpa 4: nuclearheterochromatin|| R.communis R.communis T.trahens T.trahens D.discoideum D.discoideum A.macrogynus A.macrogynus S.punctatus S.punctatus M.globosa M.globosa U.maydis U.maydis C.neoformans C.neoformans P.chrysosporium P.chrysosporium S.commune S.commune C.cinerea C.cinerea L.bicolor L.bicolor S.pombe S.pombe B.fuckeliana B.fuckeliana S.sclerotiorum S.sclerotiorum F.graminearum F.graminearum 5: PMLbody M.grisea M.grisea N.crassa N.crassa P.anserina P.anserina P.chrysogenum P.chrysogenum A.clavatus A.clavatus A.fumigatus A.fumigatus N.fischeri N.fischeri A.flavus A.flavus A.oryzae A.oryzae A.niger A.niger A.nidulans Fungi A.nidulans U.reesii U.reesii C.immitis C.immitis C.posadasii C.posadasii P.nodorum P.nodorum T.melanosporum T.melanosporum Y.lipolytica Y.lipolytica P.pastoris P.pastoris C.lusitaniae C.lusitaniae D.hansenii D.hansenii M.guilliermondii M.guilliermondii S.stipitis S.stipitis L.elongisporus L.elongisporus C.tropicalis C.tropicalis C.albicans C.albicans C.dubliniensis C.dubliniensis

K.lactis K.lactis PRESENCE A.gossypii A.gossypii K.waltii K.waltii

L.thermotolerans L.thermotolerans GAIN Z.rouxii Z.rouxii V.polyspora V.polyspora C.glabrata C.glabrata S.bayanus S.bayanus S.mikatae S.mikatae S.cerevisiae S.cerevisiae S.paradoxus S.paradoxus S.arctica S.arctica C.owczarzaki C.owczarzaki M.brevicollis M.brevicollis S.rosetta S.rosetta

S.mansoni S.mansoni ABSENCE B.malayi B.malayi

C.briggsae C.briggsae LOSS C.elegans C.elegans D.pulex D.pulex A.pisum A.pisum P.humanus P.humanus A.mellifera A.mellifera N.vitripennis N.vitripennis B.mori B.mori T.castaneum T.castaneum D.melanogaster D.melanogaster D.pseudoobscura D.pseudoobscura A.gambiae A.gambiae A.aegypti A.aegypti

C.quinquefasciatus Metazoa C.quinquefasciatus B.floridae B.floridae T.adhaerens

T.adhaerens 0 Log-likelihood RatioScale S.purpuratus S.purpuratus H.magnipapillata H.magnipapillata 10 N.vectensis N.vectensis C.intestinalis C.intestinalis

D.rerio D.rerio 20 O.latipes O.latipes

F.rubripes F.rubripes 30 T.nigroviridis T.nigroviridis X.tropicalis X.tropicalis 40 G.gallus G.gallus M.gallopavo M.gallopavo

O.anatinus O.anatinus 50 M.domestica M.domestica S.scrofa S.scrofa 60 M.musculus M.musculus C.familiaris C.familiaris B.taurus B.taurus H.sapiens H.sapiens LLR 0.3 0.3 0.4 0.4 0.5 0.5 0.6 0.6 0.6 0.6 0.6 0.9 0.9 0.9 Notes 3 /45 2 /3 1