<<

INSTITUTO DE BIOCIÊNCIAS

RODRIGO LIGABUE BRAUN

UREASES : MA NÁLISE OMPARATIVA U A C

DRA . C ÉLIA REGINA RIBEIRO DA SILVA CARLINI Orientadora

DRA . E VELYN KOECHE SCHROEDER Coorientadora

PORTO ALEGRE

2008

RODRIGO LIGABUE BRAUN

UREASES :

UMA ANÁLISE COMPARATIVA

Monografia apresentada como requisito parcial para obtenção do grau de Bacharel em Ciências Biológicas–ÊnfaseMolecular,CelulareFuncional. UniversidadeFederaldoRioGrandedoSul InstitutodeBiociências;DepartamentodeBiofísica e Centro de Biotecnologia do Estado do Rio GrandedoSul. DRA . C ÉLIA REGINA RIBEIRO DA SILVA CARLINI Orientadora

DRA . E VELYN KOECHE SCHROEDER Coorientadora

PORTO ALEGRE

2008

Figura da capa: estrutura tridimensional da isoforma alternativa (JBUREIIB) da urease de Canavalia ensiformis , colorida de acordo com a sucessão da estrutura secundária (Nterminal: azul, Cterminal: vermelho)

Agradecimentos Agradeço especialmente às minhas orientadoras, por terem me acolhido e direcionado, sendo sempresinceras,construtivasedivertidas. Agradeço, também, aos colegas do Laprotox, por sempremeincentivarem(diretaouindiretamente), e aos membros do Grupo de Bioinformática Estrutural (CBiot, UFRGS), por estarem sempre dispostosacompartilharseusconhecimentos. Por fim, agradeço a BDGIJLLLMPVW , por permanecerem comigo ao longo de todo esse processo.

“The effort to understand the universe is one of the very few things that lifts human life a little above the level of farce, and gives it some of the grace of tragedy”

Steven Weinberg

Nota: com a finalidade de tornar o texto mais fluido e informativo ao leitor, preferiuse adotar um formato diferenciado para a presente monografia. Os resultadosobtidosesuadiscussãoforamcombinadoseconstiuemumaseção únicadotrabalho.Estaseçãotambémabordaalgunsaspectosmetodológicos específicos.

RESUMO Ureases (EC 3.5.1.5) são enzimas níqueldependentes que catalisam a hidrólise da uréia em amônia e dióxido de carbono. São amplamente distribuídas em plantas, fungos e bactérias. Em plantas e fungos, as ureases são homopolímeros de subunidades contendo cerca de 840 resíduos de aminoácidos, formando hexâmeros ou trímeros. Em bactérias,asureasespossuemduasoutrêssubunidadesmenores,que sealinhamnacadeiapolipeptídicaúnicadasureases vegetais, com as quais têm 5060% de identidade de seqüência. Para terse uma visão geral das relações que podem ser estabelecidas entre as ureases, buscando padrões, similaridades e diferenças que possam auxiliar na análiseeprediçãodosresultadosexperimentais,foirealizadaumaampla análisedasseqüênciasdenucleotídeoseaminoácidosdeureases.Após busca, extração, interpretação e edição destas, árvores filogenéticas foramconstruídas.Pormeiodealinhamentosdeseqüência múltiplos, a grandesimilaridadeentreasseqüênciasoriundasdeplantasefungosfoi confirmada,epermitiuaanálisedasregiõesdeconservaçãopróximasao sítioativo,alémdaverificaçãodaconservaçãodetodososresíduosde aminoácidosconsideradosessenciaisparaatividadecatalíticadaenzima. Diferençasforamencontradasnasregiõescorrespondentesaopeptídeo entomotóxico originalmente descrito para a urease de Canavalia ensiformis L.(feijãodeporco).Comoasestruturasdeureasesdeplantas e fungos não foram ainda determinadas, um modelo de urease de C. ensiformis foi construído por modelagem molecular comparativa, utilizandocomomoldeumaestruturadeureasebacteriana.Omodelofoi avaliado e utilizado para determinar a localização espacial do peptídeo entomotóxicoedosresíduosessenciaisparaacatálise. Palavraschave: ureases–filogenia–modelagemmolecularcomparativa ABSTRACT

Ureases (EC 3.5.1.5) are nickeldependent enzymes which catalyze hydrolysis of urea to ammonia and carbon dioxide. They are found in plants,fungiand.Inplantsandfungi,ureasesarehomopolymers ofsubunitswith~840aminoacids,forminghexamersortrimers.Bacterial ureaseshavetwoorthreesmallersubunitswhichalignwithinthesingle chainofplantsandfungiureaseswith5060%sequenceidentity.Toset an overview of relationships that can beestablished among ureases, in searchforpatterns,similaritiesanddifferencesthatmayhelpanalysisand predictionofexperimentalresults,acomprehensiveanalysisofaminoacid and nucleotide sequences of ureases was carried out. After search, extraction,interpretationandeditionofthesesequences,theywereused to build phylogenetic trees. By means ofmultiplesequence alignments, the high level of similarity among plant and fungi sequences was confirmed,allowinganalysisofconservationofregionsneartheactivesite and confirming the conservation of all residues taken as essential for catalysis. Differences were found in regions related to the entomotoxic peptideoriginallydescribedfor Canavalia ensiformis L.(jackbean).Since structuresofplantsandfungiureasesarestillnotsolved,amodelfora C. ensiformis ureasewasbuiltviacomparativemolecularmodeling using a bacterialureasestructureastemplate.Themodelwasevaluatedandused tospatiallylocatetheentomotoxicpeptideandthoseresiduesessentialfor catalysis. Keywords: ureases–phylogeny–comparativemolecularmodeling

LISTA DE FIGURAS E TABELAS

Figura1:Esquemadareaçãocatalisadapelasureases...... 13 Figura2:Comparaçãoesquemáticadassubunidadesestruturaisdasureasesdeorganismos selecionados ...... 15 Tabela1:Seqüênciasdeaminoácidosdeureasesutilizadasnestetrabalho...... 23 Figura3:Relaçãoevolutivaentre24seqüênciasdeaminoácidosdeureases...... 27 Figura4:Relaçãoevolutivaentre22seqüênciasdenucleotídeosdeureases...... 28 Figura5:Alinhamentomúltiplodeseqüênciasdeaminoácidosdeureasesoriundasdeplantas...... 31 Figura6:Alinhamentomúltiplodeseqüênciasdeaminoácidosdeureasesoriundasdefungosede C. ensiformis ,paracomparação...... 34 Figura7:alinhamentomúltiplodeseqüênciasdeaminoácidosdasubunidadeCdeureasesoriundasde bactériasedaregiãocorrespondentenaJBUREIIBenaisoformamajoritáriadeureasede C. ensiformis ...... 40 Figura8:Passosnamodelagemcomparativaporhomologia...... 43 Figura9:MapadeRamachandranparaasestruturasdomoldeedomodelo...... 46 Figura10:ResultadosdoVerify3Dtranspostosàsestruturastridimensionaisdomoldeedomodelo.. .47 Figura11:EstruturatridimensionaldomodelodeJBUREIIB,coloridodeacordocomaestrutura secundária...... 48 Figura12:SobreposiçãodomodelodaJBUREIIBcomseumolde2UBP...... 48 Figura13:EstruturatridimensionaldomodelodeJBUREIIB...... 48 Figura14:Representaçãoespacialdosresíduosdosítiocatalíticoconservadosemtodasas seqüênciasdeureasesanalisadas,dosátomosdeníqueledo cluster deágua...... 50 Figura15:Sobreposiçãodosresíduosdosítiocatalíticoconservadosemtodasasseqüênciasde ureasesanalisadas ...... 50 Figura16:DistribuiçãodasdiferentesclassesdeaminoácidosnaJBUREIIBenaureasede Bacillus pasteurii ...... 51 Figura17:PrediçãodaestruturasecundáriadopeptídeoentomotóxicoderivadodaJBUREIIB. ...... 52 Figura18:DeterminaçãodaestruturasecundáriadaJBUREIIBapartirdomodelotridimensional construídonestetrabalho...... 53 Figura19:PrediçãodaestruturasecundáriadaJBUREIIBapartirdesuaseqüênciaprimária...... 54

LISTA DE ABREVIATURAS E SIGLAS

2UBP estruturatridimensionaldaureasede Bacillus pasteurii emsuasconformação nativa cDNA DNAcomplementar CNTX canatoxina Jaburetox jack bean urease toxin Jaburetox-2Ec jack bean urease toxin 2[expressadaem] E. coli JBURE-I jack bean urease I(ureasede Canavalia ensiformis ,isoformapredominante) JBURE-II jack bean urease II(ureasede C. ensiformis ,isoformaalternativatruncada) JBURE-IIB jack bean urease IIB(ureasede C. ensiformis ,isoformaalternativa) KCX lisinacarbamilada NCBI NationalCenterforBiotechnologyInformation NJ neighbor-joining OTU unidadetaxonômicaoperacional PDB ProteinDataBank Pepcanatox peptídeoderivadodacanatoxina Pré-mRNA precursordomRNAmaduro RMN ressonânciamagnéticanuclear UPGMA unweighted pair group method with arithmetic means UreD-K proteínasacessóriasdasureases

ÍNDICE

1.Introdução...... 13 1.1Ureases...... 13 1.2Ureasesde Canavalia ensiformis ...... 16 1.3Justificativa...... 17 2.Objetivos...... 18 3.Metodologia ...... 19 3.1Seqüênciaprimáriaeinferênciafilogenética ...... 19 3.2Modelagemmolecularcomparativa...... 21 4.ResultadoseDiscussão ...... 23 4.1Inferênciafilogenética...... 23 4.2Comparaçãodeseqüênciasprimárias ...... 30 4.3Determinaçãodeestruturasterciáriasdeproteínas...... 42 4.4Modelagemmolecularcomparativa...... 42 4.5Estruturatridimensionaldasureases...... 47 5.Conclusõeseperspectivas...... 56 6.Referênciasbibliográficas...... 57 APÊNDICES...... 63 APÊNDICEA:arquivosdeentradautilizadosnoprogramaModeller9v4...... 64 APÊNDICEB:listagemdasseqüênciasaminoácidosdeureasesbacterianasobtidasnopresente trabalho...... 65 APÊNDICEC:Tabelacomparativadedadoscinéticosparaureases...... 70

13

1. Introdução 1.1 Ureases Ureases(uréiaamidohidrolases,EC3.5.1.5)sãoenzimasníqueldependentes quecatalisamahidrólisedauréiaemamôniaedióxidodecarbono( Zerner,1991 ),a umataxa10 14 vezesmaisrápidaqueareaçãonãocatalisada( Andrews et al .,1984 ; Mobley et al .,1995 ).Omecanismocatalíticocontinuasendodeinteresse,poisnão está definido se a reação envolve um intermediário do tipo ácido carbâmico, um intermediáriocianatoouseelaprocedepordecomposiçãodireta( Benini et al .,1999 ; Todd&Hausinger,2000 ; Estiu et al .,2006 ).Sabesequeareaçãonãocatalisada ocorre por um mecanismo de eliminação, tendo sido identificado um carbamato comointermediário( Barrios&Lippard,2001 ; Estiu et al .,2006 )(Figura1 ).

Figura 1: Esquemadareaçãocatalisadapelasureases(adaptadodeEstiu et al .,2006). Tantoauréiaquantoaureaserepresentammarcosdainvestigaçãocientífica (Mobley et al .,1995 ).Auréiafoiaprimeiramoléculaasersintetizada,em1828por FriedrichWöhler( Andrews et al .,1984 ),eaureasede Canavalia ensiformis (feijão deporcoou jack bean )foiaprimeiraenzimaasercristalizada(Sumner,1926 ),além detersidoaprimeiraenzimacompresençadeníqueldemonstrada( Dixon,1975 ). O papel principal da urease é permitir que os organismos utilizem a uréia, geradainternaouexternamente,comofontedenitrogênio( Jabri et al .,1995 ).Além deste papel, todavia, as ureases apresentam grande versatilidade de aplicações, podendoatuarnotransportedenitrogênioedefesaemplantasenaneutralização doambientegástricodemamíferosparacolonizaçãobacteriana( Ha et al. ,2001 ). Alémdasplantas,algumasbactérias,fungosepossivelmenteinvertebrados sintetizam ureases. As ureases animais são pouco caracterizadas, tendo sido 14 identificadas como coadjuvantes no processo de formação de inclusões de carbonatodecálcionomolusco Aplysia californica ( Pedrozo,1996a,b ).Épossível, nesse caso, que a urease seja oriunda de alguma bactéria simbionte, e não produzidapeloprópriomolusco.Alémdisso,foidemonstradoqueobichodaseda (Bombyx mori ) não sintetiza urease, utilizando em seu metabolismo a enzima absorvidadadieta(constituídaexclusivamenteporfolhasdaamoreira Morus alba ), indicandoqueaureasepassaintactadointestinoàhemolinfa,estandoassociadaà degradaçãodeuréiaapósoestádioingestivodoinseto( Hirayama,2000a ). As ureases têm papel importante na patogênese de várias espécies bacterianas, incluindo , Staphylococcus saprophiticus , e Ureaplasma urealiticum ( Mobley et al ., 1995 ). O exemplo mais freqüentenaliteraturaéodaureasede ( Sirko&Brodzik,2000 ), por seu papel essencial na patogênese desse microorganismo, além de sua alta prevalência como patógeno humano ( Eaton et al ., 1991 ). Os melhores dados estruturais, entretanto, estão disponíveis para ( Jabri et al ., 1995 ). Atividade ureásica foi encontrada em várias espécies de fungos, mas a descrição genética correspondente está disponível para apenas algumas delas (Sirko&Brodzik,2000 ).Exemplosincluemopatógenohumano Coccidioides immitis (Yu et al .,1997 )e Schizosaccharomyces pombe ( Tange&Niwa,1997 ). Emrelaçãoaureasesdeplantas,osdadosgenéticosmaisabrangentesestão disponíveis para soja ( Glycine max ) ( Polacco & Holland, 1993 ; 1994 ). Genes separados,quecodificamduasisoformasdaurease,umaubíquaeumaembrião específica,assimcomogenesnãoligados,codificadores de proteínasacessórias, foram identificados em soja ( MeyerBothling & Polacco, 1987 ). A urease embrião específicaéumaproteínaabundanteemsementesdeváriasespéciesdeplantas, incluindosoja,feijãodeporco( Polacco&Holland,1994 )e Arabidopsis ( Zonia et al ., 1995 ),enquantoaformaubíquaéencontradaembaixasquantidadesnostecidos vegetativos da maioria das plantas ( Sirko & Brodzik, 2000 ). Bioquimicamente, a ureasevegetalmelhorcaracterizadaéade C. ensiformis ( Hirai et al .,1993 ;Karmali &Domingos,1993 ;Riddles et al .,1991 ;Takishima et al .,1988 ).Recentemente,a urease das folhas da amoreira M. alba também foi purificada e caracterizada (Hyraiama, 2000b ), bem como a urease das sementes de algodão, Gossypium hirsutum ( Menegassi et al .,2008 ). 15

A alta similaridade das seqüências primárias (5060%) indica que todas as ureases devem ser variantes da mesma enzima e que, por isso, devem possuir estruturas terciárias e mecanismos catalíticos similares ( Mobley et al ., 1995 ). Estruturalmente,asureasesbacterianassãomultímerosformadosporcomplexosde duasoutrêssubunidades,sendoexemplos,respectivamente, Helicobater pylori e K. aerogenes .Emplantasefungos,aenzimaéhomooligomérica,sendoformadapor subunidadesidênticasdeaproximadamente90kDa.( Mobley et al .,1995 ; Tange& Niwa,1997 )(Figura2 ).Aureasede C. ensiformis existecomohomotrímero,capaz de agregarse em homohexâmeros. As ureases bacterianas possuem estruturas similaresàsdaureasede C. ensiformis ,sendotrímerosouhexâmerosdecomplexos desubunidades,podendotambémexistirnaformadeagregados( Sirko&Brodzik, 2000 ).OsítiocatalíticoencontrasenasubunidadeC daenzimade K. aerogenes e nasregiõescolineares(Figura2 )dasureasesdosoutrosorganismos 1.

Figura 2: Comparaçãoesquemáticadassubunidadesestruturaisdasureasesdeorganismosselecionados.Onúmerode aminoácidoséapresentadoàdireita(adaptadodeSirko&Brodzik,2000) Cadasubunidadecatalíticacontémnosítioativodoisíonsdeníquelque,no casodaureasecristalizadade K. aerogenes ,estãoseparadospor3.5Å( Jabri et al ., 1995 ).Nestaenzima,umátomodeníquelestáligadoadoisresíduosdehistidina (His246eHis272),enquantoosegundoátomodeníquelestáligadoatrêsresíduos: duashistidinas(His134eHis136)eumácidoaspártico(Asp360).Alémdestes,um ligantecarbamato,derivadodaLys217interagecomosdoisíonsdeníquel( Mobley et al .,1995 ).Oprocessodeincorporaçãodeníquelrequeraparticipaçãodemuitas proteínas acessórias (ouativadoras),queparecemagircomochaperonasurease específicas( Mobley et al .,1995 ).Taisproteínassãonecessáriasparaamontagem

1Anomenclaturadassubunidadesdasureaseséencontradadeduasmaneirasnaliteratura:utilizandocaracteresromanos egregos.AssubunidadesA,BeCsãoequivalentesàssubunidades γ, βe α,respectivamente.Nopresentetrabalho,os caracteresgregosserãoreservadosparaadiscriminaçãodosdomíniosdasureasesmonoméricas. 16 de uma urease ativa, tanto em bactérias quanto em plantas ( Polacco & Holland, 1994 ; Mobley et al .,1995 ). Até o momento, apenas ureases bacterianas tiveram suas estruturas tridimensionaisdefinidasporcristalografiaderaiosX.Asestruturasdasenzimasde K. aerogenes (códigoPDB1FWJ), Bacillus pasteurii (códigoPDB2UBP)e H. pylori (códigoPDB1E9Z)foramdeterminadaseanalisadas(Jabri et al .,1995 ; Benini et al ., 1999 ; Ha et al .,2001 ).Mesmosendoaprimeiraenzimacristalizada( Sumner,1926 ), apenasacristalizaçãoeaanálisepreliminarporraiosXdaureasede C. ensiformis foramdescritas( Jabri et al .,1992 ; Sheridanetal.,2002 ).Dadospreliminaressobre cristalização da urease de Cajanus cajan (feijãoguandu) foram publicados recentemente( Balasubramanian&Ponnuraj,2008 ). 1.2 Ureases de Canavalia ensiformis Assimcomoasoja,a C. ensiformis tambémapresentaisoformasdeurease (PiresAlves et al ., 2003 ). Inicialmente, determinaramse a seqüência primária da mais abundante urease de feijãodeporco, com 840 aminoácidos ( Mamiya et al ., 1985 ), e a seqüência nucleotídica de seu cDNA ( Riddles et al ., 1991 ). ConvencionousechamarestaureasedeJBUREI( jack bean urease I ). Posteriormente, mostrouse que a canatoxina (CNTX), uma proteína neurotóxica(dímerodesubunidadesde95kDa),éumaisoformadaureasede C. ensiformis (Carlini et al ., 1997 ; Follmer et al ., 2001 ). A canatoxina apresenta atividade inseticida, sugerindo que as ureases podem estar envolvidas na defesa das plantas ( FerreiraDaSilva et al ., 2000 ; Carlini & GrossideSá, 2002 ). As principaisisoformasdeureasedefeijãodeporcoeaureaseembriãoespecíficade soja (mas não a urease bacteriana de B. pasteurii ) também apresentaram propriedadesinseticidasemtestescom Dysdercus peruvianus (pragadaculturade algodão).Oefeitoentomotóxicodasureaseséindependentedaatividadeureolítica (Follmer et al ., 2004 ). Sua toxicidade se baseia em um peptídeo interno (pepcanatox),com10kDa,liberadopelahidrólisedacanatoxinaporcatepsinasdo trato digestório de insetos suscetíveis ( Carlini et al ., 1997 ; FerreiraDaSilva et al ., 2000 ). Uma possível terceira isoformadeureasede C. ensiformis , a JBUREII, foi proposta, baseada em cDNA clonado. A JBUREII apresentaria uma cadeia 17 polipeptídica mais curta (78kDa) que todas as ureases vegetais ou fúngicas conhecidas, um ponto isoelétrico teórico mais básico e seqüência nucleotídica diferindodaqueladisponívelparacanatoxina( PiresAlves et al .,2003 ).Emestudo posterior, Mulinari ( 2008 ) identificou uma forma alternativa da JBUREII clonada originalmente, com diferenças de seqüência nas regiões 3’ e 5’. Há indícios de possívelocorrênciade splicing alternativodoprémRNAdeJBUREII,especialmente naregião5’.Aocorrênciaextensivade splicing alternativonoprémRNAdogenede ureasedebatatainglesa( Solanum tuberosum )( Witte et al .,2005 )apóiaestateoria. Aindaassim,ahipótesedeterocorridoumseqüenciamentoincompletodaJBURE II, resultando em uma proteína truncada no estudo inicial, não foi descartada. A formaalternativadeJBUREIIanalisadapor Mulinari ( 2008 )foi,então,chamadade JBUREIIB. Umpeptídeorecombinante,equivalenteaopepcanatoxecompropriedades inseticidasmuitosimilares,foiobtidoporclonagemeexpressãoheterólogadeum fragmentoequivalentedecDNAdeJBUREIIB( Mulinari et al .,2007 ).Essepeptídeo recombinantefoichamadodeJaburetox2Ec( Jack bean urease toxin 2 [expressada em] E. coli ). 1.3 Justificativa Apesar da grande quantidade de informações a respeito de ureases em particular,poucosesabearespeitodasrelaçõesquepodemserestabelecidasentre elas. Nesse contexto, uma ampla análise das seqüências de nucleotídeos e aminoácidos de ureases, buscando padrões, similaridades e diferenças, pode auxiliarnaanáliseeprediçãodosresultadosexperimentais,tantodaquelesobtidos no Laboratório de Proteínas Tóxicas (UFRGS), quanto daqueles já descritos na literatura. Além disso, a modelagem de uma urease de interesse (no caso, uma urease de C. ensiformis ) pode contornar o problema da nãodisponibilidade de estruturastridimensionaisdeureasesdeplantasefungos.Aprediçãodaestrutura tridimensional pode, ainda, esclarecer certos aspectos referentes a essa urease, comoaconformaçãodeseupeptídeoentomotóxicoedasregiõesdaproteínaque encontramseausentesnasureasesbacterianas. 18

2. Objetivos O presente trabalho teve comoobjetivoprincipalo estudo comparativo das ureases,apartirdedadosjádisponíveisaseurespeito,eoestudocomputacional de uma das ureases de C. ensiformis , buscando evidenciar similaridades e diferenças entre as ureases já estudadas, bem como guiar futuros estudos comparativosemrelaçãoaessaenzima. Comoobjetivosecundário,estetrabalhoprocurafazerumabreverevisãodas técnicasnecessáriasparaodesenvolvimentodesteprojetoeparaainterpretação dosresultadosdeleobtidos. 19

3. Metodologia 3.1 Seqüência primária e inferência filogenética Inicialmente, foi realizada uma busca por seqüências de aminoácidos referentes à palavrachave “urease” na base de dados de proteínas do National Center for Biotechnology Information NCBI ( Wheeler et al ., 2008 ) (http://www.ncbi.nlm.nih.gov). As seqüências foram baixadas em blocos de duzentas, no dia 15 de novembro de 2007. As 9046 seqüências obtidas foram agrupadas em arquivos de texto, contendo mil seqüências cada. Estes arquivos serviramdebaseparaasetapassubseqüentesdotrabalhoeforamverificados,de maneiraautomatizadaounão,diversasvezes,comdiferentesintenções. Inicialmente, buscaramse seqüências de proteínas acessórias das ureases (UreDK)presentesentreasseqüênciasobtidas.Todaselasforamremovidasda listagem.Aseguir,cadablocofoiinspecionadovisualmente,buscandoseqüências detamanhoincomum.Cadaseqüênciaselecionadafoi comparadaàsdemais,via Blast ( Altschul et al ., 1997 ), tendo destinos diferentes conforme a situação. Seqüênciascurtassemequivalentesoriundosdamesmaespécieforamexcluídas, porseremresultadodepossíveisseqüenciamentosincompletos.Seqüênciascurtas com seqüências equivalentes maiores, oriundas da mesma espécie, foram agrupadasjuntoaessas. Todasasseqüênciasnãoúnicas,oriundasdeummesmoorganismo,foram agrupadas,comparadasporalinhamentosmúltiplosviaClustalW( Larkin et al .,2007 ) (http://npsapbil.ibcp.fr/cgibin/npsa_automat.pl?page=/NPSA/npsa_clustalw.html) e, apartirdestacomparação,umadasseqüênciasfoieleitacomoseqüênciatipo(ou seja,aquelaquerepresentavademaneiramaissatisfatóriaaureaseemquestão). Esteciclo,deagrupamento,comparaçãoeseleçãodaseqüênciatipo,foirepetido paraamaioriadasseqüências.Nocasodebactérias,cadasubunidadefoitratada independentemente,comasseqüênciasdasduasoutrêssubunidadesoriundasde cadabactériasendoagrupadasaofinaldoprocesso.Casosespeciais,comoodas diferentes ureases de batatainglesa ( S. tuberosum ), foram analisados posteriormente. Após o refinamento de todas as seqüências, com cada organismo sendo associado a apenas uma seqüência de aminoácidos (para cada uma de suas subunidades de urease), a nomenclatura científica dos organismos foi substituída porumcódigo,geralmenteformadoporseiscaracteres.Aseguir,umabuscapelas 20 seqüências de desoxirribonucleotídeos correspondentes às seqüênciastipo de plantas e fungos e de algumas bactérias selecionadas foi realizada na base de dados de nucleotídeos do NCBI.Paramelhorvisualização, foi estabelecida uma listagem,contendooorganismofonte,ocódigodoorganismo,areferênciainterna doNCBIparaaseqüênciatipo,indicaçãosobreadisponibilidadedaseqüênciade DNAcorrespondenteàseqüênciadeaminoácidosselecionadaeotáxonaoqualo organismopertence. Apósestaremtodascatalogadas,asseqüênciasdeaminoácidosdeplantas, fungos e de algumas bactérias selecionadas ( Helicobacter pylori , , Klebsiella aerogenes , Klesbiella pneumoniae , Bacillus pasteurii , Bacillus subtilis )foramalinhadaspeloClustalW.Oalinhamentofoiinspecionadovisualmente, pormeiodoprogramaBioEdit8( Hall,1999 ). Aversãofinaldoalinhamentofoiutilizadaparaaconstruçãodeumaárvore filogenética.TalconstruçãofoifeitapormeiodoprogramaMEGA4( Tamura et al ., 2007 ), pelo método de neighbor-joining (ou ligação com vizinhos) ( Saitou & Nei, 1987 ),commodelodecorreçãodePoisson( Zuckerkandl&Pauling,1965 ),ecoma filogeniasendotestadaporum bootstrap (Felsenstein,1985 )de10.000replicatas. Todasasposiçõescontendo gaps foramremovidas(opçãodedeleçãocompleta). Da mesma forma, as seqüências de nucleotídeos de ureases de plantas, fungos e das cadeias C de bactérias selecionadas foram alinhadas e editadas, sendo utilizadas para a construção de uma árvore filogenética, por meio do programaMEGA4.Ahistóriaevolutivafoiinferidapelométodode neighbor-joining (Saitou & Nei, 1987 ), com a distância evolutiva sendo estimada pelo método de JukesCantor ( Jukes & Cantor, 1969 ). As seqüências foram tratadas como codificantesetodasasposiçõescontendo gaps foramremovidas(opçãodedeleção completa). Alinhamentos adicionais das seqüências de aminoácidos foram produzidos parapossibilitaraidentificaçãoeasinalizaçãodeposiçõesconservadasespecíficas, alémdepermitirquediferençasdeinteressefossemevidenciadas. Aescolhadasseqüênciasdebactériasaseremconsideradas foi arbitrária, tomandoastrêsureasescomestruturatridimensionaldefinida(de Bacillus pasteurii , Klebsiella aerogenes e Helicobacter pylori )etrêsureasesdeespéciesdosmesmos gêneros(de Bacillus subtilis, e Helicobacter hepaticus ),com 21 ointuitodeutilizalastambémcomoumcontroleinterno das árvoresfilogenéticas (pois,emteoria,elasdeveriamagruparsedemaneiramuitopróxima). 3.2 Modelagem molecular comparativa AisoformaJBUREIIBdaureasede Canavalia ensiformis foiescolhidacomo alvo para modelagem comparativa. Sua seqüência primária foi obtida de Mulinari (2008 ). Em uma abordagem inicial, verificouse qual seria a sugestão de moldes fornecidapeloSwissModel( Guex&Peitsch,1997 )(http://swissmodel.expasy.org). Posteriormente, uma busca por seqüências similares à JBUREIIB que tivessem estruturatridimensionaldefinidafoifeitaporBlastP( Altschul et al .,1997 ),viaNCBI (Wheeler et al ., 2008 ). Como os resultados do BlastP confirmaram moldes que haviam sido préselecionados (as únicas estruturas tridimensionais de ureases disponíveis, de K. aerogenes, H. pylori e B. pasteurii ) como sendo os mais adequados,aestruturadomoldefoiescolhidaprincipalmenteporsuaresolução.A estruturatridimensionaldomolde(2UBP)foiobtidadoResearchCollaboratoryfor Structural Bioinformatics Protein Data Bank (RCSB PDB, ou simplesmente PDB) (Berman et al., 2000 ) (http://www.rcsb.org/pdb). Os três moldes selecionados originalmenteapresentavamgraudeidentidadedeseqüênciacomoalvosuperiora 30% (~55%), valor adequado para uma modelagem bem sucedida ( Eswar et al ., 2000 ). O alinhamento das seqüências molde e alvo foi realizado pelo ClustalW (Larkin et al ., 2007 ).A modelagem molecular foi realizada por meio do programa Modeller9v4( Eswar et al .,2000 ; MartíRenom et al .,2000 ),pormeiodesuarotina “modelloopdefine”(ApêndiceA ).Estarotinaéindicadaparacasosondealças(ou outras regiões curtas) do modelo não apresentam equivalentes no molde, requerendoatençãoespecial.Esteéexatamenteocasodasduasregiõesdeligação de domínios presentes nas ureases de plantas e fungos, que não ocorrem em bactérias.Foramconstruídosdezmodelos,cadaumdelescomdezsubmodelos, representandopossibilidadesalternativasparaasregiõessemmolde. Em um primeiro momento, os modelos foram inspecionados visualmente, sendodescartadosaquelesqueapresentavampadrões estruturais não realísticos, causados por modelagem inadequadaderegiõessemmolde maiores que quinze resíduos de aminoácidos ( Šali, 2008 ). Na etapa seguinte, os modelos restantes 22 foramavaliadospelomapadeRamachandran( Ramachandran et al .,1963 )2,gerado peloProcheck( Laskowski et al .,1993 ),epelosresultadosdoVerify3D( Lüthy et al ., 1992 ),transpostosàsestruturastridimensionaispormeiodoGeneSilicoMetaserver (Kurowski & Bujnicki, 2003 ) (http://genesilico.pl). Foi eleito como melhor modelo aquele que apresentou melhor avaliação pelo mapa de Ramachandran e organização espacial mais verossímil pelo Verify3D. A determinação da estrutura secundária a partir da estrutura terciária modelada foi realizada pelo PDBsum (Laskowski et al ., 2005 ) (http://www.ebi.ac.uk/pdbsum), enquanto a predição da estrutura secundária a partir da seqüência primária foi realizada pelo PSIPRED (McGuffin et al .,2000 )(http://bioinf.cs.ucl.ac.uk/psipred). Avisualizaçãoeamanipulaçãodasestruturastridimensionais das ureases foram realizadas nos programas SwissPDB Viewer versão 3.7 ( Guex & Peitsch, 1997 )eUCSFChimeraversão1( build 2540)( Pettersen et al. ,2004 ).

2TambémchamadodeGráficodeRamachandran,RamachandranPlot,MapadeSasisekharanRamakrishnan Ramachandran,ousimplesmenteRamachandran;emhomenagemaseupropositor,GopalasamudramNarayanaIyer Ramachandran. 23

4. Resultados e Discussão 4.1 Inferência filogenética Após a exaustiva análise das 9046 seqüências de aminoácidos obtidas originalmente, foram selecionadas 237 seqüências de ureases de bactérias e 16 seqüências de ureases de plantas e fungos. Dentre as seqüências do primeiro grupo,foramescolhidasseisseqüênciasparaasanálises posteriores. ATabela1 apresenta a listagem detalhada das seqüências obtidas, enquanto o Apêndice B apresentaalistagemcompletadas237seqüênciasdeureasesdebactérias.

Tabela 1:Seqüênciasdeaminoácidosdeureasesutilizadasnestetrabalho. Seqüência Organismo Código GI da de DNA Vegetal, Fungo seqüência-tipo disponível ou Bactéria Agaricus bisporus AGABIS 108859293 sim F Ajellomyces capsulatus AJECAP 154281373 sim F Arabidopsis thaliana ARATHA 15220459 sim V Aspergillus clavatus ASPCLA 121702879 sim F Aspergillus fumigatus ASPFUM 70990710 sim F Aspergillus terreus ASPTER 114193850 não F Bacillus pasteurii BACPAS 498708 sim B Bacillus subtilis BACSUB 50812173 sim B Canavalia ensiformis CANENS_1 167228 sim V Canavalia ensiformis (JBUREIIB) CANENS_JBUREIIB 22831365 sim V Coccidioides posadasii COCPOS 60280325 sim F Cryptococcus neoformans var. grubii CRYNGR 3688063 sim F Cryptococcus neoformans var . neoformans CRYNNE 58270418 sim F Glycine max (embriãoespecífica) GLYMAX_EMBR 32170829 sim V Glycine max (ubíqua) GLYMAX_UBI 32170831 sim V Helicobacter hepaticus HELHEP 32265499 sim B Helicobacter pylori HELPYL 209406223 sim B Klebsiella aerogenes KLEAER 149335 sim B Klebsiella pneumoniae KLEPNE 206575712 sim B Neosartorya fischeri NEOFIS 119477773 sim F Neurospora crassa NEUCRA 28926785 não F Oryza sativa (indicacultivargroup) ORYSAT 17402589 sim V Ostreococcus lucimarinus OSTLUC 144576703 não P Schizosaccharomyces pombe SCHPOM 1944148 sim F Solanum tuberosum SOLTUB 14599437 sim V Todas as seqüências foram utilizadas para construção de árvores filogenéticas,buscandoevidenciarrelaçõesdesimilaridadepresentesentreelas.É importante ressaltar que as árvores construídas representam relações de similaridadeentreasseqüências,enãoentreosorganismosdasquaiselasprovêm. 24

Emcasosdereconstituiçãodafilogeniadeorganismos,osgenesderRNAsãoos maisúteis:estãopresentesemtodososorganismos,epodemapresentarsenas formasnuclearemitocondrial.GenesderRNAmitocondrialtêmresoluçãonafaixa dedezacemmilhõesdeanos,enquantogenesderRNAnuclearestêmresolução nafaixadecentenasdemilhõesdeanos( Ridley,2004 ). Areconstruçãofilogenéticaconsisteemestimarasrelaçõesdeancestralidade para um determinado número de Unidades Taxonômicas Operacionais (OTUs), sejampopulações,famílias,gênerosouespécies,podendobasearseemcaracteres morfológicos, funcionais ou moleculares. Filogenias moleculares, comintençãode definir ancestralidade entre organismos baseandose em seqüências de aminoácidosounucleotídeos,sãoconsideradascasosespeciaisdentrodoestudo filogenéticotradicional( Miyaki et al. ,2001 ). UmaárvorefilogenéticarepresentaahistóriaevolutivadasOTUspresentes nela,graficamenteapresentadacomopontos(ounós)ligadosporlinhas(ouramos). Os nós terminais representam as OTUs estudadas, enquanto os nós internos representam o ancestral comum mais recentedessasOTUs ( Myiaki et al ., 2001 ). Nasárvoresobtidasnopresentetrabalho,osnósinternosrepresentamaseqüência comummaisrecenteantesdeocorrerdivergênciaentreasseqüênciasapresentadas nos nós terminais; ou seja, as seqüências individuais são tratadas como OTUs, sendoelasmesmasoalvodasanálises,enãoosorganismosqueascontém. Existem três classes de técnicas para inferência de filogenias a partir de dados moleculares 3. Em ordem crescente de complexidade, temos: distância molecular,parcimônia,emáximaverossimilhança( Nei&Kumar,2000 ). • distância molecular : é um método geométrico. Utiliza matrizes de diferenças e similaridades entre as seqüências, sendo consideradas mais distantes evolutivamente aquelas seqüências que apresentarem o maior número de diferenças entre si. Este é considerado um métodorápido e menos preciso, pois pressupõeumrelógiomolecular:astaxasevolutivassãoconsideradasconstantes entretodasasseqüênciasanalisadas( Ridley,2004 ).Essaclasseincluiosmétodos

3Umaquartaclasse,propostaem1996,baseiaseemredesneurais.Suautilidadepráticaaindanãofoievidenciada(Nei& Kumar,2000). 25 de junção com vizinhos ( neighbor-joining , NJ), UPGMA ( unweighted pair group method with arithmetic means )4eevoluçãomínima. • parcimônia : é um método probabilístico. Corresponde ao princípio de que a filogenia que exige o menor número de mudanças evolutivas para obter a diferenciação das OTUs analisadas é a melhor estimativa da filogenia real. De maneirasimplificada,geramsetodasasárvorespossíveise,entreelas,selecionam seaquelasqueapresentamamenorquantidadedemudançasevolutivas.Ométodo estádeacordocomaobservaçãodequeumamudançaevolutivaéumeventoraro (Myaki et al .,2001 ). • máxima verossimilhança : é um método probabilístico. Consiste em, usando um modelo de evolução de seqüências préestabelecido, calcular a probabilidade de que os dados analisados tenham sido originados conforme o modelo evolutivo adotado( Pereira et al .,2001 ). Nopresentetrabalho,optouseporutilizarométodode neighbor-joining para a construção da árvore filogenética das seqüências de aminoácidos, sendo essa opção baseada principalmente no estudo comparativo de Hasegawa & Fujiwara (1993 ).Talestudoindicao neighbor-joining comométodoconfiávelparaobtenção da filogenia, mesmo quando as taxas de variação evolutiva não são totalmente uniformesentreaslinhagens(oqueseriaprérequisitoparaaplicaçãodométodo). Paraaconstruçãodaárvorefilogenéticadasseqüênciasdenucleotídeos,optouse também por utilizar o método de neighbor-joining . Essa escolha baseouse no estudocomparativode Saitou&Imanishi ( 1989 )queindicao neighbor-joining como ométododeescolhaquandoaspectospráticossãoconsiderados,massugereque abordagens mais complexas sejam escolhidas quando possível (isto é, quando a capacidade computacional não for uma restrição e quando o operador possuir conhecimentoavançadodasteoriassubjacentesaométodo). Ousodosmétodosdedistância,parcimôniaedemáximaverossimilhança, nessa ordem, exigem quantidades de dados e poder computacional cada vez maiores.Essaordemrefleteaseqüênciahistóricadousodosmétodosdepesquisa filogenética molecular ( Ridley, 2004 ). Atualmente existe muito debate sobre as eficiências relativas dos diferentes métodos de construção de árvores, especialmente neighbor-joining , parcimônia e máxima verossimilhança. Está claro 4Raramentedefinidoporextenso,onomedométodopodesertraduzidopor“métodonãopesadodeagrupamentopara parusandomédiasaritméticas”. 26 quenenhummétodoésuperioraosoutrosemtodasas condições ( Nei & Kumar, 2000 ).Emestudoscomdadosreais(enãosimulaçõesbaseadasemreconstrução deumafilogeniajáconhecida),comusodeumnúmerosubstancialdeseqüências pouco divergentes, os três métodos produzem topologias similares ou idênticas. Sugerese,portanto,queárvoresqueapresentemvaloresadequadosde bootstrap , construídas por meio de qualquer um dos métodos, fornecem essencialmente a mesma conclusão sobre as relações filogenéticas dos organismos, genes ou proteínas( Nei&Kumar,2000 ). Aárvoreconstruídaapartirdasseqüênciasdeaminoácidosdasureasesde diferentes organismos é apresentada na Figura 3 .Observasenaárvoreumclaro agrupamento das seqüências de plantas, fungos e bactérias entre si; comaalga unicelular Ostreococcus lucimarinus agrupandose junto às plantas.Além disso, a árvoreindicaqueasseqüênciasdeaminoácidosdeplantasebactériassãomais semelhantesentresidoquesemelhantesàsseqüênciasdefungos.Talsimilaridade pode indicar que algumas (ou muitas) das propriedades nãocatalíticas dessas enzimas sejam comuns a ureases de plantas e bactérias, mas encontremse ausentes ou diferenciadas em ureases fúngicas. Estes resultados poderão guiar futurosestudosfocadosemureases,alémdeauxiliaracompreensãoderesultados obtidos experimentalmente. A adição das seqüências de bactérias no cálculo das árvores filogenéticasforçouacomparaçãoarestringirse à região equivalente em todas as seqüências. Optouse pela região correspondente à subunidade C de bactérias (domínio α em plantas e fungos), por ser esta a maior subunidade e, principalmente,porconterosítiocatalícodasureases.Porprecaução,árvoressem a inclusão das seqüências de bactérias foram calculadas, e verificouse que a inclusãodasseqüênciasdeureasesnãoalterouopadrãogeraldedistribuiçãodos ramos. 27

Figura 3:Relaçãoevolutivaentre24seqüênciasdeaminoácidosdeureases.Abarradeescalarepresentanúmerode substituiçõesdeaminoácidosporsítio.Comparaçãorealizadautilizandoseasseqüênciascompletasdeureasesdeplantas e fungos e as seqüências das cadeias C de bactérias (correspondentes ao domínio α de plantas e fungos). A árvore apresentada é o consenso, obtido após 10000 replicatas de bootstrap , e está representando a história evolutiva das seqüênciasanalisadas.Apercentagemdeárvoresemqueasseqüênciasassociadasseagruparaméapresentadapróxima às ramificações. A árvore está representada em escala, com o comprimento dos ramos nas mesmas unidades das distânciasevolutivasusadasparainferiraárvorefilogenética(númerodesubstituiçõesdeaminoácidosporsítio).Osgrupos taxonômicosdosorganismoscujasureasesforamcomparadasencontramseàdireitadaárvore. Aárvoreconstruídaapartirdasseqüênciasdenucleotídeosdasureasesde diferentesorganismoséapresentadanaFigura4 .Estaárvoretambémapresentaum agrupamento das seqüências de plantas, fungos e bactérias entre si, mas com algumaspeculiaridades.Diferentementedaárvoredeaminoácidos,estaindicaque asseqüênciasdenucleotídeosdeplantasefungossãomaissemelhantesentresi doquesemelhantesàsseqüênciasdebactérias.Alémdisso,háoagrupamentode trêsseqüênciasdeureasesfúngicasjuntoàsureasesdeplantas.Aseqüênciade nucleotídeos correpondente à urease da alga O. lucimarinus não encontravase disponível e por este motivo não foi incluída na construção desta árvore. A 28 comparação das seqüências de nucleotídeos não é tão relevante para estudos estruturais quanto a comparação das seqüências de aminoácidos, mas é interessanteparaaplicaçõesqueenvolvamoprópriomaterialgenético.Osdadosde similaridadeobtidospodemserúteis,porexemplo,aopreverseocomportamento dedeterminadofragmentodeDNAaoserinseridoemumplasmídeoemestudosde clonagemdegenesdeurease.

Figura 4:Relaçãoevolutivaentre22seqüênciasdenucleotídeosdeureases.Abarradeescalarepresentanúmerode substituiçõesdeaminoácidosporsítio.Comparaçãorealizadautilizandoseasseqüênciascompletasdeureasesdeplantas e fungos e as seqüências das cadeias C de bactérias (correspondentes ao domínio α de plantas e fungos). A árvore apresentada é o consenso, obtido após 10000 replicatas de bootstrap , e está representando a história evolutiva das seqüênciasanalisadas.Apercentagemdeárvoresemqueasseqüênciasassociadasseagruparaméapresentadapróxima às ramificações. A árvore está representada em escala, com o comprimento dos ramos nas mesmas unidades das distânciasevolutivasusadasparainferiraárvorefilogenética(númerodesubstituiçõesdebasesporsítio). Foi observada uma diferença entre as árvores construídas a partir de aminoácidos e nucleotídeos. Entretanto, as duas árvores não deveriam, necessariamente, ser idênticas. As classes de dados utilizadas são diferentes, e teoricamenteumaseqüênciadeDNAapresentamaiorprobabilidadedediferenciar 29 sedoancestraldoqueumaseqüênciadeaminoácidos.Issosedeveespecialmente à degeneração do código genético ( Ridley, 2004 ). A árvore construída a partirde seqüênciasdenucleotídeostem,portanto,umcarátercomplementaraorestantedas análisesrealizadas. Adicionalmente, uma árvore considerando apenas as seqüências de aminoácidoscorrespondentesaopeptídeoentomotóxicoderivadodeJBUREIIBfoi construída. Surpreendentemente, esta árvore refletia a topologia da árvore construídaparaasseqüênciasdenucleotídeos,agrupandoosfungos A. bisporus , C. neoformans v. neoformans e C. neoformans v. grubii juntoàsseqüênciasoriundas deplantas.Talagrupamentopoderiaserumaindicaçãodequeasureasesdestes fungos apresentam propriedades tóxicas semelhantes às das ureases vegetais. Devidoaobaixosuporteestatísticodestafilogenia(~30%emalgumasramificações), talhipótesepermaneceapenasemnívelespeculativo. Comonaimensamaioriadoscasosdeanálisefilogenéticanãoseconhecea verdadeiratopologiadaárvorefilogenéticaemanálise,aconfiabilidadenatopologia obtida é geralmente testada ao examinarse o grau estatístico de confiança no padrãoderamificaçãodaárvoreobtida( Nei&Kumar,2000 ).Aconfiabilidadenas árvoresconstruídasnestetrabalhofoitestadapelométodode bootstrap . O bootstrap ( Felsenstein, 1985 ) consiste em uma reamostragem com reposiçãopseudoaleatóriadosdados.Emacadareamostragem,onúmerodedados amostrados mantémse constante, e cada posição tem a mesma chance de ser amostrada;conseqüentemente,algumasposiçõesserãocontadasmaisdeumavez, enquantoalgumasnãoserãoamostradas.Acadareamostragem,umaárvoreréplica é construída ( Russo et al ., 2000 ).NasárvoresapresentadasnasFiguras3e4,a percentagem com que cada agrupamento ocorreu nas dez mil réplicas aparece comoíndicessobreospontosderamificação.Aconfiançado bootstrap ,entretanto, dependedaconsistênciadométodousadoparaconstruirseaárvore.Seométodo não for adequado para uma dada faixa de parâmetros, os valores de bootstrap podem ser altos sem que a topologia esteja correta. No caso oposto, com parâmetros adequados ao método, o bootstrap é uma subestimativa da probabilidadedaqueleramoserverdadeiro( Russo et al .,2001 ). 30

4.2 Comparação de seqüências primárias Por meio de alinhamentos para cada um dos grupos de seqüências de aminoácidos de ureases (vegetais, fúngicas e bacterianas) foi confirmada a conservaçãodosseisresíduosconsideradosessenciaisparaacatáliseemureases (conforme Mobley et al .,1995 )emtodasasseqüênciasanalisadas.Estesresíduos encontramsedestacadosemverdenasFiguras5,6e7 ,comindicaçõessobresua localização na seqüência primária da JBUREIIB, e correspondem ao resíduos His134,His136,Lys217,His246,His272eAsp360da urease de K. aerogenes . A conservação destes resíduos em todas as seqüências analisadas é um forte indicativodequeelesexerçamamesmafunçãoemtodasasureases. A região correspondente ao peptídeo entomotóxico de C. ensiformis foi localizadaeanalisadanasseqüênciasdeplantasefungos(aregiãoéinexistente em ureases bacterianas). Verificouse a baixa identidade deste trecho das seqüências (28,26% para seqüências de plantas e 19,19% para seqüências de fungos,comparadasjuntoàsde C. ensiformis )eseualtograudediferença(51,09% paraplantase62,63%parafungos,comparadasjuntoàsde C. ensiformis ).Aregião do peptídeo encontrase destacada em amarelo nas Figuras 5 e 6 , e os dados referentes a seus alinhamentos, realizados independentemente dos trechos adjacentes,encontramsejuntoaosdadosdosalinhamentostotais.Oaltograude diferençadessesegmentoentreasureases,especialmenteaocompararseureases de plantas e fungos, pode indicar que nem todos os peptídeos devam, necessariamente,apresentarpropriedadesinseticidas. 31

Figura 5:Alinhamentomúltiplodeseqüênciasdeaminoácidosdeureasesoriundasdeplantas.Códigosdosorganismosde acordocomaTabela1. 10 20 30 40 50 60 | | | | | | CANENS_1 MKLSPR EVEKLGLHN AG-YLAQ KRLAR GVR LN YTEAVALIA SQIMEYA RD GEK------GLYMAX_EMBR MKLSPR EVEKLGLHN AG-YLAQ KRLAR GLR LN YTEAVALIA TQIMEFA RD GEK------CANENS_JBUREIIB MKLSPR EVEKISLHN AG-FLAQ KRLAR GVR LN YSESVALIA SQILEHA RD GEK------GLYMAX_UBI MKLSPR EIEKLDLHN AG-YLAQ KRLAR GLR LN YVETVALIA TQILEFV RD GEK------SOLTUB_1 MKLAPR EIEKLMLHN AG-YLAQ KRLAR AQL LN YTEAVALIA TQVLEFV RD GDK------ARATHA MKLLPR EIEKLELHQ AG-FLAQ KRLAR GIR LN YTEAVALIA TQILEFI RD GDK------ORYSAT MKLEQR EAEKLALHN AG-FLAQ KRLAR GLR LN YTEAVALIA AQILEFV RD GDR------OSTLUC MRLTPC EIDKLNILF AAGR VAQ RRLARGMR LN HPEAVALIA MQCVELV RD PKFDKDGERR *:* * :*: : *. :**:****. **: *:***** * :* ** . Prim.cons. MKLSPREIEKLGLHNAGGYLAQKRLARGLRLNYTEAVALIATQILEFVRDGEKDKDGERR

70 80 90 100 110 120 | | | | | | CANENS_1 -- TVAQL MC LGQHLLGR RQ VL PA VPHLLNA VQVEATFPDGTKL VTVHDPISRENGELQE A GLYMAX_EMBR -- TVAQL MC IGKHLLGR RQ VL PE VQHLLNA VQVEATFPDGTKL VTVHDPISCEHGDLGQ A CANENS_JBUREIIB -- TVAQL MS IGKHLLGR RQ VL PA VPHLLNI IQVEATLPNGTKL VTVHDPIANENGDLEE A GLYMAX_UBI -- TVAQL MC IGRELLGR KQ VL PA VPHLVES VQVEATFRDGTKL VTIHDLFACENGNLEL A SOLTUB_1 -- SVAEL MD IGRQLLGR RQ VL PT VPHLLDC VQVEGTFPDGTKL ITIHDPIACENGNLDL A ARATHA -- SVAEL MD IGRQLLGR RQ VL PA VLHLLYT VQVEGTFRDGTKL VTVHEPISLENGNLEL A ORYSAT -- TVTDL MD LGKQLLGR RQ VL PA VPHLLET VQVEGTFMDGTKL ITVHDPISSDDGNLEL A OSTLUC AL TSVEV QD LGKRVLGR RH VL DG VPELVGD VQIETTFDDGTKL ITIHDAICADDVDLEL A : .:: :*:.:***::** * .*: :*:* *: :****:*:*: :. :. :* * Prim.cons. ALTVAQLMDIGK2LLGRRQVLPAVPHLLN2VQVEATFPDGTKLVTVHDPISCENGNLELA

130 140 150 160 170 180 | | | | | | CANENS_1 LFGS LLP VPSLDKFAE-TKEDNRI PG EI LCEDEC LTLNIG RKAVI LKVTS KG DRP IQVGS GLYMAX_EMBR LFGS FLP VPSLDKFAE-NKEDNRI PG EI IYGDGS LVLNPG KNAVI LKVVS NG DRP IQVGS CANENS_JBUREIIB LYGS FLP VPSLDKFAE-SKEEHKI PG EI ICADGR LTLNPG RKAVF LKVVN HG DRP IQVGS GLYMAX_UBI LFGS FLP VPSLDKFTE-NEEDHRT PG EI ICRSEN LILNPR RNAII LRVVN KG DRP IQVGS SOLTUB_1 LHGS FLP VPPQEKFP--VIEDSKI PG QM CFGGGL IVLNPQ RKAVI LKVTN TG DRP IQVGS ARATHA LHGS FLP VPSLDKFPE-VHEGVII PG DM KYGDGS IIINHG RKAVV LKVVN TG DRP VQVGS ORYSAT LHGS FLP VPSLEKFS--SVGVDDF PG EV RFCSGH IVLNLH RRALT LKVVN KA DRP IQIGS OSTLUC LLGS FLP KPSEKAFPPATKEKTPA PG EV RTSKDS LELLAG RPKRK LKVTN TC DRP IQVGS * **:** *. . *. **:: : : : *:*.. ***:*:** Prim.cons. L2GSFLPVPSLDKF2EA4KED2RIPGEIICGDGSLVLNPGRKAVILKVVN2GDRPIQVGS

190 200 210 220 230 240 | | | | | | CANENS_1 HYHFIE VNPY LTFDR RKAYGMRL NIAAGTAVRFEPG DCKS VTLV SIEGNKVIR GGN AIAD GLYMAX_EMBR HYHFIE VNPY LTFDR RKAYGMRL NIAAGNATRFEPG ECKS VVLV SIGGNKVIR GGN NIAD CANENS_JBUREIIB HYHFIE VNPY LTFDR RKAYGMRL NIAAGDSVRFEPG DHKT VNLV SIGGNKIIR GGN AIAD GLYMAX_UBI HYHFIE VNPY LTFDR RKAYGMRL NIAAGNATRFEPG ECKS VVLV SIGGNKVIR GGNNIAD SOLTUB_1 HYHFIE VNPS LIFDR MKALGMRL NIPAGAATRFEPG ETRS VVLI GISGKKVIR GGN AIAD ARATHA HYHFIE VNPL LVFDR RKALGMRL NIPAGTAVRFEPG ERKS VVLV NIGGNKVIR GGN GIVD ORYSAT HYHFIE ANPY LVFDR QRAYGMRL NIPAGTAVRFEPG DAKT VTLV SIGGRKVIR GGN GIAD OSTLUC HFHLIE ANRF LTFDR RRAYGARL AIPSGTAVRFEPG ESKT VNMV NIAGNRVVK GGN NLVN *:*:**.* * *** :* * ** *.:* :.*****: ::* ::.* *.::::*** :.: Prim.cons. HYHFIEVNPYLTFDRRKAYGMRLNI2AGTAVRFEPGECKSVVLVSIGGNKVIRGGN2IAD

250 260 270 280 290 300 | | | | | | CANENS_1 GP VNET NLEAA MHA VRSKG FGHEEEK DAS EG FTKEDPNCPFNTF IHRKEYA NK YGPT TGD GLYMAX_EMBR GP VNDS NCRAA MKA VVTRG FGHVEEE NAR EG VTG--EDYSLTTV ISREEYA HK YGPT TGD CANENS_JBUREIIB GP VNEA NCKAA MEI VCRRE FGHKEEE DAS EG VTTGDPDCPFTKA IPREEYA NK YGPT IGD GLYMAX_UBI GP VNDS NCRAA MKA VVTRG FGHVEEE NAR EG VTG--EDYSLTTV ISREEYA HK YGPT TGD SOLTUB_1 CP VDDA KVMTL MGA LSEGG FGHLEEP NPR EG VVG--EESCFSFS MTHEEYA NM FGPT TGD ARATHA GL VDDV NWTVL MET MERRG FKHLEDI DAS EG IAG--EDPRFTTM ISREKYA NM YGPT TGD ORYSAT GA VNRS QLNEV MEK VIANG FGHEDYP DSS EG IIG---DGTHDYS VDHEKYA SM YGPT TGD OSTLUC GP ATAD RLDEV MKR VIDGG FGHVDAD DLG EG EPL------MIPRHKYA HM YGPT IGD . . * : * * : : ** : :.:** :*** ** Prim.cons. GPVNDSN2RAAM2AV22RGFGHVEEEDASEGVTG2DED22FTT3ISREEYAN2YGPTTGD

32

310 320 330 340 350 360 | | | | | | CANENS_1 KI RLGDT NLLAEI EKDYA LYGDECVFGGGK VIRDGM GQSCGHPPAI SLDT VI TNAVII DY GLYMAX_EMBR KI RLGDT DLFAEI EKDFA LYGDECVFGGGK VLRDGM GQSCGDPPAI SLDT VI TNAVII DY CANENS_JBUREIIB KI RLGDT DLIAEI EKDFA LYGDESVFGGGK VIRDGM GQSSGHPPAM SLDT VI TSAVII DY GLYMAX_UBI KI RLGDT DLFAEI EKDFA VYGDECVFGGGK VIRDGM GQSSGHPPEG SLDT VI TNAVII DY SOLTUB_1 RI RLGDT DLFAEI EKDFG IFGDECVFGGGK VLRDGM GQACGYPPAD CLDT VI TNAVVI DY ARATHA KL RLGDT NLYARI EKDYT VYGDECVFGGGK VLREGM GQGIEQAEAL SLDT VI TNSVII DY ORYSAT KI RLGDT DLFAEI EKDYA IYGDECIFGGGK VLRDGM GQSAGYPASD CLDT VV TNAVVI DY OSTLUC RV RLGDT NLYITP ERDLT MKGEESKFGGGK TLREGM SQQAGVGDAD SLDT II TNALIV DH ::*****:* *:* : *:*. *****.:*:**.* .***::*.::::*: Prim.cons. KIRLGDTDLFAEIEKDFALYGDECVFGGGKVLRDGMGQSCGHPPADSLDTVITNAVIIDY

370 380 390 400 410 420 | | | | | His407 | CANENS_1 TGI IKADIGI KDGLIASIG KAGNPD IM NGV--FSNM II GANTE VIAG EG LIVTAG AIDCH GLYMAX_EMBR SGI IKADIGI KDGLIVSIG KAGNPD IM DDV--FFNM II GANTE VIAG EG LIVTAG AIDCH CANENS_JBUREIIB TGI IKADIGI KDGLIASIG KAGNPD IM NGV--FPNM II GVNTE VICG EG LIVTAG GIDCH GLYMAX_UBI TGI IKADIGI KDGLIISTG KAGNPD IM NDV--FPNM II GANTE VIAG EG LIVTAG AIDCH SOLTUB_1 TGI FKCDIGI KDGHIVSLC KAGNPD IM D-----SDA II GVNTE VIAG EG MIVTAG AIDCH ARATHA SGI YKADIGI KNGHIVGIG KAGNPD TM HGV--QNNM LI GNKTE VIAG EG MIVTAG AIDCH ORYSAT TGI YKADIGI NGGLIVAIG KAGNPD VM DMDGVNEEM IV GVNTE VIAA EG MIVTAG GIDCH OSTLUC SGI YKADIGI KDGHIVGIG HGGNPD VA DVT---PGM VV GVNTE AIAA EG CIVTAG ALDTH :** *.****:.* * . :.**** . ::* :**.*..** *****.:* * Prim.cons. TGIIKADIGIKDGLIVSIGKAGNPDIMDGVGVFPNMIIGVNTEVIAGEGLIVTAGAIDCH

430 440 450 460 470 480 His409 | | | | | | CANENS_1 VHYICPQ LVY EAIS SGITT LV GGGTGP AAGTRATTCTP SPT QMRLML QS TD DLPLNFGFT GLYMAX_EMBR VHYICPQ LVD EAIS SGITT LV GGGTGP TAGTRATTCTP APS QMKLML QS TD DLPLNFGFT CANENS_JBUREIIB VHYICPQ SLD EAIS SGITT VV GGGTGP TDGSRATTCTP APT QMKLML QS TD DIPLNFGFT GLYMAX_UBI VHFICPQ LVY DAVT SGITT LV GGGTGP ADGTRATTCTP APN QMKLML QS TD DMPLNFGFT SOLTUB_1 VHFICPQ LAY EAIS SGITT MV GGGTGP AHGTRATTCTP GHV HMELML QS TD EIPLNFGFT ARATHA VHFICPQ LVY EAVS SGITT MV GGGTGP AYGTRATTCTP SPF DMKLML QS TD SLPLNFGFT ORYSAT VHFICPQ LAE EAIA SGITT LV GGGTGP AHGTCATTCTP SPS HMKLML QS TD ELPINMGFT OSTLUC IHYICPQ LCT EAVA SGITT LL GGGTGP ASGTCATTCTP SAA HMQFML ET TD ALPLNFAFT :*:**** :*::*****::******: *: ******. .*.:**::** :*:*:.** Prim.cons. VH2ICPQLVYEAISSGITTLVGGGTGPA3GTRATTCTPSP2QMKLMLQSTDDLPLNFGFT

490 500 510 520 530 540 | | Lys490 | | | His519 | CANENS_1 GKG SSSKPDE LHEIIKAGA MGLKLHEDWG STPAAID NCL TI AEHHDIQINIHTDT LNE AG GLYMAX_EMBR GKG SSSKPDE LHDIIKAGA MGLKLHEDWG STPAAID SCL TV ADQYDIQINIHTDT LNE AG CANENS_JBUREIIB GKG SGSHPDE LHEIIKAGA MGLKLHEDWG CTPAAID NCL AV AEQHDIQVNIHTDT VNE SG GLYMAX_UBI GKG NSAKPDE LHEIIRAGA MGLKLHEDWG TTPAAID SCL TV ADQYDIQVNIHTDT LNE SG SOLTUB_1 GKG NSSKADG LHEIIKAGA MGLKLHEDWG TTPAAID MCL TV ADQYDIQVNIHTDT LNE SG ARATHA GKG NTAKPLELRHIVEAGA MGLKLHEDWG TTPAAID NCL AV AEEYDIQVNIHTDT LNE SG ORYSAT GKG NTTKPDG LAEIIKAGA MGLKLHEDWG STPAAID NCL SV AEAFDIQVNIHTDT LNE SG OSTLUC GKG NTASPEG LHEIIKAGA VGMKLHEDWG TTPAAID NCL TI AEEYDVAVTIHTDT LNE SC ***. : . * .*:.***:*:******* ****** **::*: .*: :.*****:**: Prim.cons. GKGNSSKPDELHEIIKAGAMGLKLHEDWGTTPAAIDNCLTVAEQYDIQVNIHTDTLNESG

550 560 570 580 590 600 | His545 | | | | | CANENS_1 F VE HS IAAF KG RTIHTYHSEGAGGGHAPDII KVC GIKNVLPSSTN PTRP LTSNT IDEHLD GLYMAX_EMBR F VE HS IAAF KG RTIHTYHSEGAGGGHAPDII KVC GMKNVLPSSTN PTRP LTLNT IDEHLD CANENS_JBUREIIB F VE HT IAAF NG RTIHTYHSEGAGGGHAPDII KVC SMKNVLPSSTN TTRP LTSNT VDEHLD GLYMAX_UBI F VE HT IAAF KG RTIHTYHSEGAGGGHAPDII KVC GEKNVLPSSTN PTRP YTHNT IDEHLD SOLTUB_1 F VE HT IAAF KG RTIHTYHSEGAGGGHAPDII KVC GVKNVIPSSTN PTRP FTLNT VDEHLD ARATHA F VE HT INAF RG RTIHTYHSEGAGGGHAPDII RVC GVKNVLPSSTN PTRP YTKNT VDEHLD ORYSAT C VE HTIAAF KD RTIHTYHSEGAGGGHAPDII KVC GVKNVLPSSTN PTRP FTLNT VDEHLD OSTLUC C VE KS IEAF KG RTIHTYHSEGAGGGHAPDII KVC GEKMVLPSSTN PTRP YTKNT VDEHLD **::* **..********************:**. * *:*****.*** * **:***** Prim.cons. FVEHTIAAFKGRTIHTYHSEGAGGGHAPDIIKVCGVKNVLPSSTNPTRP2TLNTVDEHLD

610 620 630 640 650 660 | | | |Asp633 | | CANENS_1 MLMVCH HLDR EIP ED LAFA HSR IRKK TIAAED VLNDIGAISI IS SDSQA MGR VGEVI SR T GLYMAX_EMBR MLMVCH HLNR EIP ED LAFA CSR IREG TIAAED ILHDIGAISI IS SDSQA MGR VGEVI SR T CANENS_JBUREIIB MLMVCH KLNR EIP ED LAFA SSR VREQ TIAAED ILHDIGGISI IS SDAQA VGR IGEVI SC T GLYMAX_UBI MLMVCH HLNK NIP ED VAFA ESR IRAE TIAAED ILHDKGAISI IS SDSQA MGR IGEVI SR T SOLTUB_1 MLMVCH HLCK NSR ED VAFA ESR IRAE TIAAED ILHDMGAISI IS SDSQA MGR IGEVI CR T ARATHA MLMVCH HLDK NIP ED VAFA ESR IRAE TIAAED ILHDMGAISI IS SDSQA MGR IGEVI SR T ORYSAT MLMVCH HLDR NIP ED VAFA ESR IRAE TIAAED ILHDMGAISI IS SDSQA MGR IGEVI TR T OSTLUC MLMVCH HLDP EIP ED VAFA ESR IRAE TIAAED VLHDMGALSI MA SDSQA MGR VGEVI RR T ******:* : **:*** **:* ******:*:* *.:**::**:**:**:**** * Prim.cons. MLMVCHHLDR2IPEDVAFAESRIRAETIAAEDILHDMGAISIISSDSQAMGRIGEVISRT 33

670 680 690 700 710 720 | | | | | | CANENS_1 WQTA DK MKAQT GPLKCD-----SS DNDN FRIR RY IAKYTINPAI ANGFS QYVGS VEVGKL GLYMAX_EMBR WQTA NK MKVQR GPLQPG-----ES DNDN FRIK RY IAKYTINPAI ANGFS QYVGS VEVGKL CANENS_JBUREIIB WQTA DK MKAER GPLQPD-----GS DNDN FRIK RY IAKYTINPAI VNGIS QYVGS VEVGKL GLYMAX_UBI WQTA DK MKSQR GPLQP------GE DNDN FRIK RY VAKYTINPAI ANGLS QYVGS VEAGKL SOLTUB_1 WQTA HK MKLFR GPLDID-----GS DNDN FRIK RY IAKYTINPAI ANGIS QFVGS VEVGKL ARATHA WQTA DK MKAQR GAIDPN-----MA DDDN SRIK RY IAKYTINPAI ANGFA DLIGS VEVKKL ORYSAT WQTA NK MKRQR GRLPISSSPDAAE DNDN FRIR RY IAKYTINPAI VNGFS DFVGS VEVGKL OSTLUC WQTA HS NKEQR GFLEEDAN----SGADN VRVK RY VAKYTINPAI AHGMS HKVGS LEVGKF ****.. * * : . ** *::**:*********.:*::. :**:*. *: Prim.cons. WQTADKMKAQRGPLQPD22PDAGSDNDNFRIKRYIAKYTINPAIANGFSQYVGSVEVGKL

730 740 750 760 770 780 | | | | | | CANENS_1 AD LVMWKPSFFG TKP EMVI KGG MVAWADI GD PNASIPTPEPV KM RPMYGTL GK AGGAL SI GLYMAX_EMBR AD LVMWKPSFFG AKP EMVI KGG VVAWADM GD PNASIPTPEPV KM RPMFGTL GK AGGAL SI CANENS_JBUREIIB AD LVIWKPSFFG AKP DIVI KGG SIAWADM GD PNGSIPTPEPV LM RPMYGTL GK AGSAL SI GLYMAX_UBI AD LVLWKPSFFG AKP EMVI KGG EVAYANM GD PNASIPTPEPV IM RPMFGAF GK AGSSH SI SOLTUB_1 AD LVVWKPSFFG AKP EMVI KGG VIAWSNM GD PNASIPTPEPV TM RPMFGAF SK AASSN SI ARATHA AD LVIWQPAFFG AKP EMII KGG NIAWANM GD ANASIPTPEPV IS RPMFGAF GKAGSEN SV ORYSAT AD LVIWKPSFFG AKP EMVI KGG AIACANM GD PNASIPTPEPV MM RPMFGAF GG AGSAN SI OSTLUC AD VVIWKPAFFG AKP EIVV KGG QIAWAQM GD PNASIPTPEPV IM RGMFGAL KP G--KT CI **:*:*:*:***:**::::*** :* :::**.*.******** * *:*:: . .: Prim.cons. ADLVIWKPSFFGAKPEMVIKGGVIAWANMGDPNASIPTPEPVIMRPMFGA2GKAGSA2SI

790 800 810 820 830 840 | | | | | | CANENS_1 AFVS KAA LDQRVNVL YGLNKRV EAV SNVRKLT KLDM KLN DA LPEITVDPESYTVKADGKL GLYMAX_EMBR AFVS KAA VDQR VHAL YGLNKRV EAV GNVRKLT KLDM KLN DS LPQITVDPDNYTVTADGEV CANENS_JBUREIIB AFVS KAA LDLG VKVL YGLNKRV EAV SNVRKLT KLDL KLN NS LPEITVCPETFTVTVDGQA GLYMAX_UBI AFVS KAA LDEG VKAS YGLNKRV EAV KNVRKLT KRDM KLN DT LPQITVDPETYTVTADGEV SOLTUB_1 AFVS KAA LDAG IKDS YRLNKRV EAV TNVRNIS KLDM KLN DA LPDIKVDPETYTVTADGTA ARATHA AFVS KAA LRKG VKEL YGLKKRV VAV SNVRQLT KLDM KLN DA LPEITVDPETYVVTANGEV ORYSAT AFVS KAA KEAG VAVQ YKLGKRV EAV GRVRGLT KLNM KLN DA LPKIDVDPETYTVTADGEV OSTLUC AFVS AAA AAAD VGAE YGLNKRV EAV VKCRGLS KDDM VLN NA CPRIEVDPETYEVRADGVV **** ** : * * *** ** . * ::* :: **:: * * * *:.: * .:* Prim.cons. AFVSKAALDAGVK2LYGLNKRVEAVSNVRKLTKLDMKLNDALPEITVDPETYTVTADGEV

850 | CANENS_1 LCVSE ATT VPL SR NYF LF GLYMAX_EMBR LTSFA TTF VPL SR NYF LF CANENS_JBUREIIB LSSEA VTT LPL SQ NYF IF GLYMAX_UBI LTCTA AKT VPL SR NYF LF SOLTUB_1 LTCPP ATT VPL SR NYF LF ARATHA LTCAP ADS VPL SR NYF LF ORYSAT LRCQP TPT VPL SR NYF LF OSTLUC LKSQP AQE LPL AR RYF IV * . :**::.**:. Prim.cons. LTCQPATTVPLSRNYFLF

Dados do alinhamento das seqüências completas: Dados do alinhamento da região do Comprimento do alinhamento: 858 peptídeo, destacada em amarelo: Idênticos (*): 376 ou 43.82 % Comprimento do alinhamento : 92 Fortemente similares (:): 166 ou 19.35 % Idênticos (*) : 26 ou 28.26 % Fracamente similares (.): 67 ou 7.81 % Fortemente similares (:) : 14 ou 15.22 % Diferentes: 249 is 29.02 % Fracamente similares (.) : 5 ou 5.43 % Seqüência 0001: CANENS_1 (840 resíduos). Diferentes : 47 ou 51.09 % Seqüência 0002: GLYMAX_EMBR (838 resíduos). Seqüência 0003: CANENS_JBUREIIB (840 resíduos). Seqüência 0004 : GLYMAX_UBI (837 resíduos). Seqüência 0005 : SOLTUB_1 (834 resíduos). Seqüência 0006 : ARATHA (838 resíduos). Seqüência 0007 : ORYSAT (843 resíduos). Seqüência 0008 : OSTLUC (840 resíduos).

34

Figura 6:Alinhamentomúltiplodeseqüênciasdeaminoácidosdeureasesoriundasdefungosede C. ensiformis ,para comparação.CódigosdosorganismosdeacordocomaTabela1. 10 20 30 40 50 60 | | | | | | ASPCLA ------ASPFUM ------ASPTER MPPITKPFFAFFFFAILVLATLMQLQAAVAEVSKAYINHSNTVLRGSSDLEDGPLANIAN NEUCRA ------AJECAP ------COCPOS ------NEOFIS ------SCHPOM ------CRYNGR ------CRYNNE ------AGABIS ------CANENS_1 ------CANENS_JBUREIIB ------

Prim.cons. MPPITKPFFAFFFFAILVLATLMQLQAAVAEVSKAYINHSNTVLRGSSDLEDGPLANIAN

70 80 90 100 110 120 | | | | | | ASPCLA ------ASPFUM ------ASPTER LLQENGLFGFPGFGGARATSPGAKSEVGEVGGKKKRKRAPHDPNAPKRALTPFFLYMQHN NEUCRA ------AJECAP ------COCPOS ------NEOFIS ------SCHPOM ------CRYNGR ------CRYNNE ------AGABIS ------CANENS_1 ------CANENS_JBUREIIB ------

Prim.cons. LLQENGLFGFPGFGGARATSPGAKSEVGEVGGKKKRKRAPHDPNAPKRALTPFFLYMQHN

130 140 150 160 170 180 | | | | | | ASPCLA ------ASPFUM ------ASPTER RAKISAELGSGARPKEVSDEGTRRWQTMPQAERDVWKQMYAENLALYKERMRLYKAGLPI NEUCRA ------AJECAP ------COCPOS ------NEOFIS ------SCHPOM ------CRYNGR ------CRYNNE ------AGABIS ------CANENS_1 ------CANENS_JBUREIIB ------

Prim.cons. RAKISAELGSGARPKEVSDEGTRRWQTMPQAERDVWKQMYAENLALYKERMRLYKAGLPI

190 200 210 220 230 240 | | | | | | ASPCLA ------ASPFUM ------ASPTER TDDARAANQLQQEAEATNAEESDETGDDDLAAEPPREPTPPRSGKRRRSEVKSTPKQAET NEUCRA ------AJECAP ------COCPOS ------NEOFIS ------SCHPOM ------CRYNGR ------CRYNNE ------AGABIS ------CANENS_1 ------CANENS_JBUREIIB ------

Prim.cons. TDDARAANQLQQEAEATNAEESDETGDDDLAAEPPREPTPPRSGKRRRSEVKSTPKQAET 35

250 260 270 280 290 300 | | | | | | ASPCLA ------ASPFUM ------ASPTER PKIPAPEAKTPAEKKASPEKKASPEKRKRGPKAAAAAQKDEASTPAAAGRKSLGGGEAPK NEUCRA ------AJECAP ------MKPRLETSQEFLEGRNKQHFLAFTGDPLQWR COCPOS ------NEOFIS ------SCHPOM ------CRYNGR ------CRYNNE ------AGABIS ------CANENS_1 ------CANENS_JBUREIIB ------

Prim.cons. PKIPAPEAKTPAEKKASPEKKASPEKRKR22222222Q222222222222222G222222

310 320 330 340 350 360 | | | | | | ASPCLA ------ASPFUM ------MHLIPKEVR ASPTER ETTKRAKKKRLYYGVMKSGVISPPAANQRPNGPYQLISAVWPTNPPSFLFSLLIPVAGPL NEUCRA ------AJECAP PEDREKAKGLLEESLLNNQLRPVTLLASNRIDDRQECSRRPARMIFRNVPVPDQSAFQRG COCPOS ------NEOFIS ------SCHPOM ------CRYNGR ------CRYNNE ------AGABIS ------CANENS_1 ------CANENS_JBUREIIB ------

Prim.cons. 2222222K22L22222222222222222222222Q22S2222222222222333333333

370 380 390 400 410 420 | | | | | | ASPCLA ------ASPFUM DRDLLPTTYIHIHIHSKVSTNHFAPAAGQARHLAIGISRPASSCARCAAQSCRGSGMDFP ASPTER AVVCGVRRLLLLLLLPSLSLSLFRFRRLLRFFFSSSPLLLEPQPCRVRGDIWFLATFLPQ NEUCRA ------AJECAP PVDCSVPRAFTCNDLGTAQSDAKPCKATRYPKLPPPHFACSIPAAFGHWSSLATSLLNPD COCPOS ------NEOFIS ------SCHPOM ------CRYNGR ------CRYNNE ------AGABIS ------CANENS_1 ------CANENS_JBUREIIB ------

Prim.cons. 3VDC3V3R333333L333S333F333A33333L33333333333AR3333S333S333P3

430 440 450 460 470 480 | | | | | | ASPCLA -MH LVPKELDK LVISQLGFLAQR RLARG VRL NHAEAV ALI SSNIH ELI RDG HYSVA DLM S ASPFUM LFS LRDPLRRL IEANSRPGSHLV ESARG IFP TSELEA GYH GAYSQ QLI RDG HYSVA DLM S ASPTER DRT LYLTRLDK LAISQLGFLAQR RLARG VRL NHAEAV ALI SSNLQ ELI RDG HYSVA DLM S NEUCRA -MH LIPKELDK LAISQLGFLAQR RLARG IKL NHSEAT ALI ANNLQ ELI RDG NHTVA DLM A AJECAP QMQ LVPRELDK LVTSQLGFLAQR RLARG VRL NHAEAT ALI ASNIQ ELI RDG HHTVA DLM A COCPOS -MQ LVPREIDK LTISNLGFLAQR RLARG VRL NHAEAT ALI AS-NL QLI RDG NNSVA DLM T NEOFIS -MH LIPRELDK LTIAHFGNLAQR RLSRG IRL NHAEAA ALI SSVLH ELI RDG HYAVA DLM A SCHPOM --- MQPRELHK LTLHQLGSLAQK RLCRG VKL NKLEAT SLI ASQIQ EYV RDG NHSVA DLM S CRYNGR -MH LLPRETDK LILTTLGTLAQR RLARG LIL NRAETI ALI SSQLQ EFV RDG RHSVA ELM D CRYNNE -MH LLPRETDK LIVTTLGTLAQR RLARG LIL NRAETI ALI SSQLQ EFI RDG RHSVA ELM D AGABIS -MR LLPREEAK VLLHQVGFIAQK RLARG VKL NKTEAV ALI ASVLQ ERI RDG RHSVA ELM Q CANENS_1 -MK LSPREVEK LGLHNAGYLAQK RLARG VRL NYTEAV ALI ASQIM EYA RDG EKTVA QLM C CANENS_JBUREIIB -MK LSPREVEK ISLHNAGFLAQK RLARGVRL NYSESV ALI ASQIL EHA RDG EKTVA QLM S : : . .**: . . . : ***. :**:** Prim.cons. 3MHL2PRELDKLT2SQLGFLAQRRLARGVRLNHAEAVALIASQLQELIRDGHHSVADLMS

36

490 500 510 520 530 540 | | | | | | ASPCLA I GKT MLG RRHVLPS VVHS LVE LQVEGTFLT GTYLVTVHHPISSD DGDLEK ALY GS FLP VP ASPFUM I GKT MLG RRHVLPS VVHT LVE LQVEGTFPT GTYLVTVHHPISSD DGDLEK ALY GS FLP IP ASPTER I GKT MLG RRHVLPS VPFT LIE LQVEGTFPT GTYLVTVHHPISSD DGDLEK ALY GS FLP VP NEUCRA L GAT MLG RRHVLPE VTST LHE IQVEGTFPS GTYLVTVHNPISSD DGDLAR ALY GS FLP IP AJECAP I GKM MLG RRHVLPS VTST VHE VFVEGTFPS GTYLVTIHEPISTE DGDLEK ALY GS FLP VP COCPOS IGKE MLG RRHVLPS VVAT LKQ VQVEGTFPT GTNLITVVNPVCSD DGDLEK ALY GS FLP VP NEOFIS L GRS ILG RRHVLPS VWFT LRQ LQIEGTFPT GTYLVTVQHPIANE EGDLAK ALY GS GLP VP SCHPOM L GKD MLG KRHVQPN VVHL LHE IMIEATFPD GTYLITIHDPICTT DGNLEH ALY GS FLP TP CRYNGR L GKK MLG RRHVRKG VPES IHT IQVEGTFPD GVFLVTVDDPISSD DGDLNN AFY GS FLP IP CRYNNE L GKK MLG RRHVRKG VPES IHT IQVEGTFPD GVFLVTVDDPISSD DGDLNN AFY GS FLP IP AGABIS H GKK ILG RRHVLPD VPAL LHE IQVEGTFLD GVFLVTVHQPICTE DGDLEA ALY GS FLP IP CANENS_1 L GQH LLG RRQVLPA VPHL LNA VQVEATFPD GTKLVTVHDPISRE NGELQE ALF GS LLP VP CANENS_JBUREIIB I GKH LLG RRQVLPA VPHL LNI IQVEATLPN GTKLVTVHDPIANE NGDLEE ALY GS FLP VP * :**:*:* * : : :*.*: *. *:*: .*:. :*:* *::** ** * Prim.cons. 2GKTMLGRRHVLPSVPHTLHEIQVEGTFP2GTYLVTVHDPISSDDGDLEKALYGSFLPVP

550 560 570 580 590 600 | | | | | | ASPCLA PAD--AFPDPNPEDYRPEKMP GAVLPL KE-----ER ITLSE GRKRIR LKVTSKGDRP IQV ASPFUM PAD--TFPDPNPDDYLPEKMP GAVLPV KN-----ER ITLND GRKRIR LKVMSKGDRP IQV ASPTER PSD--AFPDPKPEDYELEKMP GAVIPV KN-----ER ITLNA GRKRIK LKVMSKGDRP IQV NEUCRA PNDDSVFPLPPAAAYEASKQP GAVVCV KE-----AK VKLNE GRKRIR LRVTSKGDRP IQV AJECAP SKD--IFPDPDPEDYHPLKMP GAVIPV KQ-----SR IMLNE GRKRIS LKVTSKGDRP IQV COCPOS PKE--TFPDPDPDDYQPEKMP GAVIPL KTS----KK IELNA GRNRIM LKVTSRGDRP IQV NEOFIS PSD--PFPSSDPADYDEEKAP GAIVLL KGEDGKPVP ITLNE GRTRRC LEVTNCGSRP IQV SCHPOM SQE--LFPLEEEKLYAPENSP GFVEVL EG------EIELLP NLPRTP IEVRNMGDRP IQV CRYNGR SAD--VFPAAPEP---ADTLL GALICR KE------TVKINA SRRRFR LEVKNAGDRP VQV CRYNNE SAD--VFPAAPEP---ADTLL GALICR KE------PIKINA SRRRFK LEVKNAGDRP IQV AGABIS PQD--DFPVAPDSDYLPEKTA GAIIPK QE------DIVLNQ GRERIR LRITNTGDRP IQV CANENS_1 SLD------KFAETKEDNRIP GEILCE DE------CLTLNI GRKAVI LKVTSKGDRP IQV CANENS_JBUREIIB SLD------KFAESKEEHKIP GEIICA DG------RLTLNP GRKAVF LKVVNHGDRP IQV . : * : . : : . :.: . *.**:** Prim.cons. PADDSVFPDPPPEDYEPEKMPGAVIP2KE2DGKPERITLN2GRKRIRLKVTSKGDRPIQV

610 620 630 640 650 660 | | | | | | ASPCLA GSHYHF IETNPQLHFDRLR AYG YRLDIPAGTSV RFEPG DT KTVTLV EIAGHRII KGG NCL ASPFUM GSHYHF IETNPQ LHFDRLR AYG YRLDIPAGTSV RFEPG DT KTVTLV EIAGNRII KGG NSI ASPTER GSHYHF IETNPQ LHFDRLR AYG YRLDIPAGTSV RFEPG DT KTVTLV EIAGNRVI KGG NFI NEUCRA GSHYHF IETNPQ LEFDRAR AYG YRLDIPAGTSV RFEPG DT KTVTLV EIGGNKVI RGG NNL AJECAP GSHYHF IEVNPH LDFDRLR SYG YRLDIPAGTAI RFEPG DS KTVTLV EIGGNKVI HGG NFL COCPOS GSHYHF IEVNPQ LDFDRAK AYG YRLDIPAGTSI RFEPG AT KAIPLV EIGGKRII RGG NHI NEOFIS GSHYHF IETNPK LLFNRIH SYG YRLDKPAGASV RFEPG EK KVVNLV KIAGHKII QGG NWI SCHPOM GSHYHF IETNEK LCFDRSK AYG KRLDIPSGTAI RFEPG VM KIVNLI PIGGAKLI QGG NSL CRYNGR GSHYHF LETNPA LIFDRLL SYG YHLDIPAGTAV RFEPG EK KTVTMV EFGGKKIF HGG SGL CRYNNE GSHYHF LETNPA LIFDRLL SYG YHLDIPAGTAV RFEPG EK KTVTMV EFGGKKIF HGG SGL AGABIS GSHYHF IETNRA LSFDRLK SYG KRLDIAAGTAV RFEPG DT KAVTLV SISGNKVI SGG NSL CANENS_1 GSHYHF IEVNPY LTFDRRK AYG MRLNIAAGTAV RFEPG DC KSVTLV SIEGNKVI RGG NAI CANENS_JBUREIIB GSHYHF IEVNPY LTFDRRK AYG MRLNIAAGDSV RFEPG DH KTVNLV SIGGNKII RGG NAI ******:*.* * *:* :** :*: .:* ::***** * : :: : * ::: **. : Prim.cons. GSHYHFIETNPQLHFDRL2AYGYRLDIPAGTSVRFEPGDTKTVTLVEIGGNKIIRGGNSL

670 680 690 700 710 720 | | | | | | ASPCLA ASGKVEVSRAEEIMQR LQVDGFAHIPEPLS------ANAAPIAPFT MDREAYARM FGPTT ASPFUM ASGKVDISRAEEILQR LQVEGFAHVPEPAPT-----ADSALIAPFT MDREAYARM FGPTT ASPTER ASGKVDLARAEEIMQR LQVEGFAHTPDPTA------DAALVEPFTMDREIYARM FGPTT NEUCRA ASGKLDLTRAEEIIAK LQKAGFAHAPEEPVGD----AAAFISEPFT MDRRAYAVM FGPTV AJECAP ASGKVDLTRADEILER LQKAGFAHTPEPAS------GITHIDPHS MDRESYMRM FGATT COCPOS AVGQVDFRRVDEIIMR LQKAGFAYTPEPKQ------DAHLIEPFS MTREAYARM FGPTT NEOFIS APGKVDQGKIREIEER LRSKEFCHDGRPVR------LPAPDPCV MEREKYCEM FGPTE SCHPOM SKGVFDDSRTREIVDN LMKQGFMHQPESPLN-----MPLQSARPFV VPRKLYAVM YGPTT CRYNGR GNGSFDENLRETKVKE MVEKVGFGHKEQEK------IEEGPVTE MNREVYASM FGPTT CRYNNE ASGSFDENLRETKVKE MVEKGGFGHKDQEK------VEEGPTTE MNREVYASM FGPTT AGABIS ASGHIGTFRSEVLLED ILRRDFAHVSEPGA------LEVMEDTK IGRETYISM YGPTV CANENS_1 ADGPVNETNLEAAMHA VRSKGFGHEEEKDASEGFTKEDPNCPFNTF IHRKEYANK YGPTT CANENS_JBUREIIB ADGPVNEANCKAAMEI VCRREFGHKEEEDASEGVTTGDPDCPFTKA IPREEYANK YGPTI . * . : : *. * :*.* Prim.cons. ASGKVDE2RAEEIMERLQKKGFAHTPEP4ASEG2T2ADA2LIEPFTMDREAYARMFGPTT

37

730 740 750 760 770 780 | | | | | | ASPCLA GDLVR LGLT NLWI RVEKDYT---VYGDECA FGGGK TIREGMGQASERSEK-----ECL DT ASPFUM GDLVR LGLT NLWV RVEKDCT---VYGDECA FGGGK TLREGMGQSSERSAT-----ECL DT ASPTER GDLVR LGLT NLWV RVEKDYT---MYGDECS FGGGK SLRDGMAQASGRSSK-----DCL DT NEUCRA GDMVR LGAT DLWI KVEKDYT---VYGDECK FGGGK TLREGMGQATGRSDE-----ETL DM AJECAP GDLIR LGST DLWI KVEKDLT---SFGDECT FGGGK TLREGMGQASGRCSD-----DVL DT COCPOS GDVVK LGTT DLWI KVEKDLT---YYGDECS FGGGK TIRDGMGQATGRHSV-----DVL DT NEOFIS GDLVR LGLT NLWV EVERDCRKSKY YGDECN FGGGK TIRDGMGQTSNGSSGGGKGYTCA DT SCHPOM NDKIR LGDT NLIV RVEKDFT---EYGNESV FGGGK VIRDGTGQSSSKSMD-----ECL DT CRYNGR GDKIK LADM DLWI EVEKDYT---VYGDECK FGGGK VIRDGGGQASGRHDH-----EVL DL CRYNNE GDKIK LADM DLWI EVEKDYT---VYGEECK FGGGK VLRDGGGQASGRHEH-----EVL DL AGABIS GDRVR LGDT ELWI EVEHDET---VYGDEVK FGGGK VIREGMGQATNRSSN-----ETL DL CANENS_1 GDKIR LGDT NLLA EIEKDYA---LYGDECV FGGGK VIRDGMGQSCGHPPAIS-----LDT CANENS_JBUREIIB GDKIR LGDT DLIA EIEKDFA---LYGDESV FGGGK VIRDGMGQSSGHPPAMS-----LDT .* ::*. :* .:*:* :*:* ***** :*:* .*: * Prim.cons. GD2VRLGDT2LWIEVEKDYTKSKVYGDECKFGGGK2IRDGMGQASGRSS43SKGYECLDT

790 800 810 820 830 840 | | | | | | ASPCLA VITN ALII DWSGI FK ADIG IK DGIIVAIG KAGNPD VMDG VHPD MIIGTS TDVIAGENK IV ASPFUM VITN ALII DWSGI YK ADIG IK NGLISAIG KAGNPD MMDG VHPD MIVGSS TDVIAGENK IV ASPTER VVTN ALII DWTGI YK ADIG IR NGVIVGIG KAGNPD IMDG VHPD MVVGSS TDVIAGENK IV NEUCRA VVTN ALVV DWTGI YK ADIG VK AGVIVGIG KAGNPD VMDG VTPG MIVGSC TDVVAGEGK II AJECAP VITN ALIV DWTGI YV ADIG IK DGNIVGIG KAGNPD VMDG VYPN MFVGSG TDVISGERN IV COCPOS VLVN ALIV DWTGI YK ADIG LK DGLICGIG KAGNPD MMDG VTPN MIVGSS TDVIACEGK IV NEOFIS VITN ALII DHSGI FK ADIG VK DGKISGIG RAGNPD TMND IDEG IIIGAN TDVIAGENK II SCHPOM VITN AVII DHTGI YK ADIG IK NGYIVGIG KAGNPD TMDN IGEN MVIGSS TDVISAENK IV CRYNGR VITN ALIV DWTGI YK ADIG VK NGIIVGIG KAGNPD MMDG VTDG MIVGSS TEVISGEKL IT CRYNNE VITN ALIV DWNGI YK ADIG VK NGIIVGIG KAGNPD MMDG VTDG MIVGSS TEVIAGEKL II AGABIS VITN ALIV DWSGI YK ADIG VK NGFICGIG KAGNPD VMSN IHPT LVIGSSTEVIAGEKL II CANENS_1 VITN AVII DYTGI IK ADIG IK DGLIASIG KAGNPD IMNG VFSN MIIGAN TEVIAGEGL IV CANENS_JBUREIIB VITS AVII DYTGI IK ADIG IK DGLIASIG KAGNPD IMNG VFPN MIIGVN TEVICGEGL IV *:..*:::* .** ****:: * * .**:***** *..: :.:* *:*:. * * Prim.cons. VITNALIIDWTGIYKADIGIK2GLIVGIGKAGNPD2MDGV2PNMIVGSSTDVIAGENKIV

850 860 870 880 890 900 His407 | His409 | | | | | ASPCLA TAGGFDTHVHFICPQQVE EALASGVTTFLGGGTGP TTGTNATTCT PGSTH MR QMI QACDR ASPFUM TAGGFDTHIHFICPQQVD EALASGITTFLGGGTGP STGTNATTCT PGPTL MR QMI QACDG ASPTER TAGGFDTHIHFICPQQVD EALASGITSMLGGGTGP STGTNATTCT PGPTH MR QMI QATDH NEUCRA TAGGIDTHIHFICPQQAA EALAAGITTFLGGGTGP SAGTNATTCT PGAHY MR QML QACDS AJECAP TAGGIDTHIHLITPDQVQ EALASGVTTMLGGGTGP STGTNATTCT PGPNH MK NII QACDG COCPOS TAGGIDTHVHFICPQQVE EALASGVTTLLGGGTGP TEGSNATTCT PAPNQ FK TMM QACDH NEOFIS TAGGIDTHIHFLDPGQVM EGLCNGLTTFLGGGTGP STGSNATTCT PGPEN IK RMI QACDD SCHPOM TYGGMDSHVHFICPQQIE EALASGITTMYGGGTGP STGTNATTCT PNKDL IR SML RSTDS CRYNGR TAGRLDVHVHYISPQLMT EALASGITTVIGGGTGP ADGSNATTCT SSSFY MQ NMI KATDT CRYNNE TAGALDVHVHYICPQLMT EALASGITTVVGGGTGP ADGSNATTCT SSSFY MQ NMI KATDT AGABIS TAGGIDTHIHFICPQLVD EALASGLTTLIGGGTGP SAGTNATTCT PSPFY MR HML AATDG CANENS_1 TAGAIDCHVHYICPQLVY EAISSGITTLVGGGTGP AAGTRATTCT PSPTQ MR LML QSTDD CANENS_JBUREIIB TAGGIDCHVHYICPQSLD EAISSGITTVVGGGTGP TDGSRATTCT PAPTQ MK LML QSTDD * * :* *:* : * *.:. *:*:. ******: *:.*****. :: :: : * Prim.cons. TAGGIDTHVHFICPQQVDEALASGITTFLGGGTGPSTGTNATTCTPGPTYMRQMIQATD2

910 920 930 940 950 960 | | | Lys490 | | His519 | ASPCLA L PINVGITGKG NDC GGQS IEEQIL AG AAGLKLHEDWG STPAAIDT CLEMCDKFDVQCM IH ASPFUM L PINVGITGKG NDS GGKS IEEQIR AG AAGLKLHEDWG STPAAIDT CLDMCDKFDVQCM IH ASPTER L PVNIGITGKG NDC EGLS IEEQIH AG AAGLKLHEDWGSTPAAIDS CLQMCDKYDVQCM IH NEUCRA L PLNIGITGKG NDS SPSA LREQIL AG ACGLKLHEDWG TTPAAIDS CLTVCDELDVQCL IH AJECAP L PINFGITGKG NDC QPQS LREQIR AG AAGLKLHEDWG CTPAAIDT CLSVCDEYDVQCL IH COCPOS L PINVGLTGKG NDS GLPS LRDQCR AG AAGLKVHEDWG ATPAVIDT CLQVCDEFDIQCL IH NEOFIS L PVNIGITGKG NNS CKEG LEEQIL AG AVGLKIHEDWG ATPAVIKT CLAVCDEFDVQCM IH SCHPOM Y PMNIGLTGKG NDS GSSS LKEQIE AG CSGLKLHEDWG STPAAIDS CLSVCDEYDVQCL IH CRYNGR I PLNFGFTGKG SDS GTNA MRDIIE AG ACGLKVHEDWG ATAEVIDR ALSMADEYDVQIN LH CRYNNE V PLNFGFTGKG NDS GTNA LRDVIE AG ACGLKVHEDWG ATPEVIDR ALSIADEYDVQVN LH AGABIS L PMNFGFTGKG NDA GPTA IEEIVR AG ASGLKLHEDWG TTPAAIRN CLDVADKYDVQVT IH CANENS_1 L PLNFGFTGKG SSS KPDE LHEIIK AG AMGLKLHEDWG STPAAIDN CLTIAEHHDIQIN IH CANENS_JBUREIIB I PLNFGFTGKG SGS HPDE LHEIIK AG AMGLKLHEDWG CTPAAIDN CLAVAEQHDIQVN IH *:*.*:****... :.: **. ***:***** *. .* .* :.:. *:* :* Prim.cons. LPLNFGITGKGNDSGP4SL2EQIRAGAAGLKLHEDWGSTPAAIDTCLSVCDEYDVQC3IH

38

970 980 990 1000 1010 1020 | | His545 | | | | ASPCLA TDT LNE SGFVEQTIKAF KNRTIH TYHTEGAGGGHAPDII SVVEHP NVLP SSTN PTRP FTM ASPFUM TDT LNE SGFVEQTVKSF KNRTIH TYHTEGAGGGHAPDII SVVEHP NVLP SSTN PTRP FTM ASPTER TDT LNE SGFVEQTIQAF KNRTIH TYHTEGAGGGHAPDII RVVEHA NVLP SSTN PTRP FTM NEUCRA TDT LNE SGFVESTIAAF AGRTIH TYHTEGAGGGHAPDII SVVEHP NVLP SSTN PTRP FTR AJECAP TDT LNE SGFVEQSIQAF KGRAIH TYHTEGAGGGHAPDII SAVQFP NVLP SSTN PTRP FTL COCPOS TDT LNE SGFVEQTINAF KNRVIH TYHTEGAGGGHAPDII SVVEKP NVLP SSTN PTRP YTV NEOFIS TDT MNE SGFVDQTLEAI GDRVIH TYHTEGAGGGHAPDII RVVEHS NVLP ASTN PTRP YTL SCHPOM TDT LNE SSFVEGTFKAF KNRTIH TYHVEGAGGGHAPDII SLVQNP NILP SSTN PTRP FTT CRYNGR SDT LNE SGYVESTLAAI KGRTIH SYHTEGAGGGHAPDII VVCEYE NVLP SSTN PTRP YAV CRYNNE SDT LNE SGYVESTLAAI KGRTIH SYHTEGAGGGHAPDII VVCEYE NVLP SSTN PTRP YAV AGABIS TDT LNE SGFVESTIEAF GGRTIH TYHTEGAGGGHAPDII VVCGQN NVLP SSTN PTRP YAK CANENS_1 TDT LNE AGFVEHSIAAF KGRTIH TYHSEGAGGGHAPDII KVCGIK NVLP SSTN PTRP LTS CANENS_JBUREIIB TDT VNE SGFVEHTIAAF NGRTIH TYHSEGAGGGHAPDII KVCSMK NVLP SSTN TTRP LTS :**:**:.:*: :. :: .*.**:** ************ *:**:***.*** : Prim.cons. TDTLNESGFVEQTIAAFKGRTIHTYHTEGAGGGHAPDIISVVEHPNVLPSSTNPTRPFT2

1030 1040 1050 1060 1070 1080 | | | | | Asp633 | ASPCLA NT LDE HLDM LMVCHHLSKNIPED VAFA ESR IRAETIAAED VLHDIGAIS MM SSDSQA MGR ASPFUM NT LDE HLDM LMVCHHLSKNIPED VAFA ESR IRAETIAAED VLHDLGAIS MM SSDSQA MGR ASPTER NT LDE HLDM LMVCHHLSKNIAED VAFA ESR IRAETIAAED VLHDLGAIS MM SSDSQA MGR NEUCRA NT LDE HLDM LMVCHHLSKNIPED VAFA ESR IRAETIAAED VLHDLGAIS MM SSDSQA MGR AJECAP NT LDE HLDM VMVCHHLSKNIRED VAFA ESR IRAETIAAED VLHDLGAIS MI SSDSQA MGR COCPOS NT LDE HLDM VMVCHHLSKDIPED VAFA ESR IRSETIAAED VLHDTGAIS ML SSDSQA MGR NEOFIS NT VDE HLDM VMVAHHLSKEISED VSFA ESR IRAETIAAED VLHDKGAIS IM SSDSQA MGR SCHPOM NT LDE ELDM LMVCHHLSRNVPED VAFA ESR IRAETIAAED ILQDLGAIS MI SSDSQA MGR CRYNGR NT LDE HLDM LMICHGLDKSIPED IAFA DSR IRSETVAAED VLQDTGAIS MI SSDCQA MGR CRYNNE NT LDE HLDM LMVCHHLDKSIPED IAFA DSR IRSETVAAED VLQDTGAIS MI SSDCQA MGR AGABIS NT LDE HLDM LMVCHHLDKSIPED LDFA ESR IRAETVAAED VLHDIGAIS MI SSDSQA MGR CANENS_1 NT IDE HLDM LMVCHHLDREIPED LAFA HSR IRKKTIAAED VLNDIGAIS II SSDSQA MGR CANENS_JBUREIIB NT VDE HLDM LMVCHKLNREIPED LAFA SSR VREQTIAAED ILHDIGGIS II SSDAQA VGR **:**.***:*:.* *.:.: **: ** **:* :*:****:*:* *.**::***.**:** Prim.cons. NTLDEHLDMLMVCHHLSKNIPEDVAFAESRIRAETIAAEDVLHDLGAISMISSDSQAMGR

1090 1100 1110 1120 1130 1140 | | | | | | ASPCLA C GEV ILR TW NTA HKNKAQR GPLKEDEGTG-----ADNFRVK RY IS KYT INPA IAQGMGHL ASPFUM C GEV ILR TW NTA HKNKAQR GPLKEDEGTG-----ADNFRVK RY IS KYT INPA IAQGMSHL ASPTER C GEV ILR TW NTA HKNKEQR GPLPEDEGTG-----ADNFRVK RY IS KYT INPA IAQGMAHL NEUCRA C GEV ILR TW NTA HKNKLQR GPLPEDQGTGG----ADNHRVK RY IS KYT INPA LAQGMSHL AJECAP C GEV ILR TW NTA HKNKLQR GPLEEDRGTG-----ADNFRVK RY IS KYT INPA ITQGMSHL COCPOS C GEV VVR TW NTA HKNKMER GRLKEDEGTD-----SDNFRVK RY IS KYT INPA IAQGMAHT NEOFIS V GEV ILR TW HTA HKMNEQE GQLPEDKKKYPHDARV NNYRVK RY VS KYT INPA IAQGMSHL SCHPOM C GEV ISR TW KTA HKNKLQR GALPEDEGSG-----VDNFRVK RY VS KYT INPA ITHGISHI CRYNGR I GEV VTR TW RTA AKMKQFR GPLE--GDEPTR---- DNNRVK RY VA KYT INPA ITHGMSHL CRYNNE I GEV ITR TW RTA AKMKQFR GPLE--GDEPTR---- DNNRVK RY VA KYT INPA ITHGMSHL AGABIS I GEV ISR TW RTA SKMREVR GPLTDLGDDGRK---- DNARVK RY IA KYT VNPA IAHGISHL CANENS_1 V GEV ISR TW QTA DKMKAQT GPLKCDSSDN------DNFRIR RY IA KYT INPA IANGFSQY CANENS_JBUREIIB I GEV ISC TW QTA DKMKAER GPLQPDGSDN------DNFRIK RY IA KYT INPA IVNGISQY ***: **.** * . * * :* *::**::***:***:.:*:.: Prim.cons. CGEVILRTWNTAHKNKAQRGPL2EDEGTGTRDARADNFRVKRYISKYTINPAIAQGMSHL

1150 1160 1170 1180 1190 1200 | | | | | | ASPCLA IGSVEV GKL ADLV IWRPGT FG TK PAQ IL KSGMI VASQMGDP NGS IPTIEPIIMRTQF AAY ASPFUM IGSVEV GKL ADLV IWHPST FG TK PAQ VL KSGMI VASQMGDP NGS IPTIEPVVMRRQF GAF ASPTER IGSIEV GKV ADLV IWHPSS FG TK PTQ VL KSGTI VAAQMVFH TTF LALYLNTWLTLLT G-- NEUCRA IGSIEP GKL ADLV VWDPAW FG TK PSL VI KSGLI ASAMMGDP NAS IPTVQPVIARPMF APM AJECAP IGSVEV GKV ADLV MWKFSD FG TK PNM VL KSGMI AMAMMGDA NGS ISTIEPMLMRAMY AAH COCPOS IGSVEV GKT ADLV LWKFAN FG TK PSM VL KSGMA VSAQMGDP NGS IPTIEPIIMRPMY ASL NEOFIS IGSVEK GKL ADLV IWSPSS FG TK PLQ VL KSGMI AVSLGGDP NGS IPTIEPMVMRPQF APH SCHPOM VGSVEI GKF ADLV LWDFAD FG AR PSM VL KGGMI ALASMGDP NGS IPTVSPLMSWQMF GAH CRYNGR IGQVAV GCL ADLV LLDGES FG AR PEM IL KGGVI AWAAVGDA NAS IPTVQPVLGRPMW ALS CRYNNE IGQVAV GCL ADLV FWTAES FG AR PEM IL KGGVI AWAAMGDA NAS IPTVQPVIGRPMW GSQ AGABIS VGHVAV GTL ADLV LWKPEN FG SK PEM IL KAGVI TYSQMGDA NAS IPSVQPFYSKPMW GAK CANENS_1 VGSVEV GKL ADLV MWKPSF FG TK PEM VI KGGMV AWADIGDP NAS IPTPEPVKMRPMY GTL CANENS_JBUREIIB VGSVEV GKL ADLV IWKPSF FG AK PDI VI KGGSI AWADMGDP NGS IPTPEPVLMRPMY GTL :* : * ****. **::* ::*.* . : . :. . Prim.cons. IGSVEVGKLADLVIWKPSSFGTKPEMVLKSGMIAWAQMGDPNGSIPT2EPVIMRPMFGA2

39

1210 1220 1230 1240 1250 1260 | | | | | | ASPCLA VPSTSV---MWVSQASIDAGIVQSYGIKKRIEAVKNCRNIGKKDMKFNDLMPRMHVDPES ASPFUM VPSTSI---MWVSQASIDDGIVQSYGLKKRIEAVRNCRNIGKKDMKFNDVMPKMRVDPES ASPTER ------NEUCRA VAKSKV---LFVSQASLDSGAIEGYGLKSRVEAVKGCRTVGKKDMKFNERMPRMKVDPER AJECAP LPRTSI---MFVSQASKSLGIIDSYGLKRRVEVVKNCRNISKKDMKFNDVMPKMRVDPES COCPOS NPKASI---MFVSQASIKLGIIDSYHLKKRIEPVKNCRNISKRDMKFNDIMPKMRVDPES NEOFIS VPRTSI---MFVSQASKNK-VEEEYGLKKTIEAVKHCRTIDTNQIQPDPKPKPEPLSKKH SCHPOM DPERSI---AFVSKASITSGVIESYGLHKRVEAVKSTRNIGKKDMVYNSYMPKMTVDPEA CRYNGR LRPLHS-IQLFVSQASLDKDLVKRYRLRKRAEAVKNCRSIGKKDMKWNDTMPKMTVDPET CRYNNE PEAAALNSIVWVSQASLDKDLVKRFNIKKRAEAVKNCRAIGKKDMKWNDSMPKMTVDPET AGABIS PGSAALNSVAFVSQVSITSRVIESYGLSKKIEAVRGCRDIGKKDMKWNDTTPAMKVDPES CANENS_1 GKAGGALSIAFVSKAALDQRVNVLYGLNKRVEAVSNVRKLTKLDMKLNDALPEITVDPES CANENS_JBUREIIB GKAGSALSIAFVSKAALDLGVKVLYGLNKRVEAVSNVRKLTKLDLKLNNSLPEITVCPET

Prim.cons. VP2TSI2SIMFVSQAS2D3GVIESYGLKKR2EAVKNCRNIGKKDMKFND3MPKMTVDPES

1270 1280 1290 1300 1310 1320 | | | | | | ASPCLA YRVEADGVLCEAEPAVELPLTQDYFVY------ASPFUM YVVEADGVLCDAEPAEALPLTQDYFVY------ASPTER ------NEUCRA YTVEADGEVCTAEPSSELPLTQSYFVY------AJECAP YDRTVQHITYQAKGENGWSREDVLLVLEKQKSRKAGER------COCPOS YVVEADGEECTAEPVSELPLTQDYFVY------NEOFIS MKYNSEMPEMEVDPETFSEPTVKYATWLLQRRCPLRKTISYSESGTEVCSHDMGANFMEL SCHPOM YTVTADGKVMECEPVDKLPLSQSYFIF------CRYNGR YDVRADGVLCDVPPADKLPLTRRYFVY------CRYNNE YDVHADGVLCDVPPADKLPLTKRYFVY------AGABIS YEVRADGVLMDVKPVERVALATPYNLF------CANENS_1 YTVKADGKLLCVSEATTVPLSRNYFLF------CANENS_JBUREIIB FTVTVDGQALSSEAVTTLPLSQNYFIF------

Prim.cons. YTVEADGVLCD2EPA22LPLTQDYFVY22Q22222222ISYSESGTEVCSHDMGANFMEL

1330 | ASPCLA ------ASPFUM ------ASPTER ------NEUCRA ------AJECAP ------COCPOS ------NEOFIS FGPAFLSVLPFGEA SCHPOM ------CRYNGR ------CRYNNE ------AGABIS ------CANENS_1 ------CANENS_JBUREIIB ------

Prim.cons. FGPAFLSVLPFGEA

Dados do alinhamento das seqüências completas: Dados do alinhamento da região do Comprimento do alinhamento: 1334 peptídeo, destacada em amarelo: Idênticos (*): 246 ou 18.44 % Comprimento do alinhamento: 99 Fortemente similares (:): 135 ou 10.12 % Idênticos (*): 19 ou 19.19 % Fracamente similares (.): 72 ou 5.40 % Fortemente similares (:): 11 ou 11.11 % Diferentes: 881 ou 66.04 % Fracamente similares (.): 7 ou 7.07 % Seqüência 0001 : ASPCLA (837 resíduos). Diferentes : 62 ou 62.63 % Seqüência 0002 : ASPFUM (908 resíduos). Seqüência 0003 : ASPTER (1171 resíduos). Seqüência 0004 : NEUCRA (842 resíduos). Seqüência 0005 : AJECAP (999 resíduos). Seqüência 0006 : COCPOS (836 resíduos). Seqüência 0007 : NEOFIS (899 resíduos). Seqüência 0008 : SCHPOM (835 resíduos). Seqüência 0009 : CRYNGR (832 resíduos). Seqüência 0010 : CRYNNE (833 resíduos). Seqüência 0011 : AGABIS (838 resíduos). Seqüência 0012 : CANENS_1 (840 resíduos). Seqüência 0013 : CANENS_JBUREIIB (840 resíduos).

40

Figura 7:alinhamentomúltiplodeseqüênciasdeaminoácidosdasubunidadeCdeureasesoriundasdebactériaseda regiãocorrespondentenaJBUREIIBenaisoformamajoritáriadeureasede C. ensiformis .Códigosdosorganismosde acordocomaTabela1.

10 20 30 40 50 60 | | | | | | HELPYL MKK ISRKEYA SMYGPT TGD KV RL GDT DLIA EVEHDYTIYG EELK FGGGK TLREGM SQS-- HELHEP MIK ISRKQYA SMYGPT TGD KV RL GDT NLFA EIEKDYTLYG EEIK FGGGK TIRDGM AQS-- BACPAS -MK INRQQYA ESYGPT VGD EV RL ADT DLWI EVEKDYTTYG DEVN FGGGK VLREGM GENGT BACSUB -MK MSREEYA ELFGPT TGD KI RL GDT DLWI EVEKDFTVYG EEMI FGGGK TIRDGM GQNGR KLEAER MSN ISRQAYA DMFGPT VGD KV RL ADT ELWI EVEDDLTTYG EEVK FGGGK VIRDGM GQG-- KLEPNE MSN ISRQAYA DMFGPT VGD KV RL ADT ELWI EVEDDLTTYG EEVK FGGGK VIRDGM GQG-- CANENS_1 NTF IHRKEYA NKYGPT TGD KI RL GDT NLLA EIEKDYALYG DECV FGGGK VIRDGM GQS-C CANENS_JBUREIIB TKA IPREEYA NKYGPT IGD KI RL GDT DLIA EIEKDFALYG DESV FGGGK VIRDGM GQS-S : *: **. :*** **::**.**:* *:*.* : **:* *****.:*:**.:. Prim.cons. M3KISR2EYA4MYGPTTGDKVRLGDTDLW2EVEKDYT2YGEEVKFGGGKVIRDGMGQSG4

70 80 90 100 110 120 | | | | | | HELPYL NNPSKEE LDLII TNA LIV DYTGI YKAD IGIKDGKIAGIGK GGN KDMQD GVKNN LSVGPA T HELHEP ASTYTNE LDAVI TNA MII DYTGI YKAD IGIKGGKIVGIGK AGN PDTQD SVNEA MVVGAA T BACPAS YTRTENV LDLLL TNA LIL DYTGI YKAD IGVKDGYIVGIGK GGN PDIMD GVTPN MIVGTA T BACSUB ITGKDGA LDLVI TNV VLL DYTGI VKAD VGVKDGRIVGVGK SGN PDIMD GVDPH MVIGAG T KLEAER QMLAADC VDLVL TNA LIV DHWGI VKAD IGVKDGRIFAIGK AGN PDIQP NVT-- IPIGAA T KLEPNE QMLAADC VDLVL TNA LIV DHWGI VKAD IGVKDGRIFAIGK AGN PDIQP NVT-- IPIGAA T CANENS_1 GHPPAIS LDTVI TNA VII DYTGI IKAD IGIKDGLIASIGK AGN PDIMN GVFSN MIIGAN T CANENS_JBUREIIB GHPPAMS LDTVI TSA VII DYTGI IKAD IGIKDGLIASIGK AGN PDIMN GVFPN MIIGVN T :* ::*..:::*: ** ***:*:*.* * .:**.** * .* : :* * Prim.cons. 23P2A23LDLVITNALI2DYTGI2KADIG2KDGRI2GIGKAGNPDI2DGVTPNMIIGAAT

130 140 150 160 170 180 | His407 | His409 | | | | HELPYL EALAG EG LIVTAG GIDTHIHFISPQQIPT AFASGVTT MIGGGTGP ADGTNATT ITPG RRN HELHEP EVIAG EG QIITAG GIDTHIHFISPTQIPT ALYSGVTT MIGGGTGP AAGTNATT CTPG KWN BACPAS EVIAA EG KIVTAG GIDTHVHFINPDQVDV ALANGITT LFGGGTGP AEGSKATT VTPG PWN BACSUB EVISG EG KILTAG GVDTHIHFICPQQMEV ALSSGVTT LLGGGTGP ATGSKATT CTSG AWY KLEAER EVIAA EG KIVTAG GIDTHIHWICPQQAEE ALVSGVTT MVGGGTGP AAGTHATT CTPG PWY KLEPNE EVIAA EG KIVTAG GIDTHIHWICPQQAEE ALVSGVTT MVGGGTGP AAGTHATT CTPG PWY CANENS_1 EVIAG EG LIVTAG AIDCHVHYICPQLVYE AISSGITT LVGGGTGP AAGTRATT CTPS PTQ CANENS_JBUREIIB EVICG EG LIVTAG GIDCHVHYICPQSLDE AISSGITT VVGGGTGP TDGSRATT CTPA PTQ *.:..** *:***.:* *:*:* * *: .*:**:.******: *:.*** *.. Prim.cons. EVIAGEGKIVTAGGIDTHIHFICPQQ3EEALSSGVTTMVGGGTGPAAGT4ATTCTPGPW2

190 200 210 220 230 240 | | | | Lys490 | | HELPYL LKF ML RAAE EY SMNFGFLAKG NV SNDAS LADQIEAG AIGFKIHEDWG TTP SA INHALDVA HELHEP MHQ ML RAAE SY AMNLGFFGKG NS SNEEG LEEQIKAG ALGLKVHEDWG STP AA INHALNVA BACPAS IEK ML KSTE GL PINVGILGKG HG SSIAP IMEQIDAG AAGLKIHEDWG ATP AS IDRSLTVA BACSUB MAR ML EAAE EF PINVGFLGKG NA SDKAP LIEQVEAG AIGLKLHEDWG TTP SA IKTCMEVV KLEAER ISR ML QAAD SL PVNIGLLGKG NV SQPDA LREQVAAGVIGLKIHEDWG ATP AA IDCALTVA KLEPNE ISR ML QAAD SL PVNIGLLGKG NV SQPDA LREQVAAG VIGLKIHEDWG ATP AA IDCALTVA CANENS_1 MRL ML QSTD DL PLNFGFTGKG SS SKPDE LHEIIKAG AMGLKLHEDWG STP AA IDNCLTIA CANENS_JBUREIIB MKL ML QSTD DI PLNFGFTGKG SG SHPDE LHEIIKAG AMGLKLHEDWG CTP AA IDNCLAVA : **.::: .:*.*: .** * : : : **. *:*:***** **::*. .: :. Prim.cons. M2RMLQAA2SLP4NFGFLGKGNVS2PD3L2EQIKAGAIGLKIHEDWGATPAAID3ALTVA

250 260 270 280 290 300 | His519 | | His545 | | | HELPYL DKYDVQVAIHTDT LNE AGCVEDTM AAIAGRTMHTF HTEGAGGGHAPDI IKV AG EH NILP A HELHEP QKYDVQVAIHTDT LNE AGCVEDTM KAIDGRTIHTF HTEGAGGGHAPDI IKA AG EP NILP A BACPAS DEADVQVAIHSDT LNE AGFLEDTL RAINGRVIHSF HVEGAGGGHAPDI MAM AG HP NVLP S BACSUB DEADIQVAIHTDT INE AGFLENTL DAIGDRVIHTY HIEGAGGGHAPDI MKL AS YA NILP S KLEAER DEMDIQVALHSDT LNE SGFVEDTL AAIGGRTIHTF HTEGAGGGHAPDI ITA CA HP NILP S KLEPNE DEMDIQVALHSDT LNE SGFVEDTL AAIGGRTIHTF HTEGAGGGHAPDI ITA CA HP NILP S CANENS_1 EHHDIQINIHTDT LNE AGFVEHSI AAFKGRTIHTY HSEGAGGGHAPDI IKV CG IK NVLP S CANENS_JBUREIIB EQHDIQVNIHTDT VNE SGFVEHTI AAFNGRTIHTY HSEGAGGGHAPDI IKV CS MK NVLP S :. *:*: :*:**:**:* :*.:: *: .*.:*::* ***********: .. *:**: Prim.cons. DE4DIQVAIHTDTLNEAGFVEDTLAAIGGRTIHTFHTEGAGGGHAPDIIK22GHPNILPS

41

310 320 330 340 350 360 | | | | | | HELPYL ST NP TIPFTVNT EA EH MDM LMVC HH LDKSIKED VQFADSR IRPQ TIAAED TLHDMGIFSI HELHEP ST NP TIPFTKNT AD EH LDM LMVC HH LDKKIKED VAFADSR IRPE TIAAED TLHDMGIFSI BACPAS ST NP TRPFTVNT ID EH LDM LMVC HH LKQNIPED VAFADSR IRPE TIAAED ILHDLGIISM BACSUB ST TP TIPYTVNT MD EH LDM MMVC HH LDAKVPED VAFSHSR IRAA TIAAED ILHDIGAISM KLEAER ST NP TLPYTLNT ID EH LDM LMVC QH LDPDIAED VAFAESR IRRE TIAAED VLHDLGAFSL KLEPNE ST NP TLPYTLNT ID EH LDM LMVC HH LDPDIAED VAFAESR IRRE TIAAED VLHDLGAFSL CANENS_1 ST NP TRPLTSNT ID EH LDM LMVC HH LDREIPED LAFAHSR IRKK TIAAED VLNDIGAISI CANENS_JBUREIIB ST NT TRPLTSNT VD EH LDM LMVC HK LNREIPED LAFASSR VREQ TIAAED ILHDIGGISI **..* * * ** **:**:***::*. .: **: *: **:* ****** *:*:* :*: Prim.cons. STNPT2P2TVNTIDEHLDMLMVCHHLD33IPEDVAFADSRIRPETIAAED2LHD2GA2SI

370 380 390 400 410 420 Asp633 | | | | | | HELPYL T SSDSQAMGR VGE VI TR TWQ TADKNKKEFGRLKE EKGDNDN FRIKRY LS KYTINPAIAHG HELHEP T SSDSQAMGR VGE VI TR TWQ TADKCKNEFGALKE ECGENDN FRIKRY IS KYTINPA IAHG BACPAS M STDALAMGR AGE MV LR TWQ TADKMKKQRGPLAE EKNGSDN FRLKRY VS KYTINPA IAQG BACSUB T SSDSQAMGR VGE VI IR TWQ VADKMKKQRGALAG E-NGNDN VRAKRY IA KYTINPA ITHG KLEAER T SSDSQAMGR VGE VI LR TWQ VAHRMKVQRGALAE ETGDNDN FRVKRY IA KYTINPA LTHG KLEPNE T SSDSQAMGR VGE VI LR TWQ VAHRMKVQRGALAE ETGDNDN FRVKRY IA KYTINPA LTHG CANENS_1 I SSDSQAMGR VGE VI SR TWQ TADKMKAQTGPLKC DSSDNDN FRIRRY IA KYTINPA IANG CANENS_JBUREIIB I SSDAQAVGR IGE VISC TWQ TADKMKAERGPLQP DGSDNDN FRIKRY IA KYTINPA IVNG *:*: *:** **:: ***.*.: * : * * : . .**.* :**::*******:.:* Prim.cons. TSSDSQAMGRVGEVILRTWQTADKMKKQRGALAEE2GDNDNFRIKRYIAKYTINPAIAHG

430 440 450 460 470 480 | | | | | | HELPYL IS EYVGS VEVGK VADLV LWSPAFFG VKPNM II KGGFIALSQMGD ANA SIPTP QPV YYRE M HELHEP IS EYVGS VEVGK FADLV LWKPSMFG IKPEM IL KNGMIVAAKIGD SNA SIPTPEPV VYAP M BACPAS IA HEVGS IEEGK FADLV LWEPKFFG VKADR VI KGGIIAYAQIGD PSA SIPTP QPV MGRR M BACSUB LS HEVGS VEKGK LADLV LWDPVFFG VKPEL VL KGGMIARAQMGD PNA SIPTP EPV FMRQ M KLEAER IA HEVGS IEVGK LADLV VWSPAFFG VKPAT VI KGGMIAIAPMGD INA SIPTP QPV HYRP M KLEPNE IA HEVGS IEVGK LADLV VWSPAFFG VKPAT VI KGGMIAIAPMGD INA SIPTP QPV HYRP M CANENS_1 FS QYVGS VEVGK LADLV MWKPSFFG TKPEM VI KGGMVAWADIGD PNA SIPTP EPV KMRP M CANENS_JBUREIIB IS QYVGS VEVGK LADLV IWKPSFFG AKPDI VI KGGSIAWADMGD PNG SIPTP EPV LMRP M ::. ***:* **.****:*.* :** *. ::*.* :. : :** ..*****:** * Prim.cons. ISH2VGSVEVGKLADLVLW2P2FFGVKPEMVIKGGMIA2AQMGDPNASIPTP2PVHYRPM

490 500 510 520 530 540 | | | | | | HELPYL FAHH GKAKYDAN IT FVSQAAYDKG IKEEL GLERQ VLP VKN CRNITKKDMQF NDTT AHIEV HELHEP FGSY GKAKYNCA IT FVSKIAYDCH IKEEL GLERI LLP VKN CRNITKKDMKF NDVI TPIEV BACPAS YGTV GDLIHDTN IT FMSKSSIQQG VPAKL GLKRR IGT VKN CRNIGKKDMKW NDVT TDIDI BACSUB YASY GKANRSTS IT FMSQASIERG VAESL GLEKR ISP VKN IRKLSKLDMKL NSAL PKIEI KLEAER FGAL GSARHHCR LT FLSQAAAANG VAERL NLRSA IAV VKG CRTVQKADMVH NSLQ PNITV KLEPNE FGAL GSARHHCR LT FLSQAAAANG VAERL NLRSA IAV VKG CRTVQKADMVH NSLQ PNITV CANENS_1 YGTL GKAGGALS IA FVSKAALDQR VNVLY GLNKR VEA VSN VRKLTKLDMKL NDAL PEITV CANENS_JBUREIIB YGTL GKAGSALS IA FVSKAALDLG VKVLY GLNKR VEA VSN VRKLTKLDLKL NNSL PEITV :. *. ::*:*: : : .*. : *.. *.: * *: *. . * : Prim.cons. 2GTLGKA3H3CSITFVS2AA4D2GV2E3LGLE2RI3PVKNCR22TK2DMKLND3LP2ITV

550 560 570 | | | HELPYL N SETY HVFVDGKE VTS KPANK VSLAQLFSIF HELHEP N PETY EVRVNNTK ITS KPVEK VSLGQLYCLF BACPAS N PETY EVKVDGEV LTC EPVKE LPMAQRYFLF BACSUB D PKTY QVFADGEE LSC QPVDY VPLGQRYFLF KLEAER D AQTY EVRVDGEL ITS EPADV LPMAQRYFLF KLEPNE D AQTY EVRVDGEL ITS EPADV LPMAQRYFLF CANENS_1 D PESY TVKADGKL LCV SEATT VPLSRNYFLF CANENS_JBUREIIB C PETF TVTVDGQA LSS EAVTT LPLSQNYFIF .::: * .:. : . . :.:.: : :* Prim.cons. DPETYEVRVDGELLTSEP2D32PLAQRYFLF

Dados do alinhamento: Seqüência 0001 : HELPYL (569 resíduos). Comprimento do alinhamento: 571 Seqüência 0002 : HELHEP (569 resíduos). Idênticos (*) : 216 ou 38.00 % Seqüência 0003 : BACPAS (570 resíduos). Fortemente similares (:) : 123 ou 21.54 % Seqüência 0004 : BACSUB (569 resíduos). Fracamente similares (.) : 69 ou 12.08 % Seqüência 0005 : KLEAER (567 resíduos). Diferentes : 162 ou 28.37 % Seqüência 0006 : KLEPNE (567 resíduos). Seqüência 0007 : CANENS_1 (570 resíduos). Seqüência 0008 : CANENS_JBUREIIB (570 resíduos).

42

4.3 Determinação de estruturas terciárias de proteínas Asabordagensparadeterminaçãoeprediçãodeestruturastridimensionaisde proteínas podem ser classificadas de acordo com a técnica predominantemente utilizadaparacalcularomodelo( Šali&Blundell,1993 ).Osmétodosexperimentais incluemacristalografiaderaiosXearessonânciamagnéticanuclear(RMN). Na cristalografia de raios X, a interação dos raios X com elétrons das proteínas organizadas em cristais é utilizada para obtenção de um mapa de densidadeeletrônicadaproteína,quepodesertraduzidoemtermosdeummodelo atômico.Acristalizaçãodeproteínas,entretanto,éumprocessolento,complexoe, algumas vezes, impossível de realizarse. As dificuldades abrangem tanto o processodeproduçãoepurificaçãodaproteínadeinteressequantoainduçãoda cristalizaçãoeotransportedoscristais( Branden&Tooze,1999 ). NoRMN,aspropriedadesmagnéticasdosspinsdosnúcleos atômicos das proteínassãoutilizadasparaobtençãodeumalistaderestriçõesespaciaisentreos átomosdamolécula,daqualpodemserextraídosdadosquelevamàdefiniçãoda estrutura tridimensional da proteína. Esta técnica é aplicada a proteínas de até ~35kDa em solução, obtendo estruturas múltiplas para uma mesma proteína (refletindosuaflexibilidadeemmeiobiológico)( Branden&Tooze,1999 ). Na cristalografia de raios X, apenas uma estrutura média é obtida, e esta corresponde à proteína empacotada em uma matriz cristalina, com potencial diferenciaçãodesuaestruturatridimensionalemrelaçãoàquelaobtidaemsolução (Branden&Tooze,1999 ). As abordagens teóricas para determinação e predição de estruturas tridimensionaisdeproteínaspodemserdivididasem métodosfísicoseempíricos. Osmétodosfísicosdeprediçãobaseiamseeminteraçõesentreátomoseincluema dinâmica molecular e a minimização de energia, enquanto os métodos empíricos dependem de estruturas de proteínas que já tenham sido determinadas experimentalmente ( Šali & Blundell, 1993 ). Esses últimos incluem as modelagens combinatóriaecomparativa. 4.4 Modelagem molecular comparativa Amodelagemmolecularcomparativautilizaestruturasprotéicasdeterminadas experimentalmente(moldes)parapredizeraconformaçãodeoutrasproteínascom seqüênciassimilaresdeaminoácidos(alvos).Issoépossívelporqueumapequena 43 mudança na seqüência de aminoácidos geralmente resulta em uma pequena mudança na estrutura ( Chothia & Lesk, 1986 ) e estimase que um terço das seqüênciasconhecidassejamrelacionadasapelomenosumaestruturaconhecida (MartíRenom et al .,2000 ).Amodelagemcomparativanãoétãoacuradaquantoa cristalografia de raios X ou RMN ( Šali & Blundell, 1993 ),maséomelhormétodo disponível para predição de estruturas de proteínas ( Jones, 2000 ). Além disso, mesmo modelos de baixa resolução podem ser úteis para a biologia, visto que alguns aspectos da função podem, algumas vezes, serem preditos a partir de aspectosestruturaisgrosseirosdomodelo( MartíRenom et al .,2000 ). Todososmétodosdemodelagemcomparativaconsistememquatropassos seqüenciais (Figura 8 ):seleçãodomolde,alinhamentomoldealvo,construção do modeloeavaliaçãodomodelo.Seomodelonãoforsatisfatório,ostrêsprimeiros passos podem ser repetidos até que um modelo satisfatório seja obtido ( Martí Renomet al .,2000 ).

Figura 8: Passos na modelagem comparativa por homologia (retirado de Fernandes, 2002; originalmente adaptado de MartíRenom et al .,2000). 44

Uma vez alinhados molde e alvo, uma variedade de métodos pode ser utilizadaparaconstruiromodelotridimensionaldaproteínaalvo.Ométodooriginal eaindaamplamenteutilizadoéamodelagempormontagemdecorporígido.Outra família de métodos, a modelagem por similaridade de segmentos, se baseia nas posições aproximadas de átomos conservados nos moldes. O terceiro grupo de métodos, a modelagem por satisfação de restrições espaciais, usa distâncias geométricasoutécnicasdeotimizaçãoparasatisfazerrestriçõesespaciaisextraídas doalinhamento( Sánchez&Šali,2000 ).Taisrestriçõesderivadasdahomologiasão geralmentecomplementadasporrestriçõesestereoquímicas dos comprimentosde ligação, ângulos de ligação, ângulos diedro e contatos entre átomos não ligados, obtidasdocampodeforçademecânicamolecular.Omodeloéentãoderivadoao minimizaremseasviolaçõesdetodasasrestriçõesobtidas.Nocasodoprograma Modeller, isso é feito por um método de otimização de espaço real: o modelo é construído usando restrições de distância e de ângulos diedro para a seqüência alvo, obtidos de seu alinhamento com as estruturasmolde. Então, as restrições espaciais e os termos do campo de força CHARMM22, que impõem a estereoquímicaadequada,sãocombinadosemumafunçãoobjetiva.Finalmente,o modeloégeradoaootimizarseafunçãoobjetivanoespaçocartesiano. Quantomenorasimilaridadeentrealvoemolde,maiorapropensãoaerroda modelagem( Sánchez&Šali,2000 ).Errosemmodelagemcomparativapodemser explicadosbaseandosenosfatosdequeomodeloassemelhaseaosmoldestanto quantopossível,equeoprocedimentodemodelagemnãoconseguesuperarerros de alinhamento. Os erros típicos em modelagem comparativa incluem: erros de empacotamentodecadeiaslaterais,distorçõesealteraçõesemregiõesalinhadas corretamente,errosemregiõessemmolde,errosdevidos a alinhamentos ruinse utilizaçãodemoldesincorretos( Sánchez&Šali,2000 ). Apóssuaconstrução,éimportanteverificarospossíveiserrosdomodelo.As avaliações podem ser de dois tipos:internas,queavaliam a autoconsistência do modelo, se ele satisfez ou não asrestriçõesusadas para calculálo; ou externas, baseadaseminformaçõesquenãoforamutilizadasparacalcularomodelo( Sánchez &Šali,2000 ).Entreasvariedadesdeavaliaçãoexterna,temseoreconhecimento deregiõesnãoconfiáveisdomodelo.Essaavaliaçãopodeserfeitapelocálculode perfisdeenergiadomodeloouporavaliaçãoestereoquímica( MartíRenom et al ., 2000 ; Sánchez&Šali,2000 ). 45

A avaliação estereoquímica pode considerar vários aspectos do modelo, comocomprimentodeligações,ângulosdeligação,planaridadedaligaçãopeptídica edeanéisdecadeiaslaterais,quiralidade,ângulosdetorçãodascadeiaslateraise principalecontatosentreátomosnãoligados.Paraaavaliaçãoestereoquímicado modeloapresentadonopresentetrabalho,foiutilizadoomapadeRamachandran geradopeloprogramaProcheck( Laskowski et al .,1993 ). Em geral, esperase que um modelo de qualidade tenha 90% de seus resíduosnasregiõesmaisfavoráveis(Laskowski et al .,1993 ).Omodeloconstruído nopresentetrabalhoapresenta87,3%dosresíduosnasregiõesfavoráveise11,0% nas regiões adicionalmente favoráveis, enquanto o molde utilizado (2UBP) apresenta 89,6% dos resíduos em regiões favoráveis e 9,4% nas regiões adicionalmentefavoráveis.Considerandootamanhomaiordaseqüênciadomodelo (842 aminoácidos) em relação à seqüência do molde (790 aminoácidos) e a natureza das regiões envolvidas nesse aumento de seqüência (trechos ligadores semelhantesaalças,aparentementemaisflexíveis),considerouseovalorobtidono mapa de Ramachandran adequado para validação deste modelo. Os mapas de Ramachandran do modelo apresentado neste trabalho e do molde utilizado são apresentadosnaFigura9 .

46

A B Resíduosemregiõesmaisfavoráveis 594 89,5% 619 87,3% Resíduosemregiõesadicionalmentefavoráveis 62 9,4% 78 11,0% Resíduosemregiõesgenerosamentefavoráveis 6 0,9% 7 1,1% Resíduosemregiõesnãopermitidas 1 0,2% 4 0,6% Númerototaldereíduosquenãoprolinaeglicina: 663 100,0% 709 100,0% Número de resíduos de glicina (mostrados como 84 84 triângulos) Númeroderesíduosdeprolina 37 45 Númerototalderesíduos(incluindoterminais) 790 840

Figura 9: MapadeRamachandranparaasestruturasdo( A)moldeedo( B)modelo.Vermelho:regiõesmaisfavoráveis, amarelo: regiões adicionalmente favoráveis, amarelo claro: regiões generosamente favoráveis, branco: regiões não permitidas.

Métodos de avaliação de modelos baseados em perfis tridimensionais e potenciais estatísticos de força média consideram, de forma implícita, muitos dos aspectos estereoquímicos também testados nos métodos de avaliação estereoquímica ( MartíRenom et al ., 2000 ). Os programas avaliam o ambiente de cada resíduo do modelo, comparando com o ambiente esperado, conforme se apresentamemestruturasdealtaresoluçãoobtidasporcristalografiaderaiosX.O Verify 3D ( Lüthy et al ., 1992 )foioprogramaescolhidoparaavaliaromodelopor perfis.Esteprogramafazumaanáliseteóricadaestrutura tridimensional de cada aminoácido(perfil3D)dentrodaestruturadaproteína,sendoestaanálisefeitapor comparação da estrutura do aminoácido junto a um banco de conformações possíveis para este aminoácido (perfil 1D). Para a comparação é computado um escore,indicandoaviabilidadedaconformaçãoencontrada(escore3D1D).Quanto maior este escore, melhor será a estrutura. Os resultados do Verify 3D são geralmenteapresentadosnaformadeumgráfico,comosaminoácidosnoeixoxe seus escores no eixo y. Neste trabalho, preferiuse representar os escores visualmente,nasprópriasestruturastridimensionaisdomoldeedomodelo,pormeio deferramentaespecíficadoGeneSilicoMetaserver(Kurowski&Bujnicki,2003 ).Esta opçãoéjustificadapeladificuldadeemcompararosgráficosobtidosparaomoldee omodelo(devidoàsestruturasapresentaremtamanhoseorganizaçãodiferentes), alémdefacilitaravisualizaçãodasregiõesquenecessitamdemaiorcuidado.Nos resultados obtidos pelo Verify 3D para o modelo construído neste trabalho em comparaçãocomseumolde(Figura10 ),notasequeasáreascommaiordesvioem relação ao esperado (representado pela cor vermelha) são, principalmente, os 47 segmentosdeligaçãoentreosdomínios(ausentesnomolde).Portrataremsede regiões semmolde,maioresquevinteaminoácidos,o que é considerado o limite máximoparamodelagemdealçassemmoldeemproteínas 5( Fiser et al .,2000 ),é bastante possível que a organização espacial dessas áreas do modelo exijam refinamentoseanálisesmaisdetalhadas.

Figura 10:ResultadosdoVerify3Dtranspostosàsestruturastridimensionaisdomoldeedomodelo.Acorazulrepresenta áreascomconformaçãoadequada(conformeoesperado),acorvermelharepresentaáreasemnãoconformidadecomo esperado,acorbrancarepresentavaloresintermediáriosentreasduassituações.( A)e( C)visualizaçãodeduasfaces complementares(rotadasde180ºsobreoeixoy)daestruturatridimensionaldomolde2UBP.( B)e( D)visualizaçãodeduas facescomplementares(rotadasde180ºsobreoeixoy)daestruturatridimensionaldomodeloconstruídoparaaJBUREIIB. Estruturasrepresentadasporsuassuperfíciesmoleculares. 4.5 Estrutura tridimensional das ureases As ureases apresentam um fold típico das amidohidrolases, caracterizado pelapresença,noCterminal,deumbarril(αβ) 8(barrilTIM),ondeselocalizaosítio ativocomosdoisátomosdeníquel,seguidoporumconjuntodefolhasβ( Jabri et al .,1995;Nagano et al .,2002 ),ambosformandoodomínio α.Odomínio βapresenta predominantementeestruturasβ,enquantoodomínioγ éformadoporestruturasαβ (Jabri et al .,1995 )(Figura11 ). OmodelodaureasedeJBUREIIBconstruídonestetrabalhoapresentauma estruturamuitosimilaràqueladasureasescomestruturatridimensionaljádefinida (todas oriundas de bactérias), com exceção de duas regiões de ligação, entre os domínios α e β, e entre β e γ (Figuras 12 e 13 ). Estas regiões, por não estarem envolvidas na atividade catalítica nem na associação de subunidades, devem

5Sãoconsideradasconfiáveisasmodelagensdealçasmenoresquevinteaminoácidos.Emcondiçõesdesimulação,alças com4a8aminoácidosforammodeladasdaformacorretacomumaprecisãode~90%.Essevalorcaiupara30%na modelagemdealçascom14aminoácidos(Fiseretal.,2000). 48 apresentar taxa de divergência mais elevada que outras regiões da proteína (Mulinari et al .,2007 ),eestãoassociadasaoutraspropriedadesdasureases,como a toxicidade. A determinação daestruturatridimensional das regiões ligadoras da proteínaédegrandeimportânciaparaacompreensãodasdiferentespropriedades das ureases em sistemas biológicos, especialmenteaquelas não encontradas em ureasesbacterianas.

Figura 11:EstruturatridimensionaldomodelodeJBUREIIB,coloridodeacordocomaestruturasecundária(αhélicesem vermelho,βfolhasemamarelo, loops emcinza).AregiãodobarrilTIMestádestacadapeloretângulo.α,β,γ:domínios estruturais.

Figura 12: Sobreposição do modelo da JBUREIIB Figura 13:EstruturatridimensionaldomodelodeJBURE (ciano; α, β, γ: domínios estruturais) com seu molde IIB.Aregiãodopeptídeoestádestacadaemlaranjaea 2UBP(vermelho:subunidadeA,amarelo:subunidade abaflexívelestádestacadaemmagenta.Aregiãodosítio B,verde:subunidadeC). ativoestácirculada. α, β, γ:domíniosestruturais. 49

Umaestruturadotipohélicevoltahéliceformauma aba ( flap ) sobre o sítio ativo,sendoassociadaàaltaespecificidadedasureasespeloseusubstrato,auréia (Jabri et al ., 1995 ; Benini et al ., 1999 ; Benini et al ., 2001 ). Esta aba, refletindo o moldeutilizado,encontrasepresenteeemumaconformaçãoaberta( Benini et al ., 2001 ) no modelo construído (Figura 13 ). Por mecanismos ainda não totalmente elucidados, esta aba encontrariase aberta enquanto a enzima não apresentasse substratonosítioativo,fechandosedeformasimultâneaàaproximaçãoeentrada dauréia( Benini et al .,1999 ;Benini et al .,2001 ).Amovimentaçãodestaabaseria facilitada pelas regiões sem estrutura secundária definida (alças), que são conformacionalmentemaisflexíveis. OmodelodeJBUREIIBfoiutilizado,também,paralocalizarespacialmenteos aminoácidosessenciaisparaacatálise,determinadoscomopresentesemtodasas seqüências analisadas neste trabalho (Figuras 14 e 15 ). Há, ainda, debate na literatura quanto ao critério de essencialidade para tais aminoácidos. Optouse, neste trabalho, pela utilização de todos aqueles aminoácidos que, ao serem mutados,tornamaenzimainativa.Verificousequeestesaminoácidosencontramse muitopróximosespacialmente,mesmoestandoafastadosnaseqüênciaprimária.A semelhançadaorganizaçãoespacialdosítioativodomoldeedomodelopermitiuo docking geométricodosátomosdeníquelnomodelo. O docking foi realizado por sobreposiçãodasestruturas2UBPedomodelodeJBUREIIB,comatransferência dascoordenadascartesianascorrespondentesaosátomosdeníquel.Aidentificação daestrutura3Ddaapoenzimadeureasede K. aerogenes (códigoPDB1KRA)( Jabri &Karplus,1996 )indicouqueosítioativoépréorganizadodemaneiratotalmente favorável à ligação dos átomos de níquel, ocorrendo baixíssimo nível de reorganizaçãoconformacionalapóssuainserçãonaenzima. Além dos átomos de níquel, quatro moléculas de água, organizadas de maneiraespecíficanosítioativo,foramadicionadasaomodeloseguindoamesma metodologiautilizadaparaoníquel(Figura14 ).Estasmoléculasdeáguaformamum cluster altamante organizado ( Benini et al ., 1999 ; Benini et al ., 2001 ): três delas ocupamumespaçoequivalenteaodauréia,enquanto uma quarta é considerada essencialparaacatálise.Aorganizaçãoerealparticipaçãodoclusterdeáguano sítioativoaindaéobjetodedebatenaliteratura. 50

Figura 14: Representação espacial dos resíduos do Figura 15: Sobreposição dos resíduos do sítio catalítico sítiocatalíticoconservadosemtodasasseqüênciasde conservados em todas as seqüências de ureases ureasesanalisadas,dosátomosdeníquel(esferasem analisadas. Em amarelo, urease de Bacillus pasteurii magenta)edo cluster deágua(esferasemamarelo). (2UBP);emazul,ureasede C. ensiformis (JBUREIIB);em A numeração dos resíduos referese à seqüência da verde, urease de Klebsiella aerogenes (1FWJ). A JBUREIIB (KCX: lisina carbamilada). Aminoácidos numeraçãodosresíduosrefereseàseqüênciadaJBURE coloridosdeacordocomotipodeátomo(CPK). IIB(KCX:lisinacarbamilada). A associação das ureases em homo ou heteropolímeros lhes confere uma propriedade incomum: sua relação superfície/volume é uma das mais baixas conhecidas( Jabri et al .,1996 ).Naureasede K. aerogenes ,porexemplo,59%de seus átomos estão ocultos, e sua superfície corresponde a 81% da superfície esperada para uma proteína de seu tamanho ( Jabri et al ., 1996 ). A JBUREIIB apresenta uma grande quantidade de aminoácidos hidrofóbicos (Figura 16 ), provavelmente associados à interação das subunidades (que podem formar homotrímerosehomohexâmeros).OcasodaureasedeH. pylori ,queagrupaseem dodecâmeros ( Ha et al ., 2001 ), é um exemplo da especialização das ureases tambémnoqueserefereàsuaestruturaquaternária. Sondi & SalopekSondi ( 2005 ) verificaram diferenças significativas na formaçãodepolimorfosdecarbonatodecálcioquandonapresençadasuresases de B. pasteurii ede C. ensiformis .Estasdiferençasforamassocidasàabundância deaminoácidoscarregadosnegativamentenasuperfíciedaureasede B. pasteurii, que estariam em menor quantidade na urease de C. ensiformis. O modelo da JBUREIIBconstruídonopresentetrabalhoestádeacordocomessaobservação, apresentandoumaquantidademenordestesaminoácidosemsuasuperfíciequando comparadoàureasede B. pasteurii (Figura16 ).Oefeitoexatodestesaminoácidos sobreaformaçãodospolimorfosdecarbonatodecálcioéaindadebatido. 51

Figura 16 : Distribuição das diferentes classes de aminoácidos na ( A) JBUREIIB e na ( B)ureasede Bacillus pasteurii . Aminoácidosapolaresemcinza,aminoácidospolares emlaranja;aminoácidoscarregadosnegativamenteem vermelho, aminoácidoscarregadospositivamenteemazul.Asestruturasestãorepresentadasporsuassuperfíciesmolecularesem transparência; α, β, γ:domíniosestruturais;A,B,C:subunidades. A região correspondente ao peptídeo entomotóxico foi identificada espacialmente (Figura 13 ).Aintençãoaodeterminaraestruturatridimensional do peptídeotóxicoresideemobterindicaçõesdesuaação in vivo , baseandose em casos conhecidos. Sabese que pepcanatox não é um inibidor das enzimas digestivas dos insetos ( FerreiraDaSilva et al ., 2000 ). Porém, sua ingestão por insetossuscetíveiscausaparalisiamomentâneaemovimentosdescoordenadosde antenas precedentes à morte, sugerindo que a ação do peptídeo clivado seja neurotóxica ou de indução de morte celular por alteração da permeabilidade de membranas( Mulinari et. al ,2007 ). Ao realizar um estudo por modelagem ab initio de vários fragmentos do peptídeotóxico, Mulinari et al .( 2007 )identificaramummotivoβhairpin (grampoβ) recorrente.Empeptídeostóxicosconhecidos,estemotivoéassociadoàinibiçãode canaisiônicos(comoocorrenaneurotoxinacharibdotoxina)eàformaçãodeporos em membranas ( Mulinari et al ., 2007 ), efeitos sugeridos para os peptídeos entomotóxicosderivadosdasureasesde C. ensiformis . A predição da estrutura secundária pelo PSIPRED ( McGuffin et al ., 2000 ) mostrou diferenças ao analisar a seqüência completa da proteína e apenas o peptídeo, de maneira isolada (Figura 17 ). Ao ser considerado isoladamente, o peptídeo apresentaria duas folhasβ adicionais (Lys43Ile45, Ala78Leu79) em relação à estrutura secundária predita para a região do peptídeo na proteína. A 52 definição da estrutura secundária a partir da estrutura modelada (Figura 18 ), realizadapeloPDBsum( Laskowski et al .,2005 ),identificounaregiãodopeptídeo váriosβturns (voltasβ),umγturn (voltaγ)eumβhairpin .Éinteressantenotarque a presença de βturns, motivo associado à inserção em membranas pela toxina aerolisina,foiconsideradainexistentenestepeptídeopor Mulinari et al .( 2007 ). Aconformaçãodopeptídeoquandoaindainseridona ureaseserveapenas como indicativo de sua possível conformação ativa, pois é esperado que, ao ser liberadodacadeiaprotéica,eleadoteumaconformaçãodiferenciada.Oestudoda conformaçãodopeptídeolivreemsoluçãopoderiaserrealizadoviasimulaçãopor dinâmicamolecular.

Figura 17: Predição da estrutura secundária do peptídeo entomotóxico derivadodaJBUREIIB. (A) prediçãodaestruturasecundáriaconsiderando apenas o peptídeo, isolado do restante da proteína. (B) predição da estrutura secundária da região do peptídeo na JBUREIIB. Adaptado de originaisobtidosdoPSIPRED(McGuffin et al .,2000). 53

Figura 18:DeterminaçãodaestruturasecundáriadaJBUREIIBapartirdomodelotridimensionalconstruídonestetrabalho. A região correspondente ao peptídeo entomotóxico encontrase destacada em verde. Adaptado do original obtido do PDBsum(Laskowski et al .,2005). 54

Figura 19:PrediçãodaestruturasecundáriadaJBUREIIBapartirdesuaseqüênciaprimária.Adaptadodooriginalobtido doPSIPRED(McGuffin et al .,2000). 55

Emtermosgerais,aprediçãodaestruturasecundáriaapartirdaseqüência primária (Figura 19 ) e a definição da estrutura secundária a partir da estrutura terciária(Figura18 )estãodeacordo.Tomandoadefiniçãodaestruturasecundáriaa partirdaterciáriacomoreferência,asexceçõesdecorrespondêncianosresultados encontramse na ausência da αhélice e maior quantidade de folhasβ no trecho Ile81His160enaausênciadafolhaβentreasαhélicesdotrechoLeu577Ser608. Como a estruturação de todas as outras regiões parece muito similar, estas diferençasdeestruturasecundáriaemrelaçãoaoesperadoapartirdaseqüência primária podem ser devidas ao processo de enovelamento, que propicia contatos diferenciadosentreosresíduosdeaminoácidos.Entretanto,adefiniçãodoscritérios para classificação de estruturas secundárias é arbitrária, apresentando variações entre os diferentes programas utilizados. Desta forma, pequenas variações entre seusresultadospodemserapenasreflexodecritériosimplícitosdeclassificação.

56

5. Conclusões e perspectivas Aanálisefilogenéticarealizadanopresentetrabalhoindicouumalinhamento preferencialdasseqüênciasdeplantasentresiedasseqüênciasdefungosentresi, comseparaçãoclaraentreelas.Talseparaçãofoimaisevidentenacomparaçãodas seqüênciasdeaminoácidosdeureases.Acomparaçãodasdiferentesseqüências de ureases evidenciou, também, a conservação de resíduos considerados essenciaisparaaatividadeureásica.Apresençadestesresíduosnosítiocatalítico foiconfirmadaespacialmentenaestruturamodeladaparaJBUREIIB. Autilizaçãodaestrutura2UBP(ureasede Bacillus pasteurii )comomoldepara a predição da estrutura tridimensional da JBUREIIB mostrouse adequada, pois levouàconstruçãodeummodelotridimensionaldeboaqualidadeparaestaenzima. A JBUREIIB de Canavalia ensiformis apresenta uma estrutura tridimensional semelhanteàdasureasesdebactérias,comexceçãodasregiõesdeligaçãoentre seusdomínios.Devidoàinexistênciadeummoldeapropriadoparaestasregiõesda proteína, especial atenção deverá ser dada ao seu refinamento. Para tanto, pretendemosutilizartécnicasdeDinâmicaMolecular. Apesardebastantecomplexa,conformeapresentadanoApêndiceC ,espera se que a associação dos dados teóricos obtidos neste trabalho com os dados experimentaisjádisponíveisouquevenhamaserobtidosnofuturo,permitauma melhorcompreensãodasureasesemtermosestruturaisecinéticos. Comoperspectivasparaacontinuidadedotrabalho,temseaconstruçãode um modelo de urease fúngica de interesse do nosso laboratório (do fungo Cryptococcus gattii ), minimização de energia dos sistemas modelados e o refinamentodasregiõesdeligaçãoentredomíniosdosmodelosdeureases.Estão planejados,também,estudosdedinâmicamoleculardossistemasmodelados,com ênfasenaconformaçãodasalçasentredomínios.Acontinuidadedotrabalhoprevê, ainda,estudosespecificamentevoltadosaopeptídeoentomotóxico,emespecialà suaconformaçãoquandoisoladodaenzima,emsolução.Comoumobjetivofinaldo estudoteóricodasureasesesperamosobterresultadosqueajudemnomapeamento das regiões protéicas envolvidas nas diferentes propriedades biológicas dessas enzimas. 57

6. Referências bibliográficas Altschul S. F., Madden T. L., Schäffer A. A., Zhang J., Zhang Z., Miller W., Lipman D. J., 1997 . Gapped BLAST and PSIBLAST:anewgenerationof proteindatabasesearchprograms. Nucleic Acids Res . 25 ,33893402. Andrews R. K., Blakeley R. L., Zerner B., 1984 .Ureaandurease. Adv. Inorg. Biochem . 6, 245–283. Balasubramanian A., Ponnuraj K., 2008 .Purification,crystallizationandpreliminary Xrayanalysisofureasefrompigeonpea( Cajanus cajan ). Acta Cryst . F64 , 662–664. Barrios A. M., Lippard, S. J., 2001 .Phthalazinebaseddinucleatingligandsafford dinuclearcentersoftenencounteredinmetalloenzymeactivesites. Inorg. Chem . 40 ,10601064. Benini S., Rypniewski W. R., Wilson K. S., Miletti S., Ciurli S., Mangani S., 1999 . Anewproposalforureasemechanismbasedonthecrystalstructuresofthe nativeandinhibitedenzymefrom Bacillus pasteurii :whyureahydrolysiscosts twonickels. Structure . 7,205216. Benini S., Rypniewski W. R., Wilson K. S., Ciurli S., Mangani S., 2001. Structure basedrationalizationofureaseinhibitionbyphosphate:novelinsightsintothe enzymemechanism. J. Biol. Inorg. Chem . 6,77890. Berman H.M., Westbrook J., Feng Z., Gilliland G., Bhat T. N., Weissig H., Shindyalov I. N., Bourne P. E., 2000. TheProteinDataBank. Nucleic Acids Research , 28 ,235242. Branden C., Tooze, J. Introduction to protein structure .2.ed.NewYork:Garland, 1999.p.373392. Carlini C.R., Oliveira A.E., Azambuja P., Xavier-Filho J., Wells M.A., 1997 . Biologicaleffectsofcanatoxinindifferentinsectmodels:evidencefora proteolyticactivationofthetoxinbyinsectcathepsinlikeenzymes. J. Econ. Entomol . 90 ,340348. Carlini C.R., Grossi-de-Sá M.F., 2002 .Planttoxicproteinswithinsecticidal properties.Areviewontheirpotentialitiesasbioinsecticides. Toxicon . 40 , 15151539. Chothia C., Lesk A. M., 1986. Therelationbetweenthedivergenceofsequenceand structureinproteins. EMBO J . 5,823826. Dixon N. E., Gazzola C., Blakeley R. L., Zerner B., 1975 .Jackbeanurease(EC 3.5.1.5).Ametalloenzyme.Asimplebiologicalrolefornickel? J. Am. Chem. Soc . 97 ,4131–4133. Eaton K.A., Brooks C.L., Morgan D.R., Krakowka S., 1991 .Essentialroleof ureaseinpathogenesisofgastritisinducedby Helicobacter pyloriin gnotobioticpiglets. Infect. Immun . 59 ,2470–2475. Estiu G., Suárez D., Merz Jr K.M., 2006 .QuantumMechanicalandMolecular DynamicsSimulationsofUreasesandZnβLactamases. J. Comput. Chem . 27 ,1240–1262. 58

Eswar N., Marti-Renom M. A., Webb B., Madhusudhan M. S., Eramian D., Shen M., Pieper U., Šali A., 2000. Comparativeproteinstructuremodelingwith MODELLER. Current Protocols in Bioinformatics ,JohnWiley&Sons,Inc., Suppl. 15 ,5.6.15.6.30. Felsenstein J., 1985 .Confidencelimitsonphylogenies:Anapproachusingthe bootstrap. Evolution. 39 ,783791. Fernandes C. L. Predição da estrutura tridimensional da EPSP sintase de Mycobacteriumtuberculosis utilizando modelagem molecular comparativa por homologia .PortoAlegre:UFRGS,2002.Monografia(Graduaçãoem Farmácia),FaculdadedeFarmácia,UniversidadeFederaldoRioGrandedo Sul,2002. Ferreira-DaSilva C.T., Gombarovits M.E., Masuda H., Oliveira C.M., Carlini, C.R., 2000 .Proteolyticactivationofcanatoxin,aplanttoxicprotein,byinsect cathepsinlikeenzymes. Arch. Insect. Biochem. Physiol . 44 ,162171. Fiser A., Do R. K. G., Sali A., 2000. Modelingofloopsinproteinstructures. Protein Sci . 9,17531773. Follmer C, Barcellos GB, Zingali RB, Machado OL, Alves EW, Barja-Fidalgo C, Guimarães J.A., Carlini C.R., 2001 .Canatoxin,atoxicproteinfromjack beans( Canavalia ensiformis ),isavariantformofurease(EC3.5.1.5): biologicaleffectsofureaseindependentofitsureolyticactivity. Biochem. J. 360 ,217–224. Follmer C., Real-Guerra R., Wasserman G.E., Olivera-Severo D., Carlini, C.R., 2004. Jackbean,soybeanand Bacillus pasteurii ureases:biologicaleffects unrelatedtoureolyticactivity. Eur. J. Biochem . 271 ,13571363. Guex N., Peitsch M. C., 1997 .SWISSMODELandtheSwissPdbViewer:An environmentforcomparativeproteinmodelling. Electrophoresis . 18 ,2714 2723. Ha N.-C., Oh S.-T., Sung J. Y., Cha K. A., Lee M. H., Oh B.-H., 2001 . Supramolecularassemblyandacidresistanceof Helicobacter pylori urease. Nature Struct. Biol . 8,505–509. Hall T. A., 1999. BioEdit:auserfriendlybiologicalsequencealignmenteditorand analysisprogramforWindows95/98/NT. Nucleic Acids Symposium Series , 41 ,9598. Hasegawa M, Fujiwara M., 1993. Relativeefficienciesofthemaximumlikelihood, maximumparsimony,andneighborjoiningmethodsforestimatingprotein phylogeny. Mol. Phylogenet. Evol . 2,15. Hirai M., Kawai-Hirai R., Hirai T., Ueki T., 1993 .Structuralchangeofjackbean ureaseinducedbyadditionofsurfactantsstudiedwithsynchrotronradiation smallangleXrayscattering. Eur. J. Biochem . 215 ,55–61. Hirayama C., Sugimura M., Saito H., Nakamura M., 2000a .Hostplantureasein thehemolymphofthesilkworm, Bombyx mori . J. Insect Physiology . 46 , 1415–1421. Hirayama C., Sugimura M., Saito H., Nakamura M., 2000b .Purificationand propertiesofureasefromtheleafofmulberry, Morus alba . Phytochemistry . 53 ,325–330. 59

Jabri E., Lee M. H., Hausinger R. P., Karplus P. A., 1992 .Preliminary crystallographicstudiesofureasefromjackbeanandfromKlebsiella aerogenes. J. Mol. Biol . 227 ,934–937. Jabri E., Carr M.B., Hausinger R.P., Karplus P.A., 1995 .Thecrystalstructureof ureasefrom Klebsiella aerogenes . Science. 268 ,998–1004. Jabri E., Karplus P. A., 1996 .StructuresoftheKlebsiella aerogenes urease apoenzymeandtwoactivesitemutants. Biochemistry . 35 ,1061610626. Jones D. T., 2000. Apracticalguidetoproteinstructureprediction.Methods Mol Biol . 143 ,13154. Jukes T. H., Cantor C. R. Evolutionofproteinmolecules.In: Munro H. N .(ed.). Mammalian Protein Metabolism .NewYork:AcademicPress,1969. Karmali A., Domingos A., 1993 .Monoclonalantibodiesagainstureasefrom Canavalia ensiformis . Biochimie. 75 ,1001–1006. Kurowski M. A., Bujnicki J. M., 2003 .GeneSilicoproteinstructurepredictionmeta server. Nucleic Acids Res . 31 ,33053307 Larkin M. A., Blackshields G., Brown N. P., Chenna R., McGettigan P. A., McWilliam H., Valentin F., Wallace I. M., Wilm A., Lopez R., Thompson J. D., Gibson T. J., Higgins D. G., 2007. ClustalWandClustalXversion2. Bioinformatics , 23 (21),29472948. Laskowski R. A., McArthur M. W., Moss D. S., Thornton J. M., 1993 . PROCHECK:aprogramtocheckthestereochemicalqualityofprotein structures. J. Appl. Cryst ., 26 ,283291. Laskowski R. A., Chistyakov V. V., Thornton J. M., 2005. PDBsummore:new summariesandanalysesoftheknown3Dstructuresofproteinsandnucleic acids. Nucleic Acids Res ., 33 ,D266D268. Lüthy R., Bowie J., Eisenberg D., 1992. Assessmentofproteinmodelswiththree dimensionalprofiles. Nature , 356 ,8385. Mamiya G., Takishima K., Masakuni M., Kayumi T., Ogawa K., Sekita, T., 1985 . Completeaminoacidsequenceofjackbeanurease. Proc. Japan Acad . 61, 395398. Martí-Renom M. A., Stuart A. C., Fiser A., Sánchez R., Melo F.; Šali A., 2000 . Comparativeproteinstructuremodelingofgenesandgenomes. Annu. Rev. Biophis. Biomol. Struct . 29 ,291325. McGuffin L. J., Bryson K., Jones D. T., 2000. ThePSIPREDproteinstructure predictionserver. Bioinformatics . 16 ,404405. Menegassi A., Wassermann G. E., Olivera-Severo D., Becker-Ritt A. B., Martinelli A. H., Feder V., Carlini C. R., 2008. Ureasefromcotton (Gossypium hirsutum )seeds:isolation,physicochemicalcharacterization,and antifungalpropertiesoftheprotein. J. Agric. Food Chem . 56 ,43994405. Meyer-Bothling L.E., Polacco J.C., 1987 .Mutationalanalysisoftheembryospecific ureaselocusofsoybean . Mol. Gen. Genet . 209 ,439–444. 60

Miyaki C. Y., Russo C. A. M., Pereira S. L. Reconstruçãofilogenética.Introdução aométododamáximaparcimônia.In: Matioli, S. R. (ed.). Biologia Molecular e Evolução .1.ed.RibeirãoPreto:Holos,2001. Mobley H.L., Island M.D., Hausinger R.P., 1995 ,Molecularbiologyofmicrobial ureases. Microbiol. Rev . 59 ,451–480. Mulinari F., Stanisçuaski F., Bertholdo-Vargas L.R., Postal M., Oliveira-Neto O.B., Rigden D.J., Grossi-de-Sá M.F., Carlini C.R., 2007 .Jaburetox2Ec:An insecticidalpeptidederivedfromanisoformofureasefromtheplant Canavalia ensiformis . Peptides . 28 ,20422050. Mulinari F. Ureases de Canavaliaensiformis e peptídeo inseticida derivado .Porto Alegre:UFRGS,2008.Tese(DoutoradoemBiologiaCelulareMolecular), CentrodeBiotecnologiadoEstadodoRioGrandedoSul,Universidade FederaldoRioGrandedoSul,2008. Nagano N., Orengo C. A., Thornton J. M., 2002. Onefoldwithmanyfunctions:the evolutionaryrelationshipsbetweenTIMbarrelfamiliesbasedontheir sequences,structuresandfunctions. J Mol Biol . 321 ,741765. Nei M., Kumar S. Molecular evolution and phylogenetics .1.ed.NewYork:Oxford, 2000.p.73164. Pedrozo H.A., Schwartz Z., Dean D.D., Wiederhold M.L., Boyan B.D., 1996a . Regulationofstatoconiamineralizationin Aplysia californica invitro. Connect. Tissue Res . 35 ,317–323. Pedrozo H.A., Schwartz Z., Luther M., Dean D.D., Boyan B.D., Wiederhold M.L., 1996b .Amechanismofadaptationtohypergravityinthestatocystof Aplysia californica . Hear Res . 102 ,51–62. Pereira S. L., Miyaki C. Y., Russo C. A. M. Reconstruçãofilogenética:métodos probabilísticos.In: Matioli, S. R. (ed.). Biologia Molecular e Evolução .1.ed. RibeirãoPreto:Holos,2001. Pettersen E. F., Goddard T. D., Huang C. C., Couch G. S., Greenblatt D. M., Meng E. C., Ferrin T. E., 2004. UCSFChimeraAvisualizationsystemfor exploratoryresearchandanalysis. J. Comput. Chem . 25 ,16051612. Pires-Alves M., Grossi-de-Sá M.F., Barcellos G.B., Carlini, C.R., Moraes, M.G., 2003 .Characterizationandexpressionofanovelmember(JBUREII)ofthe ureasegenefamilyfromjackbean[ Canavalia ensiformis (L.)DC]. Plant Cell Physiol . 44 :139145. Polacco J.C., Holland, M.A. Rolesofureaseinplantcells.In Jeon K. W. & Jarvik J. (eds.). International Review of Cytology ,vol.145.SanDiego:Academic Press,1993. Polacco J.C., Holland M.A. Geneticcontrolofplantureases.InSetlowJ.K.(ed.). Genetic Engineering , vol.16.NewYork:PlenumPress,1994. Ramachandran G.N., Ramakrishnan C., Sasisekharan V., 1963. Stereochemistry ofpolypeptidechainconfigurations. J. Mol. Biol ., 7,9599. Riddles P.W., Whan V., Blakeley R.L., Zerner B., 1991 .Cloningandsequencingof ajackbeanureaseencodingcDNA. Gene . 108 ,265–267. Ridley M . Evolução .3.ed.PortoAlegre:Artmed,2004.p.445495. 61

Russo C. A. M., Miyaki C. Y., Pereira S. L. Reconstruçãofilogenética:métodos geométricos.In: Matioli, S. R. (ed.). Biologia Molecular e Evolução .1.ed. RibeirãoPreto:Holos,2001. Saitou N., Imanishi T., 1989. RelativeefficienciesoftheFitchMargoliash, maximumparsimony,maximumlikehood,minimumevolution,andneighbor joiningmethodsofphylogenetictreeconstructioninobtainingthecorrecttree. Mol. Biol. Evol . 6,514525; Saitou N., Nei M., 1987. Theneighborjoiningmethod:anewmethodfor reconstructingphylogenetictrees. Mol. Biol. Evol . 4,406425. Šali A., 2008. Modeller:aprogramforproteinstructuremodelingrelease9v4 (manual). Salilab .Disponívelem«http://salilab.org/modeller/9v4/manual» (acessoem28out08) Šali A., Blundell T. L., 1993. Comparativeproteinmodellingbysatisfactionofspatial restraints. J. Mol. Biol . 234 ,779815. Sánchez R, Šali A., 2000. Comparativeproteinstructuremodeling.Introductionand practicalexampleswithModeller. Methods Mol. Biol . 143 ,97129. Sheridan L., Wilmot C. M., Cromie K. D., van der Logt P., Phillips S. E. V., 2002 . CrystallizationandpreliminaryXraystructuredeterminationofjackbean ureasewithaboundantibodyfragment. Acta Cryst . D58 ,374–376. Sirko A., Brodzik R., 2000. Plantureases:rolesandregulation. Acta Bioch. Pol ., 4, 11891195. Sondi I., Salopek-Sondi B., 2005. Influenceoftheprimarystructureofenzymeson theformationofCaCO 3polymorphs:acomparisonofplant( Canavalia ensiformis )andbacterial( Bacillus pasteurii )ureases. Langmuir . 21 ,8876 8882. Sumner J.B., 1926 .Theisolationandcristallizationoftheenzymeurease . J. Biol. Chem . 69 ,435–441. Takishima K., Suga T., Mamiya G., 1988 .Thestructureofjackbeanurease.The completeaminoacidsequence,limitedproteolysisandreactivecysteine residues. Eur. J. Biochem . 175 ,151–165. Tamura K., Dudley J., Nei M., Kumar S., 2007. MEGA4:MolecularEvolutionary GeneticsAnalysis(MEGA)softwareversion4.0. Mol. Biol. Evol ., 24 ,1596 1599. Tange Y., Niwa O., 1997 .Identificationofthe ure1 +geneencodingureasein fissionyeast. Curr. Genet . 32 ,244–246. Todd M. J., Hausinger R. P., 2000 .FluorideinhibitionofKlebsiellaaerogenes urease:mechanisticimplicationsofapseudouncompetitive,slowbinding inhibitor. Biochemistry , 39 ,5389. Wheeler D. L., Barrett T., Benson D. A., Bryant S. H., Canese K., Chetvernin V., Church D. M., Dicuccio M., Edgar R., Federhen S., Feolo M., Geer L. Y., Helmberg W., Kapustin Y., Khovayko O., Landsman D., Lipman D. J., Madden T. L., Maglott D. R., Miller V., Ostell J., Pruitt K. D., Schuler G. D., Shumway M., Sequeira E., Sherry S. T., Sirotkin K., Souvorov A., Starchenko G., Tatusov R. L., Tatusova T. A., Wagner L., Yaschenko E., 62

2008. DatabaseresourcesoftheNationalCenterforBiotechnology Information. Nucleic Acids Res . 36 (D),1321. Witte C.P., Tiller S., Isidore E., Davies H.V., Taylor M.A., 2005 .Analysisoftwo allelesoftheureasegenefrompotato:polymorphisms,expression,and extensivealternativesplicingofthecorrespondingmRNA. J. Exp. Bot .56 :91 99. Yu J.J., Smithson S.L., Thomas P.W., Kirkland T.N., Cole G.T., 1997 .Isolation andcharacterizationoftheureasegene(URE)fromthepathogenicfungus Coccidioides immitis . Gene . 198 ,387–391. Zerner B., 1991 .Recentadvancesinthechemistryonanoldenzyme,urease. Bioorg. Chem ., 19 ,116131. Zonia L.E., Stebbins N.E., Polacco J.C., 1995 .Essentialroleofureasein germinationofnitrogenlimited Arabidopsis thaliana seeds. Plant Physiol . 107 , 1097–1103. Zuckerkandl E., Pauling L. Evolutionarydivergenceandconvergenceinproteins. In: Bryson V., Vogel H. J. (eds.). Evolving Genes and Proteins ,NewYork: AcademicPress,1965. 63

APÊNDICES 64

APÊNDICE A: arquivosdeentradautilizadosnoprogramaModeller9v4. A1: arquivo model-loop-define.py from modeller import * from modeller.automodel import * log.verbose() env = environ() env.io.atom_files_directory = ['.']

# Create a new class based on 'loopmodel' so that we can redefine # select_loop_atoms class MyLoop(loopmodel): # This routine picks the residues to be refined by loop modeling def select_loop_atoms(self): # Two residue ranges (both will be refined simultaneously) return selection(self.residue_range('102:', '132:'), self.residue_range('234:', '264:')) a = MyLoop(env, alnfile = 'alinha.ali', # alignment filename knowns = '2UBP', # codes of the templates sequence = 'jbureiib', # code of the target loop_assess_methods=assess.DOPE) # assess each loop with DOPE a.starting_model= 1 # index of the first model a.ending_model = 10 # index of the last model a.loop.starting_model = 1 # First loop model a.loop.ending_model = 10 # Last loop model a.make() # do modeling and loop refinement

A2: aquivo alinha.ali >P1;2UBP structureX:2UBP:1 :A:570 :C: : : : MHLNPAEKEKLQIFLASELLLRRKARGLKLNYPEAVAIITSFIMEGARDG -KTVAMLMEEGKHVLTRDDVMEGVPEMIDDIQAEATFPDGTKLVTVHNPI SN------YIVPGEYRVAEGEIEINAGR EKTTIRVSNTGDRPIQVGSHIHFVEVNKELLFDRAEGIGRRLNIPSGTAA RFEPGEEMEVELTELGGNREVFGISDLTNGSVDNK----ELILQRAKELG YKG------VEMKINRQQYAESYGPTVGDEVRLADTDLWI EVEKDYTTYGDEVNFGGGKVLREGMGENGTYTRTENVLDLLLTNALILDY TGIYKADIGVKDGYIVGIGKGGNPDIMDGVTPNMIVGTATEVIAAEGKIV TAGGIDTHVHFINPDQVDVALANGITTLFGGGTGPAEGSKATTVTPGPWN IEKMLKSTEGLPINVGILGKGHGSSIAPIMEQIDAGAAGLKIHEDWGATP ASIDRSLTVADEADVQVAIHSDTLNEAGFLEDTLRAINGRVIHSFHVEGA GGGHAPDIMAMAGHPNVLPSSTNPTRPFTVNTIDEHLDMLMVCHHLKQNI PEDVAFADSRIRPETIAAEDILHDLGIISMMSTDALAMGRAGEMVLRTWQ TADKMKKQRGPLAEEKNGSDNFRLKRYVSKYTINPAIAQGIAHEVGSIEE GKFADLVLWEPKFFGVKADRVIKGGIIAYAQIGDPSASIPTPQPVMGRRM YGTVGDLIHDTNITFMSKSSIQQGVPAKLGLKRRIGTVKNCRNIGKKDMK WNDVTTDIDINPETYEVKVDGEVLTCEPVKELPMAQRYFLF *

>P1;jbureiib sequence:jbureiib:1 :A:840 :A: : : : MKLSPREVEKISLHNAGFLAQKRLARGVRLNYSESVALIASQILEHARDG EKTVAQLMSIGKHLLGRRQVLPAVPHLLNIIQVEATLPNGTKLVTVHDPI ANENGDLEEALYGSFLPVPSLDKFAESKEEHKIPGEIICADGRLTLNPGR KAVFLKVVNHGDRPIQVGSHYHFIEVNPYLTFDRRKAYGMRLNIAAGDSV RFEPGDHKTVNLVSIGGNKIIRGGNAIADGPVNEANCKAAMEIVCRREFG HKEEEDASEGVTTGDPDCPFTKAIPREEYANKYGPTIGDKIRLGDTDLIA EIEKDFALYGDESVFGGGKVIRDGMGQSSGHP-PAMSLDTVITSAVIIDY TGIIKADIGIKDGLIASIGKAGNPDIMNGVFPNMIIGVNTEVICGEGLIV TAGGIDCHVHYICPQSLDEAISSGITTVVGGGTGPTDGSRATTCTPAPTQ MKLMLQSTDDIPLNFGFTGKGSGSHPDELHEIIKAGAMGLKLHEDWGCTP AAIDNCLAVAEQHDIQVNIHTDTVNESGFVEHTIAAFNGRTIHTYHSEGA GGGHAPDIIKVCSMKNVLPSSTNTTRPLTSNTVDEHLDMLMVCHKLNREI PEDLAFASSRVREQTIAAEDILHDIGGISIISSDAQAVGRIGEVISCTWQ TADKMKAERGPLQPDGSDNDNFRIKRYIAKYTINPAIVNGISQYVGSVEV GKLADLVIWKPSFFGAKPDIVIKGGSIAWADMGDPNGSIPTPEPVLMRPM YGTLGKAGSALSIAFVSKAALDLGVKVLYGLNKRVEAVSNVRKLTKLDLK LNNSLPEITVCPETFTVTVDGQALSSEAVTTLPLSQNYFIF * 65

APÊNDICE B: listagemdasseqüênciasaminoácidosdeureasesbacterianasobtidasnopresentetrabalho. Osnúmerosrepresentamaquantidadedeseqüênciassubstancialmentediferentesencontradasparacadauma dascadeias. Cadeia Cadeia Cadeia Organismo Código C B A Acaryochloris marina 1 1 1 ACAMAR Acidovorax avenae subsp. citrulli 1 1 1 ACIAVE Acinetobacter calcoaceticus 1 1 1 ACICAL Acinetobacter baumannii 1 1 1 ACIBAU Actinobacillus pleuropneumoniae 1 1 1 ACTPLE Actinomyces naeslundii 1 1 1 ACTNAE Agrobacterium tumefaciens 1 1 1 AGRTUM Alcanivorax borkumensis 1 1 1 ALCBOR Alkalilimnicola ehrlichei 1 1 1 ALKAHR Alteromonas macleodii 'Deepecotype' 1 1 1 ALTMAC Anabaena variabilis 1 1 1 ANAVAR Anaeromyxobacter sp.Fw1095 1 0 1 ANAESP Arcobacter butzleri 1 0 0 ARCBUT Arthrobacter aurescens 1 1 1 ARTAUR Arthrobacter sp.FB24 1 1 1 ARTHSP Arthrospira maxima 0 1 0 ARTMAX Aurantimonas sp.SI859A1 1 1 1 AURASP Aureococcus anophagefferens 1 0 0 AURANO Azoarcus sp.BH72 1 1 1 AZOASP Azorhizobium caulinodans 1 1 1 AZOCAU Azotobacter vinelandii 1 1 1 AZOVIN Bacillus amyloliquefaciens 1 1 1 BACAMY Bacillus cereus 1 1 1 BACCER Bacillus coagulans 1 0 0 BACCOA Bacillus halodurans 1 1 1 BACHAL Bacillus pasteurii 1 1 1 BACPAS Bacillus sp.B14905 1 1 1 BACISP Bacillus subtilis 1 1 1 BACSUB Bacillus subtilis subsp. subtilis 1 1 1 BACSSU Blochmannia floridanus [candidatus] 1 1 1 BLOFLO Blochmannia pennsylvanicus [candidatus] 1 1 1 BLOPEN Bordetella bronchiseptica 1 1 1 BORBRO 1 1 1 BORPAR 1 1 1 BORPER Bradyrhizobium japonicum 1 1 1 BRAJAP abortus (Brucella melitensis biovar Abortus) 2 2 2 BRUABO Brucella melitensis 2 2 2 BRUMEL Brucella ovis 2 2 2 BRUOVI Brucella suis (Brucella melitensis biovar Suis) 2 2 2 BRUSUI Burkholderia ambifaria 1 1 1 BURAMB Burkholderia cenocepacia 1 1 1 BURCEN Burkholderia cepacia 1 1 1 BURCEP Burkholderia dolosa 1 1 1 BURDOL 1 1 1 BURMAL Burkholderia multivorans 1 1 1 BURMUL Burkholderia phymatum 1 1 1 BURPHY 66

Burkholderia phytofirmans 2 1 1 BURPHT Burkholderia pseudomallei 1 1 1 BURPSE Burkholderia thailandensis 1 1 1 BURTHA Burkholderia vietnamiensis 1 1 1 BURVIE Burkholderia xenovorans 1 1 1 BURXEN Caldicellulosiruptor saccharolyticus 1 1 1 CALSAC Cenarchaeum symbiosum 1 1 1 CENSYM Chlamydomonas sp.CCMP222 1 0 0 CHLASP Chromohalobacter salexigens 1 1 1 CHRSAL Clostridium perfringens 1 1 1 CLOPER Clostridium phytofermentans 1 1 1 CLOPHY Clostridium thermocellum 1 1 1 CLOTHE Comamonas testosteroni 1 1 1 COMTES Congregibacter litoralis 1 1 1 CONLIT Corynebacterium efficiens 1 1 1 COREFF Corynebacterium glutamicum 1 1 1 CORGLU Cytophaga hutchinsonii 1 0 0 CYTHUT Dechloromonas aromatica 1 1 1 DECARO Deinococcus radiodurans 1 0 0 DEIRAD Delftia acidovorans 1 1 1 DELACI Dinoroseobacter shibae 1 1 1 DINSHI Edwardsiella ictaluri 1 1 1 EDWICT Enterobacter sp. 638 1 1 1 ENTESP O157:H7 1 1 1 ESCCOL Flavobacterium johnsoniae 1 1 1 FLAJOH Flexispira rappini [nota:helicobacteriaceae] 1 0 0 FLERAP Frankia alni 1 1 1 FRAALN Frankia sp. EAN1pec 1 1 1 FRANSP Fulvimarina pelagi 1 1 1 FULPEL Geobacillus kaustophilus 1 1 1 GEOKAU Granulibacter bethesdensis 1 1 1 GRABET 1 1 1 HAEINF Hahella chejuensis 1 1 1 HAHCHE Haloarcula aidinensis 1 1 0 HALAID Haloarcula argentinensis 1 1 0 HALARG Haloarcula californiae 1 1 0 HALCAL Haloarcula hispanica 1 1 0 HALHIS Haloarcula japonica 1 1 0 HALJAP Haloarcula marismortui 1 1 1 HALMAR Haloarcula quadrata 1 1 0 HALQUA Haloarcula sinaiiensis 1 1 0 HALSIN Haloarcula vallismortis 1 1 0 HALVAL Haloquadratum walsbyi 1 1 1 HALWAL 1 1 0 HELACI Helicobacter baculiformis 1 1 0 HELBAC 1 0 0 HELBIL Helicobacter bizzozeronii 1 1 0 HELBIZ Helicobacter cynogastricus 1 1 0 HELCYN 2 2 0 HELFEL Helicobacter hepaticus 1 1 0 HELHEP Helicobacter mustelae 1 1 0 HELMUS Helicobacter pylori 1 1 0 HELPYL 67

Helicobacter salomonis 1 1 0 HELSAL Helicobacter sp.TD1 1 1 0 HELISP Helicobacter suis [candidatus] 1 0 0 HELSUI Herpetosiphon aurantiacus 1 1 1 HERAUR Jannaschia sp.CCS1 1 1 1 JANNSP Kineococcus radiotolerans 1 0 0 KINRAD Klebsiella aerogenes 1 1 1 KLEAER Klebsiella pneumoniae 1 1 1 KLEPNE Klebsiella pneumoniae subsp . pneumoniae 1 1 1 KLEPPN Lactobacillus fermentum 1 1 1 LACFER Lactobacillus reuteri 1 1 1 LACREU Loktanella vestfoldensis 1 1 1 LOKVES Lyngbya sp.PCC8106 1 1 1 LYNGSP Magnetococcus sp.MC1 1 1 1 MAGNSP Magnetospirillum gryphiswaldense 1 1 1 MAGGRY Marinobacter algicola 1 1 1 MARALG Marinobacter aquaeolei 1 1 1 MARAQU Marinobacter sp.ELB17 1 1 1 MARISP Marinomonas sp.MED121 1 0 1 MARDSP Marinomonas sp.MWYL1 1 1 1 MARWSP Mesorhizobium loti 1 1 1 MESLOT Mesorhizobium sp.BNC1 1 1 1 MESOSP Metallosphaera sedula 1 0 1 METSED Methylibium petroleiphilum 1 1 1 METPET Methylobacillus flagellatus 1 1 1 METFLA Methylobacterium chloromethanicum 3 1 3 METCHL Methylobacterium extorquens 3 1 3 METEXT Methylobacterium populi 3 1 3 METPOP Methylobacterium sp.446 1 0 1 METHSP Minibacterium massiliensis 1 1 1 MINMAS Moritella sp.PE36 1 1 1 MORISP Mycobacterium bovis 1 1 1 MYCBOV Mycobacterium gilvum 2 2 1 MYCGIL Mycobacterium smegmatis 2 1 1 MYCSME Mycobacterium tuberculosis 1 1 1 MYCTUB Mycobacterium ulcerans 1 1 1 MYCULC Mycobacterium vanbaalenii 1 1 1 MYCVAN Natronomonas pharaonis 1 1 1 NATPHA Neptuniibacter caesariensis 1 1 1 NEPCAE Nitrosococcus oceani 1 1 1 NITOCE Nitrosomonas cryotolerans 1 0 0 NITCRY Nitrosospira briensis 1 0 0 NITBRI Nitrosospira multiformis 1 1 1 NITMUL Nitrosospira tenuis 1 0 0 NITTEN Nocardia farcinica 1 1 1 NOCFAR Nodularia spumigena 1 1 1 NODSPU Nostoc muscorum 1 1 1 NOSMUS Nostoc punctiforme 2 1 1 NOSPUN Oceanicola batsensis 2 1 1 OCEBAT Oceanicola granulosus 1 1 1 OCEGRA Oceanobacter sp.RED65 1 1 1 OCEASP Ochrobactrum anthropi 2 2 2 OCHANT 68

Paracoccus denitrificans 1 1 1 PARDEN Photobacterium damselae subsp. damselae 1 0 0 PHODDA Photobacterium profundum 1 1 1 PHOPRO Photorhabdus luminescens subsp. laumondii 1 1 1 PHOLLA Polaromonas naphthalenivorans 1 1 1 POLNAP Polaromonas sp.JS666 1 1 1 POLASP Polynucleobacter sp.QLWP1DMWA1 1 1 1 POLYSP Prochlorococcus marinus 1 1 1 PROMAR Prochlorococcus marinus subsp. pastoris 1 1 1 PROMPA Proteus mirabilis 1 1 1 PROMIR 1 1 1 PROVUL Pseudoalteromonas haloplanktis 1 1 1 PSEHAL 1 1 1 PSEAER Pseudomonas entomophila 1 1 1 PSEENT Pseudomonas fluorescens 1 1 1 PSEFLU Pseudomonas mendocina 1 1 1 PSEMEN Pseudomonas putida 1 1 1 PSEPUT Pseudomonas stutzeri 1 1 1 PSESTU Pseudomonas syringae pv. phaseolicola 1 1 1 PSESYR Psychrobacter cryohalolentis 2 2 2 PSYCRY Psychromonas ingrahamii 1 1 1 PSYING Ralstonia eutropha 1 1 1 RALEUT Ralstonia metallidurans 1 1 1 RALMET Ralstonia pickettii 1 1 1 RALPIC Ralstonia solanacearum 1 1 1 RALSOL Reinekea sp.MED297 1 1 1 REINSP Rhizobium etli 1 1 1 RHIETL Rhizobium leguminosarum 1 1 1 RHILEG Rhodobacter capsulatus 1 1 1 RHOCAP Rhodobacter sphaeroides 1 1 1 RHOSPH Rhodococcus sp.RHA1 1 1 1 RHODSP Rhodoferax ferrireducens 1 1 1 RHOFER Rhodomonas salina 1 0 0 RHOSAL Rhodopseudomonas palustris 1 1 1 RHOPAL Roseobacter denitrificans 1 1 1 ROSDEN Roseobacter sp.AzwK3b 1 1 1 ROSESP Saccharophagus degradans 1 1 1 SACDEG Saccharopolyspora erythraea 1 1 1 SACERY Saccharopolyspora spinosa 1 1 1 SACSPI Sagittula stellata 1 1 1 SAGSTE Silicibacter pomeroyi 1 1 1 SILPOM Silicibacter sp.TM1040 1 1 1 SILISP Sinorhizobium medicae 1 1 1 SINMED Sinorhizobium meliloti 1 1 1 SINMEL Sporosarcina pasteurii 1 1 1 SPOPAS Staphylococcus aureus 1 1 1 STAAUR Staphylococcus aureus subsp . aureus 1 1 1 STAAAU Staphylococcus epidermidis 1 1 1 STAEPI Staphylococcus leei 1 1 0 STALEE Staphylococcus saprophyticus subsp. saprophyticus 1 1 1 STASSA Staphylococcus xylosus 1 1 1 STAXYL Stappia aggregata 1 1 1 STAAGG 69

Stigmatella aurantiaca 1 0 0 STIAUR Streptococcus alactolyticus 1 0 0 STRALA Streptococcus hyointestinalis 1 0 0 STRHYO Streptococcus salivarius 1 1 1 STRSAL Streptococcus thermophilus 1 1 1 STRTHE Streptococcus vestibularis 1 1 1 STRVES Streptomyces avermitilis 2 1 1 STRAVE Streptomyces coelicolor 2 1 1 STRCOE Streptomyces kanamyceticus 1 0 0 STRKAN Sulfitobacter sp.EE36 1 1 1 SULESP Sulfitobacter sp.NAS14.1 1 1 1 SULNSP Sulfolobus tokodaii 1 0 0 SULTOK Synechococcus elongatus 1 1 1 SYNELO Synechocystis sp. PCC6803 1 1 1 SYNESP Thermosynechococcus elongatus 1 1 1 THEELO Trichodesmium erythraeum 1 1 1 TRIERY Ureaplasma parvum 1 1 1 UREPAR Ureaplasma urealyticum 1 1 1 UREURE Verminephrobacter eiseniae 1 1 1 VEREIS Vibrio fischeri 1 1 1 VIBFIS 1 1 1 VIBPAR Vibrio shilonii 1 1 1 VIBSHI Vibrio splendidus 1 1 1 VIBSPL Xanthobacter autotrophicus 1 0 1 XANAUT 1 1 1 YERALD 1 1 1 YERBER Yersinia enterocolitica 1 1 1 YERENT Yersinia enterocolitica subsp. enterocolitica 1 1 1 YEREEN 1 1 1 YERFRE 1 1 1 YERINT 1 1 1 YERKRI 1 1 1 YERMOL 1 1 1 YERPES Yersinia pseudotuberculosis 1 1 1 YERPSE 1 1 1 YERROH 70

APÊNDICE C: Tabelacomparativadedadoscinéticosparaureases. A tabela apresenta dados compilados apartirdeaproximadamente 200 artigos referentes a aspectos bioquímicos das ureases.Porteremsuacomparaçãodificultada(devidoacondiçõesexperimentaisdiferentesemcadaartigo,porexemplo), estesdadosnãoforamconsideradosnaelaboraçãodaversãofinaldopresentetrabalho.Atabelatemcaráterpreliminarem relaçãoàdistribuiçãodoconteúdoesuaformatação.Asreferênciascitadasnatabelaencontramselistadasabaixoda mesma. Organismo Km Kcat e pH Ki Bacillus pasteurii Km40130mM[8,13] Quinonas :(noncompetitive,Kiem Km55.3mM[21,22] mM)[15] pBenzoquinone80 pFluoranil0.1 pChloranil0.2 oChloranil4.8 pBromanil0.15 pIodanil1.0 DiBr,diIbenzoquinone0.2 Chloranilicacid>1000 2CH3,6OCH3benzoquinone200 2,3Cl,5,6CNbenzoquinone600 oNaphthoquinone70 pNaphthoquinone10 2,3DiClnaphthoquinone13 Canavalia Km(pH6.5)1.5±0.mM Kcat[Molecularmassof Ki( Boric acid ,B(OH)3,actsasa ensiformis : JBU [16] 270kDawastakenasthe competitiveinhibitor):0.12mM[2,3] Km(pH7.5)2.9±0.6mM minimalmolecularform Phosphateisacompetitiveinhibitorin [16] expressingenzymic thepHrange5.87.5,withKivalues Km(pH8.5)7.1±1.7mM activityforurease]: increasingfrom0,53mMatpH5.8to [16] (pH6.5)9700s 1[16] 123mMatpH7.5.[6,5] (pH7.5)61650s 1[16] Quinonas :(noncompetitive,Kiem Km23.5mM[16,17] (pH8.5)120150s 1[16] mM)[15] pBenzoquinone10 pHótimo:7[19,20] pFluoranil0.1 pChloranil0.2 oChloranil3,5 pBromanil0.3 pIodanil0.1 DiBr,diIbenzoquinone0.1 Chloranilicacid100 2CH3,6OCH3benzoquinone120 2,3Cl,5,6CNbenzoquinone70 oNaphthoquinone5 pNaphthoquinone7 2,3DiClnaphthoquinone11 ** **** Canavalia Km(pH6.5)1.5±0.2mM Kcat[Molecularmassof ensiformis: [16] 184kDawastakenasthe Canatoxina Km(pH7.5)1.8±0.1mM minimalmolecularform [16] expressingenzymic Km(pH8.5)7.7±1.5mM activityforcanatoxin]: [16] (pH6.5)9200s 1[16] (pH7.5)18093s 1[16] (pH8.5)43240s 1[16] Km27mM[16] Glycine max: Km0.20.6mM[17] embryo-specific Helicobacter Km0,17mM[8,9] * 71 pylori Km0,20,3mM[18] *** Klebsiella Km2,4±0.1mM[1] Kcat(The Phosphate :withinthepHrange5.0 aerogenes kcatisbasedonMr=83000 7.0theinhibitionispHdependent, fortheureasecatalytic withvaluesofKiincreasingfromcirca unit.):2970±100s 1[1] 0.1mMatpH5toca.50mMatpH7. Theinhibitionisweakandnotpurely pHótimo:8[1] competitiveatpH>7.0,whilethe enzymeislabileatpH<5.0.[6,5] Ki( Boric acid ,B(OH)3,actsasa competitiveinhibitor):0.33mM[2,5] Ki( acetohydroxamic acid :slow, tightbindingcompetitiveinhibitor):2.6 M.[8,14] Ki( phenylphosphorodiamidate : slowlybindingcompetitiveinhibitor): 94pM[8,14] ***** Morus alba Km0.16mM[19,20,23] pHótimo:9[23] Proteus mirabilis Km13mM[8,11] Ki( Boric acid ,B(OH) 3,actsasa competitiveinhibitor):0.1mM[2,4] Selenomonas Km2,2mM[8,10] ruminantium Sporosarcina Km60mM[8,12] ureae Notas gerais: microbialureasespossessanoptimumpHofnearneutralityandareoftenirreversiblydenaturedbyexposure topHvaluesbelow5.[8] *IC 50 deváriosinibidoresdipeptídicoscomácidohidroxâmiconareferência[24]. **Dadossobreinibiçãocomcompostosexperimentaiscontendoorganobismutonareferência[25]. ***Dadossobreinibiçãocomfenilfosforodiamidatosnareferência[26]. ****Dadossobreinibiçãocomcetonasabinsaturadasnareferência[27]. *****Dadossobreinibiçãocomfluoretosnareferência[28]. Atividadesespecíficasdealgumas:[8]pg459. Referências: 1)Pearson,A.M.etal.,2000.KineticandStructuralCharacterizationofUreaseActiveSiteVariants. Biochemistry ,39:8575 8584. 2)Benini,Setal.,2004.MolecularDetailsofUreaseInhibitionbyBoricAcid:InsightsintotheCatalyticMechanism. J. Am. Chem. Soc .,126:37143715 3)Krajewska,B.etal.,1999. Polish J. Chem .73:359366. 4)Breitenbach,J.M.;Hausinger,R.H.1988. Biochem. J .,250:917920. 5)Todd,M.J.;Hausinger,R.P.1989. J. Biol. Chem .,264:1583515842. 6)Benini,Setal.,2001.Structurebasedrationalizationofureaseinhibitionbyphosphate:novelinsightsintotheenzyme mechanism. J. Biol. Inorg. Chem .,6:778790 7)Krajewska,B.;Zaborska,W.,1999. J. Mol. Catal. B. .6:7581. 8)Mobley,H.L.T.;Island,M.D.;Hausinger,R.P.,1995.MolecularBiologyofMicrobialUreases. Microbiol. Rev .,59:451480. 9)Hu,L.T.,andH.L.T.Mobley.1990.PurificationandNterminalanalysisofureasefromHelicobacterpylori. Infect. Immun .58:992–998. 10)Hausinger,R.P.1986.PurificationofanickelcontainingureasefromtherumenanaerobeSelenomonasruminantium. J. Biol. Chem .261:7866–7870. 11)Breitenbach,J.M.,andR.P.Hausinger.1988.Proteusmirabilisurease:partialpurificationandinhibitionbyboricacid andboronicacids. Biochem. J .250:917–920. 12)McCoy,D.D.,A.Cetin,andR.P.Hausinger.1992.CharacterizationofureasefromSporosarcinaureae. Arch. Microbiol . 157:411–416. 13)Larson,A.D.,andR.E.Kallio.1954.Purificationandpropertiesofbacterialurease. J. Bacteriol .68:67–73. 72

14)Todd,M.J.,andR.P.Hausinger.1989.CompetitiveinhibitorsofKlebsiellaaerogenesurease.Mechanismsof interactionwiththenickelactivesite. J. Biol. Chem .264:15835–15842. 15)Ashiralieva,A.;Kleiner,D.,2003.Polyhalogenatedbenzoandnaphthoquinonesarepotentinhibitorsofplantand bacterialureases. FEBBS Letters .555:367370. 16)Follmer,C.etal.,2001.Canatoxin,atoxicproteinfromjackbeans(Canavaliaensiformis),isavariantformofurease (EC3.5.1.5):biologicaleffectsofureaseindependentofitsureolyticactivity. Biochem. J .360:217224 17)Follmer,C.et.al.,2004.Jackbean,soybeanandBacilluspasteuriiureases:Biologicaleffectsunrelatedtoureolytic activity. Eur. J. Biochem .271:1357–1363 18)Mobley,H.L.T.;Hu,L.T.;Foxall,P.A.,1991.Helicobacterpyloriurease:propertiesandroleinpathogenesis. Scand. J. Gastroenterol. Suppl .187:3946 19)Hirayama,C.etal.,2000.Hostplantureaseinthehemolymphofthesilkworm,Bombyxmori. Journal of Insect Physiology. 46:1415–1421 20)Fishbein,W.N.,1969.Ureasecatalysis.III.Stoichiometry,kinetics,andinhibitorypropertiesofathirdsubstrate dihydroxyurea. Journal of Biological Chemistry. 244:1188–1193. 21)Ha,N.–C.etal.,2001.SupramolecularassemblyandacidresistanceofHelicobacterpyloriurease. Nature Structural Biology .8:505509. 22)Morsdorf,G.&Kaltwasser,H..1989. Arch. Microbiol .152:125–131. 23)Hirayama,C.etal.,2000.Purificationandpropertiesofureasefromtheleafofmulberry,Morusalba. Phytochemsistry . 53:325330. *24)Mishra,H.;Parrill,A.L.;Williamson,J.S.,2002.ThreeDimensionalQuantitativeStructureActivityRelationshipand ComparativeMolecularFieldAnalysisofDipeptideHydroxamicAcidHelicobacterpyloriUreaseInhibitors. Antmicrobial Agents and Chemotherapy ,8:2613–2618 **25)Murafuji,T.etal.,2006.Inhibitionofjackbeanureasebyorganobismuthcompounds. Bioorganic & Medicinal Chemistry Letters .16:1510–1513 ***26)Faraci,W.S.etal.,1995.InhibitionofHelicobacterpyloriUreasebyPhenylPhosphorodiamidates:Mechanismof Action. Bioorganic & Medicinal Chemistry. 5:605610 ****27)Tanaka,T.;Kawase,M.;Tani,S.,2003.Ureaseinhibitoryactivityofsimplea,bunsaturatedketones. Life sciences . 73:2985–2990 *****28)Todd,M.J.;Hausinger,R.P.,2000.FluorideInhibitionofKlebsiellaaerogenesUrease:MechanisticImplicationsofa Pseudouncompetitive,SlowBindingInhibitor. Biochemistry .39:53895396