Uso De Assinaturas Estruturais Para Proposta De Mutações Em Enzimas Β-Glicosidase Usadas Na Produção De Biocombustíveis
Total Page:16
File Type:pdf, Size:1020Kb
i UNIVERSIDADE FEDERAL DE MINAS GERAIS PROGRAMA INTERUNIDADES DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA DIEGO CÉSAR BATISTA MARIANO Uso de assinaturas estruturais para proposta de mutações em enzimas β-glicosidase usadas na produção de biocombustíveis Belo Horizonte 2019 ii UNIVERSIDADE FEDERAL DE MINAS GERAIS PROGRAMA INTERUNIDADES DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA DIEGO CÉSAR BATISTA MARIANO Uso de assinaturas estruturais para proposta de mutações em enzimas β-glicosidase usadas na produção de biocombustíveis Tese apresentada ao Programa Interunidades de Pós- Graduação em Bioinformática da Universidade Fe- deral de Minas Gerais, como requisito à obtenção do título de Doutor em Bioinformática. Orientadora: Dra. Raquel Cardoso de Melo Minardi Belo Horizonte 2019 043 Mariano, Diego César Batista. Uso de assinaturas estruturais para proposta de mutações em enzimas β-glicosidade usadas na produção de biocombustíveis [manuscrito] /Diego César Batista Mariano. – 2019. 98 f. : il. ; 29,5 cm. Orientadora: Dra Raquel Cardoso de Melo Minardi. Tese (doutorado) – Universidade Federal de Minas Gerais, Instituto de Ciências Biológicas. Programa Interunidades de Pós-Graduação em Bioinformática. 1. Bioinformática - Teses. 2. Biocombustíveis. 3. Mutação. I. Minardi, Raquel Cardoso de Melo. II. Universidade Federal de Minas Gerais. Instituto de Ciências Biológicas. III. Título. CDU: 573:004 Ficha elaborada por Sônia M. S. Moraes CRB 6/1357 - ICB/UFMG i Resumo β-glicosidases (EC 3.2.1.21) são enzimas chave no processo de produção de biocombustíveis de segunda geração. Elas agem em conjunto com endoglucanases e exoglucanases na conver- são de biomassa em açúcares fermentáveis. Entretanto, a maior parte das β-glicosidases co- nhecidas são altamente inibidas por grandes concentrações de glicose. Assim, a busca por mu- tações que melhorem a atividade de β-glicosidases não tolerantes a inibição por glicose é de grande importância para a indústria. Nesta tese, é apresentada uma revisão sistemática da lite- ratura para coletar informações sobre β-glicosidases glicose-tolerantes e construir uma base de dados, denominada BETAGDB. Além disso, são caracterizados resíduos importantes no bolsão catalítico para atividade e glicose-tolerância. Por fim, apresenta-se um método baseado na diferença de variação de assinaturas estruturais para propor mutações em enzimas, deno- minado SSV (Structural Signature Variation). SSV usa modelagem em grafos para criar uma assinatura estrutural identificadora de β-glicosidases glicose-tolerantes. O método SSV foi avaliado em três estudos de caso: (i) 27 mutações descritas na literatura foram manualmente classificadas como benéficas ou não. A seguir, a classificação foi reproduzida utilizando SSV. O método obteve uma acurácia de 0,74 e uma precisão de 0,89; (ii) 18 mutações benéficas foram propostas para a β-glicosidase não tolerante Bgl1B. Resultados experimentais de três mutações corroboram os resultados obtidos pelo segundo estudo de caso e demonstram que SSV é um método eficaz para proposta de mutações em β-glicosidases; e (iii) comparou-se SSV com SVM para verificar se a distância euclidiana, métrica usada por SSV para compara- ção de assinaturas, era eficaz. Comparou-se ainda com BioGPS, um método que usa finger- prints para proposta de mutações baseadas em estruturas tridimensionais. SSV obteve valores de precisão e especificidade superiores a SVM. Na comparação com BioGPS, SSV foi capaz de predizer corretamente cinco em sete mutações validadas em bancada que inseriam ativida- de amidase em uma lipase. Os resultados obtidos nesta tese podem ajudar na produção de en- zimas β-glicosidases mutantes capazes de aperfeiçoar a produção de biocombustíveis de se- gunda geração. O método SSV pode ser estendido a outras enzimas e pode ainda ser utilizado em conjunto com outras estratégias e ferramentas para propor mutações mais eficientes. SSV está disponível em: <http://bioinfo.dcc.ufmg.br/ssv>. Palavras-chave: biocombustíveis, β-glicosidases, assinaturas estruturais, mutações, SSV ii Abstract β-glucosidases (EC 3.2.1.21) are key enzymes in the second-generation biofuel production. They act synergically with endoglucanases and exoglucanases in the conversion of biomass to fermentable sugars. However, most known β-glucosidases are highly inhibited by high glu- cose concentrations. Hence, the search for mutations that improve the activity of non-tolerant β-glucosidases has great importance to the industry. In this thesis, I present a systematic re- view of the literature to collect information about glucose-tolerant β-glucosidases and to con- struct a database, called BETAGDB. In addition, important residues for the activity and glu- cose-tolerance were characterized in the catalytic pocket. Finally, I proposed a method based on the difference of variation of structural signatures to propose mutations in enzymes, called Structural Signature Variation (SSV). SSV uses graph modeling to create a structural signa- ture that identifies glucose-tolerant β-glucosidases. The SSV method was evaluated in three case studies: (i) 27 mutations described in the literature were manually classified as benefi- cial or not. The classification was then reproduced using SSV. The method obtained an accu- racy of 0.74 and a precision of 0.89; (ii) 18 beneficial mutations were proposed for the non- tolerant β-glucosidase Bgl1B. Experimental results of three mutations corroborate the out- comes obtained by the second case study and demonstrate that SSV is an effective method for the proposal of mutations in β-glucosidases; and (iii) SSV was compared with SVM to verify whether the Euclidean distance, metric used by SSV for comparison of signatures, was effec- tive. It was also compared with BioGPS, a method that uses fingerprints to propose mutations based on three-dimensional structures. SSV obtained values of precision and specificity supe- rior to SVM. In the comparison to BioGPS, SSV was able to correctly predict five in seven bench-validated mutations that inserted amidase activity into a lipase. The results obtained in this thesis may aid in the production of mutant β-glucosidase enzymes capable of enhancing the production of second-generation biofuels. The SSV method can be extended to other en- zymes and can also be used together to other strategies and tools to propose more efficient mutations. SSV is available at <http://bioinfo.dcc.ufmg.br/ssv>. Keywords: biofuels, β-glucosidases, structural signatures, mutations, SSV iii Agradecimentos Gostaria de agradecer às agências de fomento à pesquisa: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), Fundação de Amparo à Pesquisa do Estado de Minas Gerais (FAPEMIG) e Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq); ao Programa de Pós-graduação em Bioinformática da UFMG; e à equipe do Labora- tório de Bioinformática e Sistemas que me auxiliou nesta jornada. Agradeço a minha família pelo apoio e incentivo aos estudos; a meus orientadores de iniciação científica, mestrado e doutorado, que auxiliaram na minha construção como pesqui- sador; agradeço à comunidade de desenvolvedores de software livre e de divulgação científi- ca; e agradeço à Universidade Federal de Minas Gerais por fomentar minha formação intelec- tual, moral e ética. “O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – Brasil (CAPES) – Código de Financiamento 001”. Edital Biolo- gia Computacional. Número de processo 23038.004007/2014-82. iv SUMÁRIO Resumo .................................................................................................................................................. i Abstract ................................................................................................................................................ ii Agradecimentos .............................................................................................................................. iii SUMÁRIO ............................................................................................................................................. iv Lista de Figuras ................................................................................................................................ vi Lista de Tabelas ............................................................................................................................. viii Lista de abreviações ....................................................................................................................... ix Produção Acadêmica ....................................................................................................................... x Artigos publicados diretamente relacionados a esta tese ...................................................................... x Prêmios obtidos durante o período de doutorado .................................................................................... x 1. Introdução ................................................................................................................................... 15 1.1 Enzimas β-glicosidase ...................................................................................................................... 19 1.2 Tolerância a glicose .......................................................................................................................... 22 1.3 Estimulação por glicose .................................................................................................................