UNIVERSIDADE DE SÃO PAULO

FACULDADE DE MEDICINA DE RIBEIRÃO PRETO

WILLIAM MARCIEL DE SOUZA

Caracterização genômica e evolutiva de vírus zoonóticos nas Américas

Ribeirão Preto

2017

WILLIAM MARCIEL DE SOUZA

Caracterização genômica e evolutiva de vírus zoonóticos das Américas

Versão Original

Tese apresentada à Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo para obtenção do título de Doutor em Ciências.

Área de Concentração: Imunologia Básica e Aplicada, Orientador: Prof. Dr. Luiz Tadeu Moraes Figueiredo.

Ribeirão Preto

2017

Autorizo a reprodução e divulgação total ou parcial deste trabalho, por qualquer meio convencional ou eletrônico, para fins de estudo e pesquisa, desde que citada a fonte.

Catalogação na publicação Serviço de Biblioteca e Documentação Faculdade de Medicina de Ribeirão Preto

Souza, William Marciel de Caracterização genômica e evolutiva de vírus zoonóticos nas Américas. Ribeirão Preto, 2017. 107 p. : il.; 30cm

Tese de Doutorado, apresentada à Faculdade de Medicina de Ribeirão Preto/USP. Área de concentração: Imunologia Básica e Aplicada. Orientador: Figueiredo, Luiz Tadeu Moraes.

1. Zoonoses virais. 2. Metagenômica viral. 3. Genômica. 4. Evolução. 5. . 6. Vesiculovirus 7. Arbovírus 8. Parvovírus 9.

Nome: William Marciel de Souza

Título: Caracterização genômica e evolutiva de vírus zoonóticos nas Américas

Tese apresentada à Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo para obtenção do título de Doutor em Ciências.

Área de Concentração: Imunologia Básica e Aplicada

Aprovado em __ de Novembro de 2017,

Banca Examinadora

Prof. Dr. Luiz Tadeu Moraes Figueiredo

Instituição: Universidade de São Paulo Assinatura: ______

Prof (a). Dr (a). ______

Instituição: ______Assinatura: ______

Prof (a). Dr (a). ______

Instituição: ______Assinatura: ______

Prof (a). Dr (a). ______

Instituição: ______Assinatura: ______

Prof. Dr. ______

Instituição: ______Assinatura: ______

DEDICATÓRIA

Dedico este trabalho ao meu pai (in memoriam), à minha irmã Amanda, e ao meu “irmão” Eduardo. E a todos os meus professores, pelo estímulo e conhecimento transmitido.

AGRADECIMENTOS

Ao Prof. Dr. Luiz Tadeu Moraes Figueiredo pelas oportunidades, orientação, paciência, simplicidade e estímulo que foram essenciais para meu desenvolvimento científico.

Ao Prof. Dr. Edison Luiz Durigon e Dr. Jansen de Araújo pela contribuição em diversas etapas deste estudo, e por terem gentilmente cedido as amostras aqui utilizadas, após longo período de coletas.

Ao Prof. Dr. Pablo Murcia e Dr. Robert Gifford pelos ensinamentos, generosidade, confiança e constante disponibilidade em ajudar durante todo o meu estágio na MRC- University of Glasgow Centre for Research.

Ao Dr. Márcio Roberto Teixeira Nunes e Prof. Dr. Gustavo Olszanski Acrani pelas oportunidades, ensinamentos, convívio e a amizade durante estes últimos anos, foram momentos inspiradores e de grande aprendizado.

Ao Dr. Robert Tesh, Drª. Patrícia Aguillar e Drª. Daniele Barbosa de Almeida Medeiros pela disponibilidade e colaboração nos estudos sobre os vírus da ordem Bunyavirales.

À Marilia Farignoli Romeiro, Marcílio Jorge Fumagalli e Luiz Carlos Vieira, meus amigos e pesquisadores extremamente dedicados com quem tive o imensurável prazer de contar durante todo o desenvolvimento deste estudo. Palavras não traduzem o carinho e a imensa gratidão que tenho por toda a ajuda de vocês.

À Soraya Jabur Badra pela grande amizade, carinho e pelos ótimos momentos que convivemos, bem como o suporte dado ao longo deste percurso.

Aos amigos de laboratório, Aline, Felipe Carvalho, Danilo, Angélica, Leonardo e Gilberto pela ajuda, carinho e paciência durante todo este período.

Aos Profs. Dr. Eurico Arruda, Dr. Benedito Antônio Lopes da Fonseca e às suas respectivas equipes sempre solícitos durante todo este período, e que direta ou indiretamente auxiliaram no planejamento e/ou execução deste trabalho.

Aos funcionários do Centro de Pesquisa em Virologia da FMRP-USP: Adriana,

Danillo e Maria Lúcia (Piti) pela amizade, além de constante e simpática presença durante este período. Também ao meu amigo, Antônio Carlos da Silva, pelas boas e divertidas conversas durante o desenvolvimento deste estudo. Além de todos os funcionários que possibilitam o pleno funcionamento do prédio.

Aos funcionários do Laboratório Central de Tecnologias de Alto Desempenho em Ciências da Vida (LaCTAD) na Universidade de Campinas, especialmente à Sandra Krauchenco e Osvaldo Reis, por gentilmente terem me recebido e conduzido os procedimentos de sequenciamento com a plataforma Illuimna.

Aos amigos Jedson Cardoso e Dr. Sandro Patroca da Silva pelos conhecimentos transmitidos e pela assiduidade na colaboração tanto durante meu período no Instituto Evandro Chagas, quanto no desenvolvimento deste estudo.

Aos professores do Programa de Imunologia Básica Aplicada da FMRP-USP. À Ana Cristina, secretária do Programa de Imunologia Básica Aplicada pela solicitude e gentileza com que atendeu todas as minhas dúvidas durante este período.

Aos colegas da Pós-Graduação pelas experiências compartilhadas e prazerosos momentos de descontração. Especialmente aos amigos Tiago Medina (Pará) que foi essencial na preparação da seleção do doutorado, e Leonardo Lima pelos excelentes e divertidos momentos compartilhados durante toda esta jornada.

À Fundação de Apoio à Pesquisa do Estado de São Paulo, pela concessão das bolsas (Processo No. 12/24150-9 e 15/05778-5) e pelo apoio financeiro que contribuíram diretamente para o desenvolvimento deste estudo, bem como para a participação em eventos científicos, que foram de grande importância para minha formação acadêmica, científica e profissional.

A todos os colaboradores anônimos, presentes e ausentes, que de alguma forma nos auxiliaram na execução deste projeto.

Este trabalho contou com os seguintes apoios financeiros:

- Fundação de Amparo à Pesquisa do Estado de São Paulo (Processos No.

12/24150-9; 15/05778-5; 13/14929-1; 14/02438-6).

- Pró-Reitoria de Pós-Graduação da Universidade de São Paulo.

Este trabalho resultou nas seguintes publicações:

1. Souza WM, Acrani GO, Romeiro MF, Reis O Jr, Tolardo AL, da Silva SP, de Almeida Medeiros DB, Varela M, Nunes MR, Figueiredo LTM. Molecular characterization of Capim and Enseada . Infect Genet Evol. 2016 Jun;40:47-53.

2. Souza WM, Acrani GO, Romeiro MF, Júnior OR, Tolardo AL, de Andrade AA, da Silva Gonçalves Vianez Júnior JL, de Almeida Medeiros DB, Nunes MR, Figueiredo LTM. Complete genome sequence of Piry vesiculovirus. Arch Virol. 2016 Aug;161(8):2325-8.

3. Souza WM, Romeiro MF, Fumagalli MJ, Modha S, de Araujo J, Queiroz LH, Durigon EL, Figueiredo LT, Murcia PR, Gifford R. Chapparvoviruses occur in at least three vertebrate classes and have a broad biogeographic distribution. J Gen Virol. 2017. 98 (2), 225-229.

4. Nunes Neto JP*, Souza WM*, Acrani GO, Romeiro MF, Fumagalli MJ, Vieira CL, Medeiros DB, de Lima JA, de Lima CP, Cardoso JF, Rodrigues SG, Figueiredo LTM, da Silva SP, Tesh R, Nunes MR, Vasconcelos PF. Characterization of the Bujaru, Frijoles and Tapara antigenic complexes into the Sandfly Fever group and two unclassified phleboviruses from . J Gen Virol. 2017 Apr;98(4):585-594. *Contribuíram igualmente para este trabalho.

5. Melo Junior AB*, Souza WM*, Acrani GO, Carvalho VC, Romeiro MF, Tolardo AL, Silva SP, Cardoso JF, Chiang JO, Vianez Júnior JLSG, Figueiredo LTM, Vasconcelos PFC, Nunes MRT, Medeiros DBA. Genomic characterization and evolution of Tacaiuma ( family, Bunyavirales order) isolated in Brazil. Infect Genet Evol. 2017. *Contribuíram igualmente para este trabalho. Aceito.

6. Souza WM, Fumagalli MJ, Araujo J, Sabino-Santos Jr G, Motta Maia GF, Romeiro MF, Modha S, Queiroz LH, Nunes MRT, Durigon EL, Murcia PR and Figueiredo LTM. Discovery of novel anelloviruses in wild small mammals expands the host diversity and proposes two new genera into family. Virology. 2017. Em avaliação.

7. Chiang JO*, Souza WM*, Nunes MRT, Acrani GO, Travassos da Rosa APA, Freitas NM, Silva SP, Silva PHD, Sousa AW,Rodrigues SG, Quaresma JAS, Dutary B, Guzmán H, Vasilakis N, Tesh RB, Vasconcelos PFC. Characterization of the Gamboa virus serogroup (Orthobunyavirus : Peribunyaviridae family). Am J Trop Med Hyg. 2017. *Contribuíram igualmente para este trabalho. Submetido.

8. Nunes MRT*, Souza WM*, Acrani GO, Silva SP, Vasconcelos PFC. Revalidation and genetic characterization of novel members of Group C (Orthobunyavirus, Peribunyaviridae) isolated in the Americas. PlosOne. 2017. *Contribuíram igualmente para este trabalho. Submetido.

9. Souza WM, Romeiro MF, Sabino-Santos Jr G, Motta Maia FG, Fumagalli MJ, Modha S, Nunes MRT, Murcia PR and Figueiredo LTM. A novel Hepatitis E virus in wild . Emerging Infectious Diseases. 2017. Submetido.

10. Dennis TPW*, Souza WM*, Wilson SJ, Gifford RJ. Host associations of novel Circoviruses and Parvoviruses identified via metagenomic sequencing - insights from phylogenetic analysis of endogenous viral elements. Journal of Virology. 2017. *Contribuíram igualmente para este trabalho. Submetido.

11. Aguilar PV, Souza WM, Nunes MRT. Characterization of the Patois serogroup reveals a novel reassortment within Orthobunyaviruses. 2017. Em preparação.

12. Aguilar PV, Fumagalli MJ, Souza WM, Nunes MRT. Genomic characterization of Estero real nairovirus from Cuba. 2017. Em preparação.

RESUMO SOUZA WM. Caracterização genômica e evolutiva de vírus zoonóticos nas Américas (Tese). Ribeirão Preto: Universidade de São Paulo, Faculdade de Medicina de Ribeirão Preto; 2017.

O sequenciamento de alto desempenho, pela redução dos custos nos últimos anos, vem sendo cada vez mais utilizado para prospectar e identificar vírus. Estes métodos são extremamente mais sensíveis que outros métodos moleculares, e capazes de sequenciar genomas virais sem conhecimento prévio, clonagem ou isolamento. Neste estudo, utilizamos o sequenciamento de alto desempenho para conhecer, e caracterizar genomas completos de arbovírus isolados nas Américas, incluindo a prospecção de vírus em amostras de pequenos mamíferos do estado de São Paulo, Brasil. Assim, sequenciamos e caracterizamos 44 Bunyavirales, 35 no gênero Orthobunyavirus, família Peribunyaviridae, oito no gênero Phlebovirus, família , e um orthonairovírus, família . Entre os Bunyavirales identificamos uma provável nova estratégia de codificação da proteína não estrutural do segmento pequeno, e ainda identificados sete vírus que são reassortants naturais. Caracterizamos o genoma completo do vesiculovírus Piry, determinando sua relação filogenética com arbovírus pertencentes ao gênero Vesiculovirus, família . Prospectamos novos vírus, os quais incluímos em três famílias, , Anelloviridae e Hepeviridae. Na família Parvoviridae, identificamos 20 chapparvovírus endógenos e exógenos, oriundos de grande diversidade de hospedeiros vertebrados e invertebrados, e que representam uma nova subfamília, a Chapparvovirinae. Também, descrevemos onze novas espécies de Anelloviridae em roedores silvestres e marsupiais, fornecendo importantes informações sobre a diversidade, a taxonomia, e ainda ampliamos a gama de hospedeiros de anellovírus conhecidos. Por fim, identificamos e caracterizamos uma nova espécie de Orthohepevirus de roedores Sigmodontinae, nomeada "Orthohepevirus E". Acreditamos que estamos a fornecer relevantes informações sobre genômica, epidemiologia molecular, evolução e taxonomia de 45 arbovírus americanos, bem como sobre 13 novas espécies virais encontradas em pequenos mamíferos. Tais informações deverão dar subsídios para múltiplos futuros estudos visando compreender a importância destes novos vírus e a desenvolver métodos diagnósticos.

Palavras-chave: Zoonoses virais, metagenômica viral, genômica, evolução, Bunyavirales, Vesiculovirus e Arbovírus.

ABSTRACT SOUZA WM. Genomic and evolutionary characterization of zoonotic in the Americas (Thesis). Ribeirão Preto: Universidade de São Paulo, Faculdade de Medicina de Ribeirão Preto; 2017.

In last years, high-throughput sequencing (HTS) has been cost-effective and increasingly used for prospection and identification of viruses. These methods are extremely more sensitive than other molecular methods and are capable of sequencing viral genomes without prior knowledge, cloning or isolation. In this study, we used HTS approach to identify and characterize complete genomes of arbovirus isolated in the Americas, as well as viral prospection in samples of small mammals from São Paulo State, Brazil. Thus, we sequenced and characterized 44 viruses from Bunyavirales order, including 35 in Orthobunyavirus genus, family Peribunyaviridae, eight in Phlebovirus genus, family Phenuiviridae, and one in Orthonairovirus genus, family Nairoviridae. Among the Bunyavirales we identified a novel putative strategy for encoding the non-structural protein of the small segment, as well as we identified seven viruses that are natural reassortants. Also, we characterized the complete genome of the Piry vesiculovirus, determining its phylogenetic relationship with arboviruses belonging to the Vesiculovirus genus, family Rhabdoviridae. On the other hand, we have prospected novel viruses, which included in three families, Parvoviridae, Anelloviridae, and Hepeviridae. In the Parvoviridae family, we identified 20 endogenous and exogenous chapparvoviruses from a broad diversity of vertebrate and invertebrate hosts, representing a new subfamily, the Chapparvovirinae. Also, we have described eleven new species of Anelloviridae in wild rodents and marsupials, providing important information on diversity, taxonomy and even broadening the range of known anelloviruses hosts. Finally, we identified and characterized a novel species of orthohepevirus in Sigmodontinae , named "Orthohepevirus E". We believe that we are providing relevant relevant on genomics, molecular epidemiology, evolution and taxonomy of 45 American arboviruses, as well as on 13 new viral species found in small mammals. Thus, these informations should provide support for multiple future studies to understand the importance of these new viruses, as well as to develop diagnostic methods.

Keywords: Zoonotic viruses, viral metagenomic, genomic, evolution, Bunyavirales, Vesiculovirus and Arbovirus.

LISTA DE FIGURAS

Figura 1. Fatores envolvidos para o surgimento de zoonoses virais...... 21 Figura 2. Linha do tempo da emergência de algumas zoonoses virais e seus impactos na humanidade ...... 22 Figura 3. Etapas para a quebra da barreira da espécie de hospedeiro pelo vírus “viral spillover” ...... 23 Figure 4. Exemplos de ciclos mantenedores de arbovírus ...... 25 Figure 5. Distribuição dos aegypti e Aedes albopictus no mundo ...... 27 Figure 6. Laboratório de Virologia de Bélem ...... 29 Figure 7. Metódos para identificação de vírus ...... 30 Figure 8. Comparação entre o sequenciamento de pelo método Sanger e o sequenciamento de alto desempenho ...... 32 Figure 9. Linha do tempo com o desenvolvimento de métodos de sequenciamento de alto desempenho, e suas capacidades de sequenciamento ...... 33 Figure 10. Critérios para classificação viral propostos pelo ICTV ...... 36 Figura 11. Pontos de coleta ou captura de animais silvestres no estado de São Paulo...... 40 Figura 12. MetaVIC, uma nova pipeline ...... 47 Figura 13. Gráfico interativo para a visualização de resultados gerados pelo programa Krona ...... 47 Figura 14. Fluxo de etapas com a ferramenta DIGS...... 50 Figura 15. Genomas representativos dos 35 orthobunyavírus sequenciados...... 52 Figura 16. Árvore de máxima verossimilhança do gênero Orthobunyavirus ...... 53 Figura 17. Distância evolutiva em aminoacídos entre os grupos do gênero Orthobunyavirus ...... 54 Figura 18. Eventos de reassortments naturais no gênero Orthobunyavirus ...... 55 Figura 19. Genomas dos phlebovírus sequenciados...... 56 Figura 20. Árvore de máxima verossimilhança do gênero Phlebovirus ...... 58 Figura 21. Distância evolutiva em aminoácidos entre os grupos do gênero Phlebovirus...... 58 Figura 22. Evento de reassortment natural encontrado no gênero Phlebovirus ...... 59 Figura 23. Organização genômica do orthonairovírus Estero Real ...... 60 Figura 24. Árvore de máxima verossimilhança do gênero Orthonairovirus ...... 60 Figura 25. Organização genômica do vesiculovirus Piry...... 61 Figura 26. Árvore de máxima verossimilhança baseado nas sequências completas dos genomas completos dos Vesiculovirus ...... 62 Figura 27. Organização genômica dos chapparvovírus identificados neste estudo...... 64 Figura 28. Árvore de máxima verossimilhança mostrando relacionamento dos chapparvovírus com a família Parvoviridae...... 65 Figure 29. Organização genômica dos anellovírus identificados neste estudo...... 67 Figure 30. Árvore de máxima verossimilhança mostrando o relacionamento dos anellovírus descritos na família Anelloviridae...... 69 Figure 31. Análise de p-distance dos membros da família Anelloviridae ...... 70 Figure 32. Frequência e diversidade dos anellovírus identificados neste estudo...... 72 Figure 34. Análise de p-distance dos orthohepevírus descritos entre a família Hepeviridae. . 74

LISTA DE TABELAS

Tabela 1. Principais métodos de HTS ...... 34 Tabela 2. Vírus utilizados neste estudo...... 38 Tabela 3. Amostras de roedores e marsupiais coletadas no estado de São Paulo...... 41 Tabela 4. Amostras de morcegos coletadas no estado de São Paulo...... 42 Tabela 5. Chapparvovírus identificados neste estudo...... 63 Tabela 6. Anellovírus identificados neste estudo...... 66

SUMÁRIO

1. INTRODUÇÃO ...... 21 1.1 VÍRUS ZOONÓTICOS ...... 21 1.2. ARBOVÍRUS ...... 24 1.3. A ERA CLÁSSICA E MOLECULAR DA IDENTIFICAÇÃO DOS VÍRUS ...... 29 1.4. REVOLUÇÃO GENÔMICA: DO DNA AOS MÉTODOS DE SEQUENCIAMENTO DE ALTO DESEMPENHO ...... 31 1.5. SEQUENCIAMENTO DE ALTO DESEMPENHO APLICADO À VIROLOGIA .... 35 2. OBJETIVOS ...... 37 2.1. OBJETIVO GERAL ...... 37 2.2. OBJETIVOS ESPECÍFICOS ...... 37 3. MATERIAL E MÉTODOS ...... 38 3.1. VÍRUS ISOLADOS ...... 38 3.1.1. Propagação dos vírus em células C6/36 ...... 39 3.1.2. Propagação dos vírus em células Vero ...... 40 3.2. AMOSTRAS BIOLÓGICAS PROVENIENTES DE ANIMAIS SILVESTRES ...... 40 3.2.1. Roedores e marsupiais capturados no estado de São Paulo ...... 41 Legenda: “N” número de animais por lote...... 42 3.2.2. Morcegos capturados no estado de São Paulo ...... 42 3.3. PROCESSAMENTOS DAS AMOSTRAS ...... 43 3.3.1. Preparação dos lotes ...... 43 3.3.2. Ultracentrifugação ...... 43 3.3.3. Tratamento enzimático ...... 43 3.3.4. Extração dos ácidos nucléicos e quantificação do material genético ...... 43 3.4. SEQUENCIAMENTO NUCLEOTÍDICO ...... 44 3.4.1. Reação de transcriptase reversa e preparação das amostras ...... 44 3.4.2. Preparo das bibliotecas para sequenciamento na plataforma Ion Torrent ..... 44 3.4.3. Sequenciamento nucleotídico de alto desempenho com a plataforma Ion Personal Genome Machine ...... 44 3.4.4. Preparo das bibliotecas para o sequenciamento na plataforma Illumina ...... 45 3.4.5. Sequenciamento nucleotídico de alto desempenho com a plataforma Illumina ...... 45 3.5. ANÁLISES POR BIOINFORMÁTICA ...... 46 3.5.1. Montagens dos genomas sequenciados com a plataforma Ion Torrent ...... 46 3.5.2. MetaVIC: Pipeline para metagenômica viral em amostras de hospedeiros desconhecidos ...... 46 3.5.3. Anotação gênica ...... 48 3.5.4. Análises filogenéticas ...... 48 3.5.5. Database-integrated genome-screening (DIGS) ...... 49 3.6. RT-PCR PARA DETECÇÃO ESPECÍFICA DO VÍRUS DA HEPATITE E ...... 50 4. RESULTADOS ...... 51

4.1.GENOMAS DE VÍRUS ISOLADOS NAS AMÉRICAS ...... 51 4.1.1. Gênero Orthobunyavirus (família Peribunyaviridae) ...... 51 4.1.2. Gênero Phlebovirus (família Phenuiviridae) ...... 55 4.1.3. Orthonairovirus Estero Real (família Nairoviridae) ...... 59 4.1.4. Vesiculovírus Piry (família Rhabdoviridae) ...... 61 4.2.PROSPEÇÃO DE NOVOS VÍRUS NO BRASIL ...... 62 4.2.1. Chapparvovírus (família Parvoviridae) ...... 62 4.2.2. Família Anelloviridae ...... 66 4.2.3. Família Hepeviridae ...... 72 5. DISCUSSÃO ...... 74 5.1.GENOMAS DE VÍRUS ISOLADOS NAS AMÉRICAS ...... 74 5.1.1. Gênero Orthobunyavirus (família Peribunyaviridae) ...... 74 5.1.2. Gênero Phlebovirus (família Phenuiviridae) ...... 78 5.1.3. Gênero Orthonairovirus (família Nairoviridae) ...... 79 5.1.4. Vesiculovírus Piry (família Rhabdoviridae) ...... 80 5.2. PROSPEÇÃO DE NOVOS VÍRUS NO BRASIL ...... 81 5.2.1. Chapparvovírus (família Parvoviridae) ...... 81 5.2.2. Família Anelloviridae ...... 82 5.2.3. Família Hepeviridae ...... 85 6. CONCLUSÕES ...... 86 7. REFERÊNCIAS BIBLIOGRÁFICAS ...... 87

21

1. INTRODUÇÃO 1.1 VÍRUS ZOONÓTICOS As zoonoses, doenças transmitidas entre animais e os seres humanos, têm grande importância na saúde pública mundial, sendo responsáveis por 75% das doenças infecciosas emergentes no mundo (1, 2). Dentre as zoonoses, destacam-se as infecções de etiologia viral que acompanham a humanidade há longo tempo, como a raiva (vírus da família Rhabdoviridae) (2), cujos primeiros relatos datam de 2200 a.C., em Eshnunna na antiga Mesopotâmia, atualmente parte do Iraque (3). As zoonoses virais surgem por uma série de processosPERSPECTIVES envolvendo desde dinâmicas ecológicas, até fatores microbiológicos, como exemplificado a seguir (Figura 1).

Pathogen pressure. The series of processes • Reservoir host distribution Distribution and • Reservoir host density that culminate in pathogen pressure (the intensity of infection • Prevalence of infection amount of a pathogen that is available to in reservoir hosts • Intensity of infection humans at a given point in time and space) includes pathogen dynamics in reservoir hosts, pathogen release from reservoir hosts, Excretion Slaughter Vector borne and pathogen survival or dispersal outside of Pathogen release Shedding rate Harvest rate Biting rate (vector– reservoir hosts. from reservoir host reservoir host) Pathogen dynamics in reservoir hosts Pathogen survival, Pathogen survival Pathogen survival Vector survival can be represented as three variables that development and and movement and transport of and movement determine the distribution and intensity dissemination meat of infection in time and space: the density of Pathogen pressure reservoir hosts, the prevalence of infection among reservoir hosts, and the average Human exposure Human behavior Butchering, Biting rate to pathogen that leads to contact preparation and (vector–human) intensity of infection in an infected reservoir with pathogen eating host in time and space (Supplementary information S1 (box)). Many ecological and physiological factors influence these variables Dose and route of exposure in communities of reservoir animals; however, two sets of factors are dominant. The first set is the natural history of infection in hosts, which includes the duration, intensity and severity of infection and the level of shedding. Second, the movement • Structural barriers and behaviour of hosts affect contact and the Host susceptibility • Innate immune response and molecular compatibility likelihood of exposure within and between • Replication and dissemination cycles completed species. These factors interact with the Probability of infection abundance, density, demographic turnover, spatial distribution and physiological state of Figura 1. FigureFatores 1 |envolvidos Pathways to paraspillover. o surgimento The risk of spillover de zoonoses is determined virais. by(4) a series of processes that link hosts to determine the efficiency of spread21. Nature Reviews | Microbiology the ecological dynamics of infection in reservoir hosts, the microbiological and vector determinants Collectively, these processes determine how of survival and dissemination outside of reservoir hosts, the epidemiological and behavioural deter- As zoonoses virais possuem complexos ciclos de transmissão baseathedos pathogen em três is distributed across reservoir minants of exposure, and the within-host biological factors that shape the susceptibility of recipient host populations. Such pathogen distribution hosts. The distribution and intensity of infection in reservoir hosts, followed by pathogen release, can be highly variable (for example, pulses principaismovement, mecanismos survival and. A possible zoonose development direta ,to como infectious o própriostage, determine nome the diz, pathogen é transmitida pressure, diretamente which is defined as the amount of pathogen available to the recipient host at a given point in space of Sin Nombre virus infections in deer mice de animaisand time.vertebrados Pathogen pressure para thenhumanos interacts através with the behaviour de mordidas of the recipient, como host é (ando caso vector do for vírus(Peromyscus da raiva maniculatus, ) populations in vector-borne pathogens) to determine the likelihood, dose and route of exposure. A series of within- response to climate-driven increases in ou atravéhosts d barrierso ar, como then determine ocorre host com susceptibility, os vírus and,Influenza therefore, (família the probability and severity of population) (4). Outra density) 22, or stable (as illustrated infection for a given pathogen dose. by Mycobacterium bovis infections in forma, são os vírus transmitidos aos seres humanos e a outros mamíferos pela picadapopulations de uma of livestock and wildlife)23. The mode of pathogen release from espécie animalwhich can intermediária be combined. For, example,referida como thevetor flow (ofest a pathogena transmissão between species.será detalhad reservoira na s hostsecção determines the major routes does assessment of the risk of acquiring a Such bottlenecks provide opportunities for of transmission. Pathogens may be released 1.2. Arbovízoonoticrus) infection (5). Por require último the measurement, vírus humanos public health poderiam interventions infectar that could outros lead to animais in host, excretions, o que through slaughter or of the pathogen burden carried by individual substantial reductions in the risk of spillover. through an arthropod vector (FIG. 1). The reservoir hosts, or is it sufficient to estimate Alternatively, changing environmental probability of a pathogen being released the cumulative abundance of a pathogen or social conditions can alleviate these from a reservoir host is affected by its in the environment over time? This is a key bottlenecks, which can cause surges in presence and viability in relevant tissues, question for pathogens such as Leptospira spillover infections. Our framework provides such as the blood for many vector-borne interrogans, Giardia spp., and Escherichia coli the foundation for operational models that pathogens, tissues contacted or consumed O157, and the answer may depend on modes are required for quantitative evidence-based during butchering and eating for some of contact and dose–response relationships risk analysis, preparedness, surveillance food-borne pathogens, and tissues through in humans (see below). Models that and control. which external shedding occurs for direct or integrate data from experiments, the field environmental routes. For example, the viral and epidemiological studies, even if only Barriers to spillover load and excretion rates in the salivary glands partially parameterized, may be necessary The probability of spillover is determined by are key determinants for the transmission to make such determinations. the interactions among the barriers and the of virus from carnivores, whereas We describe how pathogens overcome a associated bottlenecks that might prevent viral loads in the intestinal and respiratory series of barriers to pass from reservoir hosts cross-species transmission. Many of these tracts affect the transmission of avian to humans. Crucially, nonlinear interactions interactions are nonlinear and dynamic in influenza virus from poultry24–26. Likewise, among the barriers create bottlenecks in space and time. the release of pathogenic Leptospira spp.

2 | ADVANCE ONLINE PUBLICATION www.nature.com/nrmicro

ǟ ƐƎƏƗ !,(++ - 4 +(2'#12 (,(3#"Ʀ / 13 .$ /1(-%#1  341#ƥ ++ 1(%'32 1#2#15#"ƥ ǟ ƐƎƏƗ !,(++ - 4 +(2'#12 (,(3#"Ʀ / 13 .$ /1(-%#1  341#ƥ ++ 1(%'32 1#2#15#"ƥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ 22

conceitualmente denomina-se zoonose reversa. Este é o caso do vírus Torque Teno de suínos da família Anelloviridae (6). Ao longo do século passado, a humanidade testemunhou o surgimento de muitas zoonoses virais que resultaram em epidemias e pandemias com milhões de mortes. Os vírus Influenza, que são originários de aves, tiveram sua primeira grande epidemia registrada de 1918 a 1919, e ficou conhecida como a pandêmica “Gripe espanhola”, que infectou cerca de um terço da população mundial, e teria causado de 50 a 100 milhões de óbitos (7). No último meio século, novos vírus zoonóticos têm emergido, como os hantavírus (família ) na Ásia e Américas, os vírus Ebola (família ) e HIV (vírus da imunodeficiência humana, da família Retroviridae) na África, bem como vários outros subtipos do vírus Influenza e os vírus da família , causadores de síndromes respiratórias como a SARS (Síndrome Respiratória Aguda Grave) e o MERS (Síndrome Respiratória do Oriente Médio) (4, 8). Estes exemplos ressaltam a importância de compreendermos os fatores que influenciam a emergência e disseminação destes vírus, especialmente pelo grande impacto na mortalidade mundial (Figura 2). Outras zoonoses virais negligenciadas têm causado grande impacto na saúde pública em diversos países, como as causadas pelo vírus da Hepatite E (família Hepeviridae), causa mais comum de hepatite aguda esporádica e insuficiência hepática fulminante em seres humanosREVIEWS no mundo, com letalidade de 0,5 a 3% em adultos, e elevadas taxas (15 a 25%) entre gestantes (9, 10).

West Nile virus HIV 2002–2003 >15,000 deaths in >30 million deaths SARS coronavirus the United States 774 deaths

Ebola virus 2012–2013 >1,553 deaths Four deaths MERS coronavirus 1981 54 deaths 1918 >250 deaths

1968

1957 1937 2009 1976 2002 1997 1999 2012 2013 1977 1994

‘Spanish flu’ ‘Hong Kong flu’ ‘Russian flu’ ‘Avian flu’ ‘Swine flu’ H1N1 influenza H3N2 influenza H1N1 influenza H5N1 influenza H1N1 influenza ~50 million deaths ~700,000 deaths >371 deaths >15,000 deaths 1957–1958 1999–2002 ‘Avian flu’ ‘Asian flu’ H2N2 influenza H9N2 and H7N7 influenza H7N9 influenza ~100,000 deaths One death 44 deaths FiguraFigure 2. 1Linha | Emergence do tempo of zoonoses. da emergência Over the de past algumas century, zoonoses humanity virais has witnessed e seus impacto the emergences na humanidade of numerous. zoonotic(8) infections that have resulted in varying numbers of human fatalities. Influenza viruses that originateNature Reviewsfrom birds | Immunology account for an important proportion of these deaths, and recently many new zoonotic viruses that originate in bats, such as Hendra virus, Nipah virus and severe acute respiratory syndrome (SARS) coronavirus, have caused outbreaks with high mortality rates. Hyperlinks to World Health Organization disease report updates are provided in BOX 1. MERS, Middle East respiratory syndrome coronavirus.

to clinical medicine. Therefore, it has become a prior- influenza viruses, and the disease pathology that they ity for translational medical research to focus on the develop resembles that of humans infected with influ- development of more appropriate animal models. enza25. Another example is the woodchuck: these ani- mals are a good model for studying hepatitis Non-traditional laboratory animal models. There are (HBV) because they can be infected by the woodchuck many examples in the literature in which non-traditional hepatitis virus (WHV), which is closely related to HBV. animal models have been highly informative for our Natural infection of woodchucks by WHV produces understanding of immunology19. For several decades chronic liver disease and primary hepatocellular car- the chicken has been used to study immunology, sexual cinoma, which are similar to the diseases induced by development, and developmental biology of the limbs, HBV in humans (reviewed in REF. 26). Finally, studies of nervous system and brain20. Indeed, with the exception Tasmanian devil facial tumour disease and canine trans- of mice and humans, arguably the most thoroughly missible venereal tumour have helped us to understand characterized immune system is that of the chicken. The the role of the immune system in shaping tumour evolu- easy accessibility to the chicken embryo has aided our tion and have provided insights into the crucial roles of understanding of immune system development and was MHC genes (reviewed in REF. 27). fundamental in delineating the T cell-dependent and B cell-dependent arms of the adaptive response. Studies Natural reservoir hosts and spillover events. Why is of the thymus have provided information about T cell it important to use both the natural animal reservoir maturation (reviewed in REF. 21), and the analysis of the and the spillover host to study the immune responses bursa of Fabricius has informed our understanding of to zoonotic pathogens? Understanding the differences B cell development and function22. Furthermore, the between the immune systems of domesticated and wild first interferon (IFN) was discovered in the chicken23. animal hosts and comparing their immune systems to Other animals have also provided a wealth of knowl- that of humans is crucial for unravelling the complex edge concerning aspects of immunity and human dis- disease mechanisms that are involved in zoonotic infec- Bursa of Fabricius ease. Natural bovine tuberculosis infection in has tions (FIG. 2). Furthermore, by studying the pathogen A primary lymphoid organ that been used as a model for human tuberculosis, and cattle in its natural host we might be able to devise efficient is only found in birds. B cells are the reservoir for Mycobacterium bovis, which can be control measures in that host, thereby disrupting the mature in this organ, and 24 indeed were first observed and transmitted to humans . Similarly, ferrets are widely transmission of the pathogen to humans. This has named after this site: the ‘B’ in accepted as an excellent model for influenza infection: important implications for predicting, preventing and B cell refers to ‘bursa-derived’. they are naturally susceptible to infection with human controlling spillover events and for the development of

NATURE REVIEWS | IMMUNOLOGY ADVANCE ONLINE PUBLICATION | 3

© 2013 Macmillan Publishers Limited. All rights reserved 23

As zoonoses virais causam pouco ou nenhum sinal de doença em seus hospedeiros naturais, como aves selvagens, roedores, morcegos, primatas entre outros. Porém, quando ocorre o “viral spillover”, ou seja, a quebra de barreira da espécie hospedeira do vírus, outros hospedeiros podem apresentar manifestações clínicas que caracterizem doenças graves. Este fenômeno é constituído por complexas etapas que incluem a distribuição e densidade do hospedeiro viral em uma determinada região geográfica, a prevalência e intensidade da infecção no hospedeiro primário, assim como a capacidade do hospedeiro primário transmitir o patógeno aos hospedeiros secundários de modo eficiente até que a exposição do patógeno chegue aos humanos, geralmente o hospedeiro final. Na infecção humana, para um efetivo “viral spillover”, o patógeno precisa ser infectivo e capaz de superar as defesas imunológicas humanas, resultando em sua efetiva replicação e disseminação (Figura 3). Exemplo deste fato, ocorreu com porcos infectados com o vírus da Influenza aviária, e com cavalos infectados pelo vírus Hendra da família (11, 12). Seres humanos ao se infectarem com estes vírus zoonóticos, podem apresentar doença grave com altas taxas de mortalidade, como nas infecções pelos vírus Influenza H5N1 e H7N9, vírus Hendra, e os coronavírus da SARS e MERS (8, 11, 13, 14).

Figura 3. Etapas para a quebra da barreira da espécie de hospedeiro pelo vírus “viral spillover”. (4)

24

É importante ressaltar que zoonoses virais ainda desconhecidas, com potencial de transmissão eficiente entre humanos, podem surgir a qualquer momento, inclusive como ameaça de uma pandemia global. Surgiram desta forma, por exemplo, a SARS que ocorreu em 2003 e 2004, envolvendo transmissão do vírus de morcegos para civetas (Paradoxurus hermaphroditus), e posteriormente para humanos (15). Este vírus ceifou mais de 800 vidas humanas e custou à economia global mais de US$ 80 bilhões (16). Do mesmo modo, outro membro da família Coronaviridae originário de morcegos, emergiu no Oriente Médio em 2012 causando a MERS em cerca de 2.000 indivíduos, com letalidade de 35%. Existe uma grande preocupação de que este vírus possa vir a causar uma pandemia mundial (14). Também, novos subtipos do vírus Influenza têm emergido nos últimos anos, entre eles o H5N1 que é altamente patogênico, responsável por dizimar a produção de aves na Ásia, e causar a morte de mais de 350 seres humanos desde 2003. Este vírus continua a ocorrer em surtos regulares na Ásia (8, 13). Em 2014, o mundo foi surpreendido pela reemergência do vírus Ebola (família Filoviridae) em diversos países da costa da África ocidental (Serra Leoa, Libéria, Senegal, Gâmbia, Mali, Guiné e Nigéria), causando o maior surto já registrado, com mais de 28 mil casos suspeitos, sendo 15.261 confirmados, com 11.325 mortes (17). Em resposta, para controlar o surto, foram investidos cerca de US$ 3,6 bilhões até dezembro de 2015. Apesar disso, o surto de Ebola resultou na perda de US$ 2,2 bilhões nos três principais países atingidos: Serra Leoa, Libéria e Guiné (18), além de menos investimento e uma perda substancial no crescimento do setor privado destes países, diminuindo a produção agrícola, o que levou a preocupações com a segurança alimentar, e uma diminuição no comércio transfronteiriço, uma vez que as restrições de transporte, bens e serviços aumentaram durante a epidemia (18). Considerando-se a grande importância das zoonoses virais, a criação de fundos e recursos com o objetivo de caracterizar, monitorar e desenvolver novos métodos diagnósticos, além de antivirais e vacinas, é essencial para prevenção e controle de prováveis vírus zoonóticos emergentes e reemergentes.

1.2. ARBOVÍRUS Dentre os vírus zoonóticos emergentes, reemergentes ou negligenciados com grande preocupação na saúde pública mundial, destacam-se os transmitidos por artrópodes, conhecidos como arbovírus (arthropod borne virus) (1, 19, 20). Os arbovírus são causadores de importantes doenças infecciosas, principalmente em regiões tropicais e subtropicais do 25

mundo (5, 21), e são classificados nas famílias Asfarviridae, Arenaviridae, , Rhabdoviridae, Orthomyxoviridae, , Nairoviridae, Peribunyaviridae e Phenuiviridae (22). São transmitidos por artrópodes hematófagos, essencialmente mosquitos, moscas e carrapatos classificados em cinco ordens: Anoplura, Diptera, Ixodida, Hemiptera, e

Siphonaptera, que têm em comum o fato de se alimentarem do sangue de vertebrados. A

14 Emerging viruses: intraspecies transmission manutenção na natureza destes vírus pode ocorrer em complexos ciclos (Figura 4), mas sempre se deve considerar três componentes principais: vírus, vetores e vertebrados, como

Figure 1 aves, répteis e mamíferos, incluindo humanos (23).

Yellow fever / dengue / / Zika West Nile / Western equine encephalitis

enzootic urban enzootic urban ?

Aedes Ae. aegypti / albopictus Aedes

Japanese encephalitis

Tick-borne encephalitis enzootic amplification

Culex Culex anthropo Aedes enzootic notic

urban ? lxodes

Aedes

Figure 4. Exemplos de ciclos mantenedores de arbovírus. (24) Current Opinion in Virology

Arbovirus transmission cycles. Arboviruses that are engaged in human-to-human (H2H) transmission (upper left panel) are transmitted by the

anthropophilicA mosquitoes emergênciaAe. aegypti dosand arbovírusAe. albopictus está. These associadaviruses are thought a fatoresto have emerged como from mudançasa sylvatic/enzootic ecológicas,cycle between

non-human primates and Aedes species that feed on them. Enzootic arboviruses (upper right and lower left panels) can cause ‘spill-over’ infection

inam humans;bientais,whether climáticas,they may eventually ou aumentoadapt to a stable populacionalurban H2H cycle deis vetoresnot clear. It, isqueunlikely propiciamthat tick-transmitted o deslocamentoarboviruses (lower right

panel) will engage in a H2H cycle.

geográfico destes vírus (19, 25). Também vale destacar o impacto da migração ou a invasão

Arthropod-bornepelo homem deH2H nichostransmission ecológicosrequires ondecomplex determinadasPathogen zoonoses são mantidas na natureza,

interactions between pathogens, vectors and humans, H2H transmission depends on the ability of the pathogen

propiciando que estes vírus se tornem patógenos humanos (19). Este é o exemplo dos vírus do

which are strongly influenced by human interventions to infect and efficiently replicate in the human host,

anddengue, demographic que atualmenteand environmental dispensamconditions. o cicloHerein, silvestre, yieldingmantidoashigh por loadmosquitosin blood antropofílicosto ensure direct transmissionno

we describe the drivers of H2H vector-borne pathogen to the arthropod vector. This is dependent on pathogen

transmissionambiente urban (hereaftero (Figura‘H2H 4)transmission’), (21). identify characteristics, such as host range, tissue and cellular

knowledge gaps, and discuss future perspectives. tropism, level and duration of circulation in the donor,

A importância das infecções por arbovírus ficareplication evidente rate comin the o vector,crescenteinfectivity aumentodose noand patho-

Drivers of H2H transmission genicity of the strains.

H2Hnúmero transmission de casosfrom diagnosticadosdonor to recipient e is odriven consequenteby the impacto na saúde pública global. Muitos

titre of the pathogen in the donor blood, the duration of The emergence of pathogens with enhanced H2H trans-

pathogen circulation in donor and arthropod vector, di- missibility is prevented by the requirement of cycling

versity of the pathogen population, ability to adapt to between taxonomically divergent vertebrate and inverte-

taxonomically divergent vectors and hosts, and the reci- brate hosts, which imposes important constraints to ge-

pient’s immune status and response. In addition, H2H netic adaptation. In the case of arthropod-borne viruses

transmission is strongly influenced by factors that cause (arboviruses), all of which are RNA viruses, genetic

proximity of pathogen, vector, and humans. Thus, proxi- adaptation is facilitated by the high intra-host mutation

mal biological drivers related to pathogen, vector, host rate of the RNA genome that fuels the emergence of

interactions, and distal abiotic drivers facilitate or limit new variants at each stage of transmission [9,10,11]. A

H2H transmission (Figure 2, Box 2). well-documented example of genetic adaptation is the

Current Opinion in Virology 2017, 22:13–21 www.sciencedirect.com 26 arbovírus são emergentes, como o novo phlebovírus (família Phenuviridae) identificado na China em 2011, responsável por causar a SFTS (Síndrome grave de febre com trombocitopenia). Esta doença humana com taxas de mortalidade de 12 a 30%, tem como provável vetor, carrapatos da espécie Haemaphysalis longicornis (26). Em 2012, foi descrito no estado do Missouri, nos EUA, outro vírus transmitido por carrapatos da espécie Amblyomma americanum, que também causa uma doença humana grave, semelhante à SFTS (27). Ressaltamos aqui a ampla distribuição de carrapatos pelo mundo, com cerca de 40 espécies virais associadas a graves doenças humanas, que podem ser transmitidas por estes vetores. Destacam-se dentre elas, as causadoras de encefalites e doenças febris agudas em humanos, como o Tick-Borne Encephalitis (família Flaviviridae) e o Crimean-Congo Hemorrhagic Fever (família Nairoviridae) na Ásia, África e Europa. Muitos destes vírus transmitidos por carrapatos são responsáveis também por importantes doenças veterinárias, como o African Swine Fever (família Reoviridae) e a Nairobi infectious diseases (família Nairoviridae), ambos no continente africano (22). Embora estes vírus resultem em doenças graves e importantes para a saúde pública e veterinária, para muitos deles não estão disponíveis testes diagnósticos comerciais específicos, tratamentos, ou vacinas que minimizem a gravidade das manifestações clínicas ou previnam eficientemente as infecções. A distribuição geográfica dos arbovírus com possibilidades reais de transmissão aos seres humanos é bastante ampla, uma vez que os mosquitos vetores, principalmente dos gêneros Culex, Aedes e , ocupam praticamente todos os ecossistemas terrestres, exceto as regiões árticas e antárticas (Figura 5). O primeiro vírus identificado como causador de doença humana foi o da febre amarela (família Flaviviridae), identificado em 1900 pelo médico do exército dos EUA Walter Reed, em Cuba, que seria transmitido por mosquitos, como sugeria o cubano Carlos Finlay desde 1881 (28, 29). Descrevia-se assim, o primeiro arbovírus. Apesar do pioneirismo de Max Theiler e colaboradores em 1930 nos estudos com o vírus da febre amarela, que incluiu o desenvolvimento de uma vacina segura e eficiente (vacina 17D) a partir da atenuação do vírus após múltiplas passagens em ovo embrionário de galinha (30), este vírus continua causando milhares de mortes anualmente. Só em 2013 cerca de 127 mil casos e 45 mil óbitos foram descritos, sendo sua quase totalidade (90%) na África (31), devido principalmente a programas de vacinação irregulares, que fazem com que este vírus ainda seja um grave problema de saúde pública neste continente. No Brasil, apesar da gratuidade da vacina, entre dezembro de 2016 a abril de 2017 foram registrados mais de 2.200 casos suspeitos de febre amarela e 202 mortes, o maior número de casos em mais de 40 anos (32). 27

Os últimos 25 anos do século XX foram marcados por uma dramática expansão de outros Flaviviridae como os vírus do Dengue, que tiveram suas primeiras grandes epidemias descritas no sudeste asiático com casos graves e fatais da doença (33). Acredita-se que este vírus tenha se disseminado por praticamente todas as regiões tropicais e subtropicais devido à urbanização não planejada em países em desenvolvimento, transporte moderno, falta de controle eficaz dos mosquitos, globalização, introdução e adaptação dos principais vetores (Aedes aegypti e Aedes albopictus) em novas áreas geográficas (Figura 5) (34). Neste século, os vírus do Dengue tornaram-se os causadores de doenças infecciosas com o maior número de casos em regiões tropicais e subtropicais. Todos os anos, estima-se que ocorra de 50 a 100 milhões de infecções, e aproximadamente de 20 a 25 mil mortes (35). Considerando-se o grande impacto do Dengue na saúde pública global, esforços para produzir uma vacina eficiente, começam a tornar-se realidade. Ressaltamos a Dengvaxia desenvolvida pela companhia farmacêutica Safoni, já em uso no Brasil e a “vacina TV003”, oriunda da colaboração entre U.S. National Institute of Allergy and Infectious Diseases e o Instituto Ecology | Epidemiology and global health Butantan (São Paulo, Brasil), que esta sendo testada em vários países endêmicos (36, 37).

Figure 5. Distribuição dos mosquitos Aedes aegypti (A) e Aedes albopictus (B) no mundo. (38)

Figure 1—figure supplement 4. The distribution of the occurrence database for Ae. aegypti (A) and Ae. albopictus (B) plotted on the underlying prediction surface. DOI: 10.7554/eLife.08347.008

Kraemer et al. eLife 2015;4:e08347. DOI: 10.7554/eLife.08347 7 of 9 28

Outro flavivírus que se tornou pandêmico recentemente é o vírus Zika. Este vírus foi isolado pela primeira vez em abril de 1947 do sangue de macacos Rhesus macaque, colocados como sentinelas na floresta Zika, em Uganda (39). No entanto, apenas em 1954 que o vírus Zika foi associado a uma doença humana, e após cinco décadas sem descrição de novos casos, foram confirmados 13 infecções humanas na África e sudeste asiático (40). Em abril de 2007, o vírus Zika iniciou sua dispersão para novas regiões geográficas, sendo descritos 49 casos de doença febril aguda na ilha de Yap, na Micronésia (41). De 2013 a início de 2014, o vírus Zika já infectou 11% da população na Polinésia Francesa, e 1.385 pessoas na Nova Caledônia, Ilha de Páscoa e Ilhas Cook. Além da doença febril aguda alguns pacientes apresentaram a síndrome de Guillain-Barré (42). No começo de 2015, o vírus Zika foi identificado no Brasil, provavelmente introduzido durante a Copa das Confederações em 2013, causando uma grande epidemia no país (43). Além de causar doença febril aguda e síndrome de Guillain-Barré, o vírus Zika também foi associado a doenças neurológicas em fetos de grávidas infectadas (44). Até abril de 2017, o Brasil registrou mais de 180 mil casos de febre do Zika e cerca de 13 mil casos suspeitos de microcefalia. O vírus Zika continua sua dispersão pelo mundo, já tendo sido descrito em mais de 40 países nas Américas (45-47). Em março de 2017, uma vacina de DNA contra Zika foi aprovada pela Food and Drug Administration (EUA) para ensaios clínicos (48). O vírus Chikungunya da família Togaviridae, também de origem africana, foi isolado em 1952 na Tanzânia e responsável por surtos na África e Ásia na década de sessenta (49, 50). Após um período de relativa inatividade, reemergiu nestes continentes em 2005 como grande preocupação para a saúde pública mundial, causando grandes surtos, e disseminando- se pelo sul da Europa, Caribe e América do Sul. Em 2014 foram notificados no Brasil 41 casos importados e 27 infecções autóctones, confirmando a introdução deste arbovírus no país (51). Como os vírus do Dengue e Zika, o vírus Chikungunya causa doença febril aguda, mas que se distingue por causar artralgias, que podem persistir como artrites crônicas por toda a vida do paciente, produzindo grande morbidade, perda da qualidade de vida e também, grandes perdas econômicas (52). O Brasil possui requisitos essenciais para a introdução e adaptação de diversas arboviroses, como as já mencionadas Dengue, Febre Amarela, Zika e Chikungunya, originárias do sudeste asiático ou continente africano, e transmitidas por mosquitos do gênero Aedes (Figura 5). O vasto território nacional com um terço coberto por florestas tropicais e outros ecossistemas naturais extremamente diversificados, a grande diversidade de fauna, a degradação ambiental promovida pela pecuária e agricultura, e o crescimento populacional 29 nas últimas décadas, propiciam contato de artrópodes hematófagos com os seres humanos (53). Provavelmente, estes fatores contribuíram para o surgimento das arboviroses: febres do vírus Oropouche (Peribunyaviridae) e do vírus Mayaro (Togaviridae), ambas de grande importância na região Amazônica (54-56). Um marco importante na história da arbovirologia brasileira foi a criação do Laboratório de Virologia no Instituto Evandro Chagas, estado do Pará, pela Fundação Rockefeller, em 1954 (Figura 6). Os estudos ali realizados têm sido de grande importância na descoberta de uma ampla variedade de arbovírus. O Instituto dispõe de uma extraordinária coleção composta por mais de 10 mil cepas virais classificadas em mais de 200 espécies virais, todas identificadas por métodos de virologia clássica (57). Apesar do contínuo esforço para estudar a patogênese, ultraestrutura, biologia molecular e a evolução destes vírus, uma parte desta coleção viral permanece pouco estudada.

Figure 6. Laboratório de Virologia de Bélem. Primeiros diretores: Dr. Ottis Causey e Drª. Calixta Causey (esquerda). Drª. Amélia Paes de Andrade Travassos da Rosa e Dr. Robert Shope, realizando um teste de fixação de complemento no Laboratório de Virologia de Bélem em 1959 (direita). (57)

1.3. A ERA CLÁSSICA E MOLECULAR DA IDENTIFICAÇÃO DOS VÍRUS A história da virologia como ciência é muito recente, no entanto, os vírus como patógenos humanos são descritos em muitas páginas da história humana. Lembramos aqui, por exemplo, o clássico desenho egípcio mostrando homem com membro atrófico sugerindo sequela de poliomielite. A virologia começa em 1886, quando Adolf Eduard Mayer demonstrou que a “doença do mosaico” do tabaco (família ) poderia ser transmitida de uma planta infectada para outra planta saudável, esfregando seu extrato líquido filtrado através de papel. Tratava-se, portanto de um patógeno filtrável (58, 59). O desenvolvimento do filtro para bactérias de Chamberland-Pasteur em 1884 (Figura 7a), um sistema simples, foi essencial para os estudos de Dmitri Ivanovski (1892) e posteriormente, 30

Martinus Beijerink (1898), que detectou os ultramicróbios filtráveis, posteriormente denominados de vírus (59, 60). A primeira doença animal causada por “agentes filtráveis” foi descrita em 1898 por Friedrich Loeffler como sendo a febre aftosa (família Picornaviridae), conhecida desde o século XVI como não causada por bactérias ou toxinas, e sim por “substâncias ultravisíveis e ultrafiltráveis” (61). Um grande avanço na virologia, foi a propagação do vírus do Sarcoma de Rous (família Retroviridae) em ovos embrionados de galinha descrito em 1911, permitindo pela primeira vez a replicação viral fora de um hospedeiro natural (62). Três décadas depois, foi descrito o primeiro cultivo viral em cultura de células, os vírus da caxumba (família Paramyxoviridae) e Influenza foram mantidos em cultura de células derivadas de embrião de galinha (63).

(a) (b)

(c)

Figure 7. Metódos para identificação de vírus. Filtro Chamberland-Pasteur (a), immuno-cromatográfico (b), PCR em tempo real (c).

Os primeiros métodos diagnósticos virais datam de 1929, com a realização de testes de fixação do complemento (64). Outros dois importantes métodos diagnósticos também foram aplicados em virologia: a imunofluorescência, na década de cinquenta e a microscopia eletrônica, na década de trinta (65, 66). Grande parte do conhecimento sobre diagnóstico laboratorial e identificação viral que temos atualmente, baseia-se nas interações antígeno- anticorpo. O diagnóstico viral baseado nestas interações teve grande progresso a partir de 1975, quando Kohler e Milstein descreveram a produção de anticorpos monoclonais (67). Nos últimos anos, estes métodos diagnósticos evoluíram muito, desde os primeiros ELISAs (enzyme-linked immunosorbent assay) em meados da década de setenta, que se aprimoraram e 31 tornaram-se substancialmente baratos e fáceis de serem executados (Figura 7b), até os atuais “kits” de diagnóstico rápido, que estão disponíveis comercialmente para muitos vírus, e são amplamente utilizados na medicina humana e veterinária (68). Outro importante avanço na detecção e caracterização de vírus ocorreu com o desenvolvimento da eletroforese (69, 70), permitindo diagnosticar infecções crônicas virais, como a causada pelo HIV (família Retroviridae) (71). Com o surgimento dos métodos moleculares, em meados da década de setenta, houve uma revolução na virologia com mudanças substanciais na investigação virológica, uma vez que o material genético de um vírus passou a ser acessível e identificável. Tal avanço permitiu atingir especificidade e sensibilidade que ultrapassaram a até então obtida para a maioria dos testes clássicos, fornecendo informações relevantes como espécie, genótipo e subtipo dos vírus. Embora as técnicas de transferência de Southern e Northern blotting permitissem marcar sequências específicas de DNA viral (72, 73), elas eram lentas, caras e laboriosas. Suas vantagens em relação aos métodos clássicos, não foram suficientes para compensar suas desvantagens e por isso, não foram técnicas amplamente adotadas por laboratórios de diagnóstico clínico. Já a técnica de reação em cadeia da polimerase (PCR), desenvolvida por Kary Mullis em 1983 (74), foi rapidamente difundida nas pesquisas em virologia, tendo sido primeiramente usada no diagnóstico do vírus do papiloma humano () (75). A primeira PCR precedida de transcriptase reversa (RT) foi utilizada na detecção do HIV tipo 1 (76). Em 1999, surge a PCR em tempo real (Figura 7c) diagnosticando os vírus SV40 () e da hepatite B () (77, 78).

1.4. REVOLUÇÃO GENÔMICA: DO DNA AOS MÉTODOS DE SEQUENCIAMENTO DE ALTO DESEMPENHO O DNA (ácido desoxirribonucleico) foi identificado e isolado por Friedrich Miescher em 1869 (79), mas permaneceu esquecido até 1944, quando Oswald Avery, Colin MacLeod e Maclyn McCarty demonstraram que o DNA purificado de uma bactéria era capaz de modificar o DNA de outra bactéria (80). Um passo fundamental para a genômica foi dado em 1953 por James Watson e Francis Crick, ao descobrirem o modelo de dupla hélice do DNA, propondo que o mesmo seria composto de duas cadeias de nucleotídeos complementares, orientadas em direções opostas (compostas por adenina “A”, citosina “C”, guanina “G” e timina “T”), enroladas em torno de si e ligadas por pontes de hidrogênio (81). REV IEW

Second-generation DNA sequencing Molecule Sequencer technology (Helicos; Cambridge, MA, USA). The Alternative strategies for DNA sequencing can be grouped into several concept of cyclic-array sequencing can be summarized as the sequencing categories (as discussed previously in ref. 4). These include (i) microelec- of a dense array of DNA features by iterative cycles of enzymatic manipu- trophoretic methods9 (Box 1), (ii) sequencing by hybridization10 (Box lation and imaging-based data collection15 (Shendure and colleagues16). 2), (iii) real-time observation of single molecules11,12 (Box 3) and (iv) Two reports in 2005 described the first integrated implementations of cyclic-array sequencing (J.S. et al.13 and ref. 14). Here, we use ‘second- cyclic-array strategies that were both practical and cost-competitive with generation’ in reference to the various implementations of cyclic-array conventional sequencing32 (J.S. et al.13 and ref. 14), and other groups have sequencing that have recently been realized in a commercial product (e.g., quickly followed17,18. 454 sequencing (used in the 454 Genome Sequencers, Roche Applied Although these platforms are quite diverse in sequencing biochem- Em 1977,Science; Frederick Basel), Solexa Sanger technology e colaboradores(used in the Illumina descreveram (San Diego) umaistry as metodologia well as in how parathe array is generated, their work flows are Genome Analyzer), the SOLiD platform (Applied Biosystems; Foster conceptually similar (Fig. 1b). Library preparation is accomplished determinação City,de sequências CA, USA), the Polonatorde DNA, (Dover/Harvard) posteriormente and the denominad HeliScope Singleo método by random Sanger fragmentation ou dideoxi of DNA, followed by in vitro ligation of (Figura 8a) (82, 83). common adaptor sequences. Alternative protocols can be used to generate jumping a DNA fragmentation b DNA fragmentation libraries of mate-paired tags with control- lable distance distributions13,19. The genera- tion of clonally clustered amplicons to serve as sequencing features can be achieved by several approaches, including in situ polo- nies15, emulsion PCR20 or bridge PCR21,22 In vivo cloning and amplification In vitro adaptor ligation (Fig. 2). What is common to these methods is that PCR amplicons derived from any given single library molecule end up spatially clus-

http://www.nature.com/naturebiotechnology tered, either to a single location on a planar substrate (in situ polonies, bridge PCR), or to the surface of micron-scale beads, which can be recovered and arrayed (emulsion Cycle sequencing Generation of polony array PCR). The sequencing process itself consists 3'-… GACTAGATACGAGCGTGA…-5' (template) of alternating cycles of enzyme-driven bio- 5'-... CTGAT (primer) chemistry and imaging-based data acquisi- …CTGATC …CTGATCT tion (Fig. 3). The platforms that are discussed …CTGATCTA here all rely on sequencing by synthesis, that …CTGATCTAT is, serial extension of primed templates, but …CTGATCTATG the enzyme driving the synthesis can be

Nature Publishing Group Group Publishing Nature …CTGATCTATGC 16,23 13,24 8 Polymerase …CTGATCTATGCT either a polymerase or a ligase . Data dNTPs …CTGATCTATGCTC are acquired by imaging of the full array 200 Labeled ddNTPs …CTGATCTATGCTCG

© at each cycle (e.g., of fluorescently labeled nucleotides incorporated by a polymerase). Electrophorsesis Cyclic array sequencing Global advantages of second-generation (1 read/capillary) (>106 reads/array) or cyclic-array strategies, relative to Sanger Cycle 1 Cycle 2 Cycle 3 sequencing, include the following: (i) in vitro G A G G A T C construction of a sequencing library, followed C A C G T G G by in vitro clonal amplification to generate C C G T G T C G T A G T A sequencing features, circumvents several bot- T T A C A G C A C T A T tlenecks that restrict the parallelism of con- C What is base 1? What is base 2? What is base 3? ventional sequencing (that is, transformation Figure 8. Comparação entre o sequenciamento de pelo método Sanger (a) e o sequenciamento de alto of E. coli and colony picking). (ii) Array-based desempenho (b). F(84)igure 1 Work flow of conventional versus second-generation sequencing. (a) With high-throughput sequencing enables a much higher degree of shotgun Sanger sequencing, genomic DNA is fragmented, then cloned to a plasmid vector and parallelism than conventional capillary-based used to transform E. coli. For each sequencing reaction, a single bacterial colony is picked and sequencing. As the effective size of sequencing plasmid DNA isolated. Each cycle sequencing reaction takes place within a microliter-scale volume, features can be on the order of 1 Mm, hundreds Nos primeirosgenerating a ladder sequenciamento of ddNTP-terminated,s genômico dye-labeleds products,com o which uso are d subjectedesta tecnologia to high-resolution, faziam -se electrophoretic separation within one of 96 or 384 capillaries in one run of a sequencing instrument. As of millions of sequencing reads can potentially extenuantes procedimentosfluorescently labeled que fragments consumiam of discrete sizesde passsemanas a detector, a mesesthe four-channel de trabalho, emission spectrum os fragmentos be obtained in parallel by rastered imaging of is used to generate a sequencing trace. (b) In shotgun sequencing with cyclic-array methods, common a reasonably sized surface area. (iii) Because sequenciados adaptorseram em are ligatednúmero to fragmented pequeno genomic e conti DNA,nham which isaté then mil subjected nucleotídeo to one of severals, com protocols erro variandoarray features are immobilized to a planar sur- that results in an array of millions of spatially immobilized PCR colonies or ‘polonies’15. Each polony face, they can be enzymatically manipulated by de 0,5 a 15%.consists O primeiro of many copies sequenciamento of a single shotgun nucleotídicolibrary fragment. Asde all umpolonies vírus are tetheredde RNA to a planar já havia asido single reagent volume. Although microliter- array, a single microliter-scale reagent volume (e.g., for primer hybridization and then for enzymatic scale reagent volumes are used in practice, realizado em extension 1976 reactions)por Walter can be applied Fiers to manipulatee colaboradores all array features. F inoram parallel. sequenciadosSimilarly, imaging-based os 3.569 detection of fluorescent labels incorporated with each extension can be used to acquire sequencing these are essentially amortized over the full set nucleotídeos dodata b onacteriófago all features in parallel.MS2 da Successive família iterations Leviviridae of enzymatic (85) interrogation. No mesmo and imaging ano are, Sanger used to eof sua sequencing features on the array, dropping build up a contiguous sequencing read for each array feature. the effective reagent volume per feature to the equipe descreveram o primeiro genoma completo do fago Φ-X174 (família ), um vírus de DNA1136 com 5.386 nucleotídeos (86). Em 1984 o genomaVOLUME completo 26 NUMBER do primeiro 10 OCT OBER 2008 NATURE BIOTECHNOLOGY vírus patogênico humano foi sequenciado, o vírus do Epstein-Barr () (87). No ano seguinte, foi a vez do sequenciamento completo do HIV, na época denominado HTLV-III 33

(human T-cell leukaemia type III) (88). O método Sanger foi praticamente o único método de sequenciamento nucleotídico utilizado até o início dos anos 2000, sendo que grande parte dos genomas virais que conhecemos hoje, resultam deste método (89-91). Além disso, o método Sanger propiciou enorme progresso nos estudos de biologia e medicina, incluindo o sequenciamento dos principais organismos modelos de estudos como Caenorhabditis elegans, Drosophila melanogaster, Mus musculus e o próprio genoma humano (92-95). Entretanto, métodos de sequenciamento com menores custos, maior rapidez e maior eficiência ainda estariam por vir. Novas estratégias para o sequenciamento do DNA foram desenvolvidas no início dos anos 2000, e seus resultados proporcionaram uma revolução na biologia e medicina, pela magnitude de dados gerados a um custo muito inferior aos obtidos pelo método Sanger (96, 97). Se a virologia teve sua origem na botânica, o sequenciamento de alto desempenho (HTS, High throughput sequencing) originou-se na engenheira elétrica e na química. O primeiro notório método de HTS foi o pirosequenciamento, desenvolvido em meados de 2005 (97). O sistema consistia na paralelização do processamento de sequenciamento, utilizando a nanotecnologia e a metodologia de pirosequenciamento. As principais vantagens do uso desta tecnologia foram a rapidez e a facilidade técnica, por não necessitar da clonagem de fragmentos de DNA (Figura 8b), e por permitir a obtenção de grande volume de sequências (cerca de 100 MB) em poucas horas de trabalho (98, 99). Nos anos seguintes, diversos métodos de sequenciamento foram desenvolvidos aumentando ainda mais a capacidade de geração de sequências, e um proporcional barateamento do custo (Figura 9 e Tabela 1).

Figure 9. Linha do tempo com o desenvolvimento de métodos de sequenciamento de alto desempenho, e suas capacidades de sequenciamento. (99) 34

Tabela 1. Principais métodos de HTS. (98) Tamanho Tempo Custo do Custo da Taxa de Plataforma Capacidade Dados de equipamento por Gb sequência erros corrida (US$) (~US$) (bp)

Sequenciamento por ligação

50 (SE) 160 Gb

≤0.1%, AT SOLiD 5500 xl 75 (SE) 120 Gb ~1.4 B 10 dias $251.000 $70 viés‡

50 (SE)* 320 Gb*

Sequenciamento por síntese: CRT

12–15 M 36 (SE) 540–610 Mb 4h ~$1,000 (SE)

25 (PE) 750–850 Mb 5.5 h $996 0.1%, Illumina MiSeq v2 $99.000 150 (PE) 4.5–5.1 Gb 24–30 M 24h substituição $212 (PE)

250 (PE) 7.5–8.5 Gb 39 h $142

36 (SE) 64–72 Gb 2B(SE) 29h $150

50 (PE) 180–200 Gb 2,5 dias $58 0.1%, Illumina HiSeq2500 v4 $690.000 substituição 100 (PE) 360–400 Gb 4 B (PE) 5 dias $45

125 (PE) 450–500 Gb 6 dias $30

50 (SE) 105–125 Gb $50

$740,000 2.5 B 1–3.5 0.1%, Illumina HiSeq3000/4000 75 (PE) 325–375 Gb -$900.000 $31 (SE) dias substituição

150 (PE) 650–750 Gb $22

Sequenciamento por síntese: SNA

200 (SE) 30–50 23h 400,000– $25– Ion PGM 314 1%, indel $49.000 550,000 3,500 400 (SE) 60–100 Mb 3.7 h

300–500 200 (SE) 3h Mb $700– Ion PGM 316 2–3 M 1%, indel $49.000 600 Mb–1 1,000 400 (SE) 4.9 h Gb

600 Mb–1 200 (SE) 4 h Gb $450– Ion PGM 318 4–5.5 M 1%, indel $49.000 800 400 (SE) 1–2 Gb 7.3 h 35

Ion Proton 200 (SE) Upto10Gb 60–80 M 2–4 h 1%, indel $224.000 $80

Sequenciamento de uma única molécula longa em tempo real

Até 48 Oxford Nanopore MinION 200 Kb Até 1.5Tb >100.000 ~12%, indel $1.000 $750 horas

1.5. SEQUENCIAMENTO DE ALTO DESEMPENHO APLICADO À VIROLOGIA Tradicionalmente, a identificação de novos vírus é dependente da capacidade de cultivá-los em sistemas de cultura de células, permitindo assim seu isolamento ou propagação, e a caracterização de suas propriedades biológicas. Entretanto, muitos vírus não são cultiváveis em sistemas celulares, como é o caso do vírus da Hepatite C (família Flaviviridae), que desde sua identificação em 1989, tem na propagação em cultura de células um grande desafio (100). Como os vírus não possuem o RNA ribossomal 16s ou citocromo C oxidase, que poderiam ser utilizados para avaliar diversidade, a aplicação de recentes métodos de sequenciamento tem fornecido informações importantes sobre a diversidade viral em ampla gama de amostras, permitindo assim, caracterizá-los sem propagá-los em cultura de células (101-103). Esta abordagem, denominada “Metagenômica viral”, é baseada na investigação do genoma viral em mistura de populações microbianas (104-106) e tem permitido o conhecimento de uma extraordinária e inimaginável diversidade viral, com centenas de novos vírus descritos anualmente (103, 107-110). Muitas questões fundamentais na virologia têm sido respondidas com a metagenômica, especialmente sobre genômica, estratégias de codificação, evolução, diversidade, entre outras. Com este rápido progresso nos métodos de sequenciamento e com o grande volume de dados gerados, a bioinformática emergiu como área essencial para a realização de experimentos, análises e interpretação de dados (111). Têm sido identificados genomas de vírus completamente desconhecidos, inclusive associados às infecções humanas e veterinárias (25, 110, 112, 113). Deste modo, o sequenciamento nucleotídico de alto desempenho tem permitido uma inversão histórica no conhecimento das doenças virais, possibilitando a identificação dos vírus antes mesmo de serem observadas as doenças que estes patógenos possam vir a ocasionar (114). Além disso, o sequenciamento de alto desempenho vem sendo aplicado na identificação de vírus zoonóticos, caracterizando novos vírus que podem oferecer risco à saúde humana, mas que ainda não emergiram (19, 25, 110). Permite também a detecção de vírus que não estão sendo diagnosticados por métodos convencionais e moleculares dependentes de sequências previamente conhecidas, como, por 36

exemplo, a PCR. Assim foi identificado um novo pegivírus humano (família Flaviviridae) que coinfectava um paciente com vírus da Hepatite C (Flaviviridae), que morreu de sepse de origem desconhecida (115). Na arbovirologia, a metagenômica tem provado ser uma poderosa abordagem. Em dois recentes trabalhos foram descritos mais de 2.000 vírus em invertebrados, muitos deles hematófagos, demonstrando uma diversidade e abundância viral sem precedentes (108, 116). Além de identificar vírus patogênicos, os estudos de metagenômica ajudaram a compreender uma abundância da ordem de 125 mil novos vírus, os quais são espetacularmente diversos na natureza, atuando como antagônicos, comensais ou mutualistas (117, 118). Entretanto, a maioria destes foram descritos em ambientes aquáticos e poucos possuem a caracterização experimental como aqueles vírus que causam doenças humanas ou influenciam a economia global (118). Apenas para conceituar o grande número de vírus existentes, a biomassa de todos os vírus conhecidos foi estimada em 75 milhões de baleias azuis (aproximadamente 200 milhões de toneladas), e se colocados de ponta a ponta, o comprimento coletivo destes vírus abrangeria 65 galáxias (118, 119). Considerando-se a grande importância dos estudos de metagenômica viral e visando uma melhor compreensão da ecologia, história evolutiva e o impacto dos vírus no mundo, o International Committee on Taxonomy of Viruses (ICTV) ratificaram a inclusão dos vírus identificados por estes novos métodos de sequenciamento na classificação taxonômica, como mostrado na Figura 10 (118). Portanto, apesar de recentes, os novos métodos de CONSENSUSsequenciamento STATEMENT provaram notória capacidade de gerar informações que enriquecem e ajudam a compreender o papel dos vírus no mundo.

Phenotypic data Genomic data Metagenomic data

Biological properties Phylogeny, sequence distances Inference of biological properties

Taxonomy then Taxonomy now Proposed taxonomy • Used from 1970s–1990s • Informed by biological properties • Can be used for virus genome and • Based on biology – athogenicity metagenomic sequence data – In vitro properties – Host range • Based on – Virion structure – Epidemiology – Phenotypes inferred from genome analysis – Antigenic relationships • Informed by sequence relationships – Sequence relatedness inferred from • Wider host factors – Divergence phylogeny, homology detection and – athogenicity – hylogeny divergence metrics – Host range • Biological data not essential – Epidemiology

FigureFigure 3 1 | 0Summary. Critérios of thepara proposed classificação classification viral proposto pipeline.s The pelo proposed ICTV. classification(118) pipeline (red arrows) enables both metagenomic sequence data and conventionally derived virus sequences to be classified. InferredNature biological Reviews properties | Microbiology that are obtained by bioinformatic analysis of virus sequences together with information on sequence relatedness and gene content, and, optionally, any observed biological properties (dotted line), may all be used as defining criteria for species and higher rank taxonomic assignment in the International Committee on Taxonomy of Viruses (ICTV) taxonomy. This procedure differs from current (green arrows) and previous practice (blue arrows), in which biological data and/or host information and sequence data (current), or biological data alone (1970s–1990s), were required for classification.

be addressed by robust computational and experimental These may be used to delineate species in the absence methods. However, these caveats do not represent fun- of pheno typic data that have often been relied on for damental barriers to , as the tech- existing species definitions. Such information is best nology that is used to create metagenomic sequences is inferred from genomic sequences that comprise the improving continuously, and many of the problems, par- complete coding potential of the respective virus and ticularly those that are associated with de novo assembly, should be a minimum requirement for classification will be resolved. These improvements include methods based on sequences alone. that generate longer sequence reads and those that use template circularization to decrease error rates54. Assigning new species and genera to existing families. Demarcation procedures vary widely between virus Proposals groups and are typically based on parameters that The workshop reached a consensus view on classifying include sequence-based phylogeny and various biologi- viruses solely on the basis of metagenomic sequence data cal attributes. Although recognizing that direct biological and, consequently, developed a set of proposals (BOX 1; information may form a part of the definition of exist- Supplementary information S1 (box)). These proposals ing taxa, viruses that are identified from metagenomic are diagrammatically summarized in FIG. 3. data can be classified into additional taxa (species and genera) if their sequence relationships are comparable to Basis of classification. Classifying viruses that are those among existing taxa in that family. identified only from metagenomic data will advance virus taxonomy, dependent on appropriate checks on Delineating new families and orders. Viruses that have data integrity and following the standard procedures genome sequences that lack close relationships to viruses of assignment. This is expected to involve the creation of in existing taxa pose a particular problem, as there is no higher rank taxa that consist entirely of viruses that are phenotypically derived standard by which they can be identified from metagenomic sequence data. classified. In this situation, assignment of a virus to a new family could be based on limited or absent genetic Creating new species. The current ICTV species defini- homology to viruses in recognized families and the tion suffices for the classification of viruses based only existence of major differences in genome organization on sequence information. Virus characteristics that or inferred replication strategy. Clustering and patterns can be inferred from sequence data, including genome of variation among more closely related metagenomic organization, replication strategy, presence of homolo- sequences might be used to assign viruses hierarchically gous genes, and, potentially, host range or type of vec- to lower taxonomic ranks in such groups. However, the tor, may serve as additional biological characteristics. creation of a new family, and the assignment of genera

6 | ADVANCE ONLINE PUBLICATION www.nature.com/nrmicro

ǟ ƐƎƏƗ !,(++ - 4 +(2'#12 (,(3#"Ʀ / 13 .$ /1(-%#1  341#ƥ ++ 1(%'32 1#2#15#"ƥ ǟ ƐƎƏƗ !,(++ - 4 +(2'#12 (,(3#"Ʀ / 13 .$ /1(-%#1  341#ƥ ++ 1(%'32 1#2#15#"ƥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ ɥ 37

2. OBJETIVOS 2.1. OBJETIVO GERAL Descrever e caracterizar genomas de vírus previamente isolados nas Américas, bem como prospectar vírus em amostras de morcegos (ordem Chiroptera), gambás (ordem Didelphimorphia) e roedores (ordem Rodentia) capturados ou coletados no Brasil.

2.2. OBJETIVOS ESPECÍFICOS

ü Caracterizar genomas virais e estudar a evolução de vírus pertencentes aos gêneros Orthobunyavirus (família Peribunyaviridae), Phlebovirus (família Phenuiviridae) e Orthonairovirus (família Nairoviridae) isolados nas Américas; ü Caracterizar o genoma do vesiculovírus Piry (família Rhabdoviridae) e estudar sua evolução; ü Prospectar e caracterizar genomas virais, e estudar a evolução dos vírus em amostras de morcegos (ordem Chiroptera), gambás (ordem Didelphimorphia) e roedores (ordem Rodentia) capturados no estado de São Paulo; ü Estudar a epidemiologia molecular de vírus com possível importância médica ou veterinária.

38

3. MATERIAL E MÉTODOS 3.1. VÍRUS ISOLADOS Analisamos neste trabalho as sequências virais obtidas a partir de vírus isolados entre os anos de 1954 e 2012 no Brasil e em outros países da América Latina, que estão armazenados no Banco de Arbovírus do Centro de Pesquisa em Virologia da Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo (CPV-FMRP-USP). Além de sequências virais oriundas dos vírus fornecidos pelas equipes do Dr. Márcio Roberto Teixeira Nunes e da Dra. Daniele Barbosa de Almeida Medeiros (Instituto Evandro Chagas, em Ananindeua, estado do Pará), e pelas equipes do Dr. Robert Tesh e da Drª Patrícia Aguilar (Departamento de Patologia da Universidade do Texas, em Galveston, Estados Unidos da América)(Tabela 2). Tabela 2. Vírus utilizados neste estudo. Gênero Vírus e cepa Hospedeiro Localização Data Enseada 76V- 258801 C. epanastasis São Paulo, Brasil 1976 Capim BeAn 85821 C. philander Pará, Brasil 1958 Gamboa BeAn Geotrygon montana Pará, Brasil 1985 4488482 Gamboa AN3954462 Columbidae (pássaro) Pará, Brasil 1986 Gamboa BeAr Aedeomyia squamipennis Pará, Brasil 1986 5023802 Gamboa BeAr Aedeomyia squamipennis Pará, Brasil N/A 5033852 Gamboa Aedeomyia squamipennis Gamboa, Panamá 1962 MARU109623 Gamboa GAM1313 Aedeomyia squamipennis Gamboa, Panamá 2012 Alajuela 4385242 Aedeomyia squamipennis Colon, Panamá 1987 Alajuela 3827162 Aedeomyia squamipennis Juan Mina, Panamá 1985 Alajuela Aedeomyia squamipennis Gamboa, Panamá 1963 MARU110793 Orthobunyavirus Alajuela GAM1223 Aedeomyia squamipennis Gamboa, Panamá 2012 Soberania GAM1303 Aedeomyia squamipennis Gamboa, Panamá 2012 Soberania GAM1183 Aedeomyia squamipennis Gamboa, Panamá 2012 Soberania Aedeomyia squamipennis Bayano, Panamá 1977 GML9030233 Soberania Aedeomyia squamipennis Juan Mina, Panamá 1986 GML4357183 Gamboa TRVL Aedes sp. Paramaribo, Suriname 1964 614692 Pueblo Viejo 75V- Aedeomyia squamipennis Vines, Equador 1975 26212 Calchaqui AG 83- Aedeomyia squamipennis Santa Fe, 1982 13472 Abras 75V11833 Culex paracrybda. Naranjal, Equador 1974 Babahoyo 75V28583 Culex ocossa Babahoyo, Equador 1975 Patois 63A493 Sigmodon hispidus Almirante, Panamá 1961 39

Patois-like MP10783 N/A N/A N/A Everglades National Park, Shark River 64U803 Culex sp. 1964 EUA Zegla BT50123 Sigmodon hispidus Almirante, Panamá 1961 Apeu BeAn8482 Cebus apella Pará, Brasil 1955 Itaqui BeAn127972 Roedor sentinela Pará, Brasil 1959 Nepuyo BeAn10709 Roedor sentinela Pará, Brasil 1959 Caraparu BeAn39942 Cebus apella Pará, Brasil 1956 Madrid BT40752 Homo sapiens Almirante, Panamá 1961 Murucutu BeAn9742 Cebus apella Pará, Brasil 1955 Oriboca BeAn172 Cebus apella Pará, Brasil 1954 Marituba BeAn152 Cebus apella Pará, Brasil 1954 Tacaiuma BeAn731 Cebus apella Pará, Brasil 1955 Tacaiuma Haemagogus janthinomys Pará, Brasil 1999 BeAr6175542 Ambe BeAr4079812 Phlebotominae sp. Pará, Brasil 1982 Anhanga BeAn468522 Choloepus brasiliensis Pará, Brasil 1962 Proechimys guyannensis Bujaru BeAn476931 Pará, Brasil 1962 oris Joa BeAr3716372 Lutzomyia species Pará, Brasil 1979 Phlebovirus Munguba Lutzomyia umbratilis Pará, Brasil 1980 BeAr3897072 Tapara BeAn4135702 Phlebotominae sp. Pará, Brasil 1983 Uriurana Phlebotominae sp. Pará, Brasil 1985 BeAr4797762 Urucuri BeAn1000492 Proechimys guyannensis Pará, Brasil 1966 Orthonairovirus Estero Real3 Ornithodoros tadaridae Cuba 1980 Vesiculovirus Piry BeAn 242321 Philander opossum Pará, Brasil 1960 Local de armazenamento dos vírus sequenciados: 1Centro de Pesquisa em Virologia da FMRP-USP, 2Instituto Evandro Chagas, Ananindeua, Pará 3Universidade do Texas, Galveston, Texas, Estados Unidos da América. N/A: sem informação disponível.

3.1.1. Propagação dos vírus em células C6/36 Os vírus armazenados no CPV-FMRP-USP foram propagados em células de Aedes albopictus clone C6/36, em frascos de 75 cm2 (Corning Incorporated, EUA) (120). As células foram infectadas com 100 µL dos vírus citados na Tabela 2, e mantidas em estufa a 28ºC por 1 hora para a adsorção viral. Em seguida, adicionou-se à monocamada celular meio Leibovitz- 15 (L-15) (Vitrocell) contendo 2% de Soro Fetal Bovino (SFB), armazenando-a a 28ºC até a observação, em microscópio, do efeito citopático (CPE), ou seja, dos danos causados à célula pela infecção viral que resultam em suas mudanças morfológicas. Em seguida, coletou-se o sobrenadante e a monocamada de células, submetendo-os a centrifugação de 1.000xg a 4ºC, por 20 minutos. O sobrenadante após a centrifugação foi coletado, aliquotado em tubo de 25 mL e armazenado a -70ºC.

40

3.1.2. Propagação dos vírus em células Vero Os vírus oriundos do Instituto Evandro Chagas e da Universidade do Texas foram propagados em células Vero, de origem de epitélio renal de macaco da espécie Cercopithecus aethiops em frascos de 75 cm3 (Corning Incorporated, EUA) (121). As células foram infectadas com 200 µL de cada um dos vírus citados na Tabela 2, e incubadas por 1 hora, a 37ºC, para promover adsorção dos vírus à monocamada celular. Em seguida foram adicionados 20 mL de meio E-MEM (Eagle - Minimum Essential Medium), suplementado com 10% de soro fetal bovino inativado, e as células foram incubadas a 37°C, em atmosfera com 5% de CO2, até a formação de CPE. Em seguida, o sobrenadante e monocamada de células foram submetidos a centrifugação de 1000xg, a 4ºC, por 20 minutos. O sobrenadante foi coletado, aliquotado em tubo de 25 mL, e armazenado a -70ºC.

3.2. AMOSTRAS BIOLÓGICAS PROVENIENTES DE ANIMAIS SILVESTRES As amostras incluídas neste estudo foram coletadas de animais silvestres capturados pela equipe do Prof. Dr. Edison Luiz Durigon, do Departamento de Microbiologia do Instituto de Ciências Biomédicas da Universidade de São Paulo (ICB-USP) entre outubro de 2006 e outubro de 2010. Os roedores foram capturados na região de Ribeirão Preto, estado de São Paulo, pela equipe de campo do CPV-FMRP-USP liderada pelo Dr. Gilberto Sabino-Santos Júnior, entre 2008 e 2013 (Figura 11).

Figura 11. Pontos de coleta ou captura de animais silvestres no estado de São Paulo. 41

Todas as amostras foram coletadas seguindo as resoluções da Comissão de Ética em Experimentação Animal do Instituto de Ciências Biomédicas da Universidade de São Paulo, e com autorização do Instituto Chico Mendes de Conservação da Biodiversidade-ICMBio. As mesmas foram agrupadas em lotes constituídos do mesmo material biológico, mesma espécie animal, mesma região ou locais próximos, no mesmo período de captura ou coleta (mês ou ano), conforme descrito nas seções 3.2.1 e 3.2.2.

3.2.1. Roedores e marsupiais capturados no estado de São Paulo Roedores e marsupiais foram coletados na área rural de quatro municípios paulistas: (i) Nazaré Paulista, entre 18 e 19 de maio de 2009; (ii) Jacupiranga, entre 28 de maio de 2007 e 29 de abril de 2008; (iii) Teodoro Sampaio, entre 15 e 19 de maio de 2008; (iv) Ribeirão Preto, entre 2008 e 2013. Resumidamente, as capturas foram feitas utilizando armadilhas dos tipos Sherman e Tomahawk, intercaladas em espaçamentos de 4 metros e organizadas em 2 linhas de 40 unidades. Como isca, utilizou-se mistura de pasta de amendoim, essência de baunilha e aveia em flocos. As armadilhas foram distribuídas no final da tarde e verificadas ao amanhecer do seguinte. Os animais capturados foram transferidos para sacos plásticos e submetidos aos procedimentos de identificação, biometria, coleta de sangue e/ou órgãos (122). As amostras de órgãos e sanguíneas foram estocadas em nitrogênio líquido sendo posteriormente transferidas e armazenadas a -70ºC no Laboratório de Virologia, do Departamento de Microbiologia do ICB-USP ou no CPV-FMRP-USP. Foram incluídos neste estudo 847 amostras de roedores e marsupiais, distribuídas em 32 lotes, como apresentado na Tabela 3.

Tabela 3. Amostras de roedores e marsupiais coletadas no estado de São Paulo. Lote Animal Espécie Amostra N Local Data Lote 16 Marsupial Didelphis albiventris Soro 14 Teodoro Sampaio 2009 Lote 23 Roedor Akodon cursor Pulmão 4 Nazaré Paulista 19/05/09 Lote 26 Marsupial Didelphis albiventris Soro 14 Teodoro Sampaio 2009 Lote 27 Marsupial Didelphis albiventris Soro 16 Teodoro Sampaio 2009 Lote 28 Marsupial Didelphis albiventris Soro 17 Teodoro Sampaio 2009 Lote 29 Marsupial Didelphis albiventris Soro 17 Teodoro Sampaio 2009 Lote 30 Marsupial Didelphis albiventris Soro 14 Teodoro Sampaio 2009 Lote 31 Roedor Akodon cursor Soro 8 Nazaré Paulista 18/05/09 Lote 32 Roedor Akodon cursor Soro 8 Nazaré Paulista 18/05/09 Lote 33 Roedor Akodon cursor Pulmão 4 Nazaré Paulista 18/05/09 Lote 34 Roedor Akodon cursor Soro 4 Nazaré Paulista 18/05/09 Lote 35 Roedor Oligoryzomys nigripes Fígado 10 Vale do Ribeira 2007/2008 Lote 36 Roedor Oligoryzomys nigripes Soro 5 Jacupiranga 2008 Lote 37 Roedor Akodon sp Fígado 12 Teodoro Sampaio May-08 42

Lote 38 Roedor Akodon sp Soro 12 Nazaré Paulista May-08 Lote 39 Marsupial Didelphis albiventris Soro 9 Teodoro Sampaio May-08 Lote 1B Roedor Akodon montensis Sangue 55 Riberião Preto 2008 Lote 2B Roedor Akodon montensis Sangue 55 Riberião Preto 2008 Lote 3B Roedor Akodon montensis Sangue 41 Riberião Preto 2009 Lote 4B Roedor Akodon montensis Sangue 48 Riberião Preto 2012-2013 Lote 5B Roedor Calomys tener Sangue 38 Riberião Preto 2008 Lote 6B Roedor Calomys tener Sangue 37 Riberião Preto 2008 Lote 7B Roedor Calomys tener Sangue 34 Riberião Preto 2009, 2012-2013 Lote 8B Roedor Necromys lasiurus Sangue 59 Riberião Preto 2008 Lote 9B Roedor Necromys lasiurus Sangue 59 Riberião Preto 2008 Lote 10B Roedor Necromys lasiurus Sangue 58 Riberião Preto 2008 Lote 11B Roedor Necromys lasiurus Sangue 52 Riberião Preto 2009 Lote 12B Roedor Necromys lasiurus Sangue 24 Riberião Preto 2012-2013 Lote 13B Roedor Oligoryzomys nigripes Sangue 43 Riberião Preto 2008-2009 Lote 14B Roedor Oligoryzomys nigripes Sangue 20 Riberião Preto 2012-2013 Lote 15B Marsupial Didelphis albiventris Sangue 32 Riberião Preto 2012-2013 Lote 16B Roedor Mus musculus Sangue 24 Riberião Preto 2008-2009 Legenda: “N” número de animais por lote.

3.2.2. Morcegos capturados no estado de São Paulo Morcegos foram coletados no dia 23 de junho de 2010 em área rural do município de Araçatuba, estado de São Paulo. As capturas foram realizadas com redes de neblina com 12 metros de comprimento por 4 metros de altura, abertas ao final da tarde e recolhidas 6 horas depois. Os animais capturados foram transferidos para sacos plásticos e procedeu-se à identificação por critérios morfológicos (123), biometria, eutanásia e coleta de órgãos. Os órgãos foram armazenadas em nitrogênio líquido no campo e posteriormente, a -70ºC, no Laboratório de Virologia, do Departamento de Microbiologia do ICB-USP. Neste estudo foram incluídos 72 amostras de órgãos, distribuídas em 8 lotes, como apresentado na Tabela 4.

Tabela 4. Amostras de morcegos coletadas em Araçatuba, no estado de São Paulo. Lote Espécie Amostra N Local Data Lote 17 Artibeus lituratus Fígado 6 Araçatuba 23/06/10 Lote 18 Carollia perspicillata Fígado 18 Araçatuba 23/06/10 Lote 19 Carollia perspicillata Rim 18 Araçatuba 23/06/10 Lote 20 Glossophaga soricina Fígado 3 Araçatuba 23/06/10 Lote 21 Glossophaga soricina Rim 3 Araçatuba 23/06/10 Lote 22 Molossus rufus Fígado 8 Araçatuba 23/06/10 Lote 24 Desmodus rotundus Fígado 8 Araçatuba 23/06/10 Lote 25 Desmodus rotundus Rim 8 Araçatuba 23/06/10 Legenda: “N” número de animais por lote.

43

3.3. PROCESSAMENTOS DAS AMOSTRAS 3.3.1. Preparação dos lotes As amostras de órgãos (Rim, Fígado e Pulmão) foram pesadas e homogeneizadas individualmente com 2 mL de solução de Hanks (Gibco, EUA) no TissueLyser II (Qiagen, Alemanha). Os homogeneizados foram centrifugados a 15.000xg, por 15 minutos, a 4ºC e em seguida, os sobrenadantes dos homogeneizados, bem como outras amostras líquidas (sangue e soro), foram agrupados em lotes, respeitando os critérios apresentados na seção 3.1. Ao final, todos os lotes foram filtrados em membranas de 0,22 µm (Millipore, EUA) para remoção de células eucarióticas e bactérias, transferidos para novos tubos, e armazenados a -70ºC.

3.3.2. Ultracentrifugação Todas as amostras, soluções virais e lotes provenientes de animais silvestres, foram submetidas a ultracentrifugação para concentração do material genético. Os estoques virais no CPV-FMRP-USP foram precipitados com polietilenoglicol (PEG) 8000 (Sigma-Aldrich, EUA). Para isso, uma mistura contendo 8,57 mL de uma solução de PEG 8000 a 40% e 2,59 mL de solução NaCl a 30%, adicionada a 20 mL da solução contendo células infectadas, foi mantida sob agitação, overnight, a 4°C. Em seguida, esta mistura foi centrifugada a 14.000xg por 1 hora, a 4°C; o sobrenadante foi descartado e os precipitados foram ressuspensos em 1 mL de solução de Hanks (GIBCO, EUA). As soluções virais e os lotes de amostras de animais silvestres foram aplicados sobre um cushion de sacarose a 30%, e ultracentrifugados a 180.000xg, por 3 horas, a 4°C. Finalmente, o precipitado foi eluído em 600 µL de solução de Hanks e aliquotado em triplicatas de 200 µL.

3.3.3. Tratamento enzimático Para a remoção do DNA e/ou RNA não encapsidado, 200 µL das amostras ultracentrifugadas foram tratados com 20 U de DNAse Turbo (Ambion, EUA), 0,1 mg/mL de RNAse A (Invitrogen, EUA) e 25 U de Benzonase (Sigma-Aldrich, EUA), e incubados a 37ºC, por 2 horas. Posteriormente, a DNAse foi inativada com 10 µL de DNA Inactivation (Ambion, EUA) e as misturas foram transferidas para um novo tubo, conforme descrito pelo fabricante.

3.3.4. Extração dos ácidos nucléicos e quantificação do material genético O RNA amostral foi extraído com QIAamp Viral RNA Mini Kit (Qiagen, Alemanha), de acordo com as instruções do fabricante. O extrato de RNA foi eluído em 60 µL de solução 44 tampão de eluição livre de RNase. Todas as amostras foram quantificadas pelo Qubit® Fluorometric Quantitation (Invitrogen, EUA) no Agilent 2100 Bioanalyzer.

3.4. SEQUENCIAMENTO NUCLEOTÍDICO O sequenciamento genômico dos extratos de RNA oriundos de isolados virais do CPV-FMRP, bem como das amostras de animais, foi realizado no Laboratório Central de Tecnologias de Alto Desempenho em Ciências da Vida (LaCTAD), na Universidade de Campinas (UNICAMP). As amostras do Instituto Evandro Chagas e da Universidade do Texas, foram sequenciadas nestes respectivos locais.

3.4.1. Reação de transcriptase reversa e preparação das amostras Os extratos de RNA foram submetidos à transcrição reversa com primers randômicos e a enzima SuperScript II (Invitrogen, EUA), seguindo as instruções do fabricante. Os produtos da reação foram purificados com esferas magnéticas Agencourt AMPure XP Reagent (Beckman Coulter, EUA), para a remoção dos reagentes utilizados na reação de síntese e obtenção das fitas de cDNA exclusivamente; e eluídos em Tris-HCl (pH 7,5).

3.4.2. Preparo das bibliotecas para sequenciamento na plataforma Ion Torrent As bibliotecas para sequenciamento na plataforma Ion Torrent foram preparadas no AB Library Builder™ System. O tamanho da biblioteca foi selecionado em gel de agarose a 1%, para a remoção dos fragmentos menores que 100 nucleotídeos, utilizando o kit E-gel size selection (Invitrogen, EUA) segundo especificações do fabricante. Para a amplificação das bibliotecas de RNAs, a PCR em emulsão no Ion One Touch™ 2 System™ (Life Tecnologies, EUA) foi realizada com o kit Ion PGM™ Template OT2 200 (Life Tecnologies, EUA). Na fase aquosa o equipamento forma uma emulsão em óleo, onde realiza a termociclagens seguindo os princípios de uma PCR, ocorrendo assim a amplificação clonal dos fragmentos. Em seguida, as amostras foram enriquecidas em esferas de captura com estreptavidina e separadas magneticamente pelo equipamento One Touch ES™.

3.4.3. Sequenciamento nucleotídico de alto desempenho com a plataforma Ion Personal Genome Machine O sequenciamento na plataforma Ion Personal Genome Machine® (PGM™) System (Life Tecnologies, EUA) utilizou o princípio de sequenciamento por detecção eletroquímica de síntese, que ocorre em um chip contendo arranjo de sensores CMOS (Complementary 45 metal-oxide semiconductor). Foram utilizados o chip de 318 e o Ion PGM™ Sequencing 200 Kit v2 (Life Tecnologies, EUA) para otimizar os resultados, gerando fragmentos de 200 e 400 nucleotídeos, com acurácia média 99,5%, o que permitiu o sequenciamento de cerca de 1,6 GB.

3.4.4. Preparo das bibliotecas para o sequenciamento na plataforma Illumina Para o sequenciamento na plataforma Illumina, as bibliotecas foram construídas utilizando o kit Nextera® XT DNA Sample Preparation (Illumina, EUA), que tem transposons modificados para fragmentar o DNA amostral e inserir em suas extremidades adaptadores únicos, chamados de sequências index, numa reação de PCR de 12 ciclos. A partir destas sequências index as bibliotecas foram sequenciadas e posteriormente quantificadas com o kit KAPA Library Quantification (Illumina, EUA) seguindo as especificações do produto. Para cada reação de qPCR foram utilizados 4 µL das bibliotecas diluídas 1:4.000, 12 µL do KAPA SYBR® FAST qPCR Master Mix contendo o Primer Premix e 4 µL de água para o volume final de 20 µL. As condições de reação foram: 95°C de denaturação por 5 minutos, seguida por 35 ciclos de 95°C para o anelamento dos primers e 30 segundos a 60°C para extensão da polimerase. Todas as qPCRs foram realizadas em duplicata, no equipamento Applied Biosystems ViiATM 7Dx Real-Time PCR (Thermo Fisher, EUA).

3.4.5. Sequenciamento nucleotídico de alto desempenho com a plataforma Illumina Após quantificação, as bibliotecas foram submetidas ao sequenciamento no equipamento HiSeq 2500 (Illumina, EUA) utilizando o TruSeq DNA Sample Preparation. As amostras foram depositadas com o uso do instrumento robótico cBot (Illumina, EUA), em uma lâmina (flowcell) de 8 canaletas (lanes) contendo em sua superfície, oligonucleotídeos complementares aos adaptadores das bibliotecas. Posteriormente, esta flowcell foi inserida no equipamento HiSeq2500 para a incorporação de nucleotídeos marcados por fluorescência, contendo terminadores dideoxi nos fragmentos ligados aos adaptadores. A cada ciclo, os nucleotídeos incorporados têm sua fluorescência excitada por uma série de lasers, e a consequente emissão é captada e interpretada por câmeras. Após a captura da imagem, os terminadores são clivados e o próximo ciclo de incorporação ocorre, até um total de 100 ciclos por direção de sequência. Os sequenciamentos foram feitos por leitura “paired-end” com sequências de 2 x 150 bp, gerando aproximadamente 300 milhões de sequências por canaleta. Os dados gerados foram analisados como descrito abaixo. 46

3.5. ANÁLISES POR BIOINFORMÁTICA 3.5.1. Montagens dos genomas sequenciados com a plataforma Ion Torrent As sequências geradas pela plataforma Ion Torrent foram montadas utilizando o método De novo com o programa Mira v.4.0.2 (124). Após remoção das sequências de baixa qualidade (média inferior a % bases ≥ 20), os genomas foram montados com base na sobreposição das sequências geradas, obtendo confiabilidade dos resultados. Estas montagens genômicas foram comparadas com BlastX v.2.4.0+ utilizando uma base de dados de proteínas não redundantes disponíveis no NCBI (125).

3.5.2. MetaVIC: Pipeline para metagenômica viral em amostras de hospedeiros desconhecidos Os dados gerados pelo sequenciamento na plataforma Illumina produzem grande volume de sequências incluindo além dos genomas virais, os genomas dos hospedeiros, de bactérias, entre outros. Considerando-se que não havia pipeline específica para a remoção de sequências idênticas ou similares às de hospedeiros desconhecidos, bem como aquelas desinteressantes para nosso estudo, como as de bactérias, bacteriófagos, plantas, invertebrados, e vertebrado, uma nova pipeline, a MetaVIC, foi desenvolvida. Deste modo, a nova pipeline MetaVIC, constituída de duas etapas: pré-processamento e montagem dos genomas, foi desenvolvida e utilizada neste trabalho para os estudos de metagenômica viral de amostras de animais silvestres (Figura 12).

3.5.2.1. MetaVIC: Pré-processamento dos reads No pré-processamento para a montagem dos genomas, diferentes algorítimos foram utilizados para remover sequências não virais. Dentre eles (i) Trim_galore, para remover adaptadores e sequências curtas (126), (ii) PrinSeq, para remover sequências duplicadas e de baixa qualidade (126), (iii) Ribopicker, para remover sequências de RNA ribossomal (127), (iv) Trim_galore, novamente, para remover sequências curtas e normalizar os arquivos, (v) Diamond (BLAST-like), para alinhar os reads com todas as sequências de proteínas não redundantes disponíveis no NCBI (128), (vi) Filter_fastq, para remover reads alinhados com outras sequências desinteressantes ao estudo, como descrito acima, (vii) Trim_galore, para remover sequências curtas e normalizar os arquivos (Figura 12A). Ao final, utilizaram-se os reads filtrados na montagem dos genomas virais. 47

Figura 12. MetaVIC, uma nova pipeline. A) Etapa de pré-processamento. B) Etapa de montagem dos genomas virais.

3.5.2.2. MetaVIC: Montagem dos genomas virais Resumidamente, nesta etapa da pipeline MetaVIC as sequências pré-processadas foram submetidas ao método De novo com dois algorítmos de montagem, o IBDA_UB e o Spades (129, 130), selecionados com base no melhor desempenho em testes prévios. Posteriormente, os contigs gerados foram combinados em contigs maiores com o programa GARM (131), e alinhados com o programa Diamond (BLAST-like) (Figura 12B). Os resultados foram visualizados em gráfico interativo gerado pelo programa Krona (132) (Figura 13). Posteriormente, os contigs foram separados manualmente a partir dos arquivos de saída dos montadores, para as análises posteriores. Por ser uma ferramenta útil em metagenômica, especialmente para amostras de hospedeiros sem genoma completo disponível em base de dados, esta pipeline foi disponibilizada ao público gratuitamente em https://github.com/sejmodha/metaViC. Krona - Root 19/06/2017, 12:14

← → Search: x Root ↔

Count: 74134 - 20 + Max depth Unassigned: 18 - 11 + Font size

- + Chart size Color by Avg. log e-value Collapse

Snapshot

Link

?

x

Figura 13. Gráfico interativo para a visualização de resultados gerados pelo programa Krona. (132)

file:///Users/william/Dropbox/00_BioInfo-Glasgow/Tanzania/02_Contigs/16/HiSeq2x125/01_Assemblies/1657_LIB18446_output_contigs_diamond_krona.html Page 1 of 1 48

3.5.3. Anotação gênica As sequências genômicas virais foram verificadas manualmente e analisadas com o programa Geneious 9.1.2 (Biomatters, New Zealand). Os domínios das proteínas foram preditos com os programas InterProScan e Conserved Domain Database (133), as regiões transmembrana e peptídeos sinal foram identificados com o TOPCONS webserver (134) e os sítios de glicosilação com o NetNglyc 1.0 Server. As massas moleculares de cada uma das proteínas virais foram identificadas com a ferramenta Protein Molecular Weight Calculator (http://www.sciencegateway.org/tools/proteinmw.htm).

3.5.4. Análises filogenéticas 3.5.4.1. Conjunto de dados, alinhamento e determinação do melhor modelo estatístico As diferentes espécies virais identificadas foram analisadas separadamente e alinhadas a conjuntos de sequências de genomas virais das mesmas famílias virais disponibilizadas no Genbank. Cada conjunto de sequências foi submetido ao programa DAMBE 5.2.6 para a exclusão de sequências idênticas (135). Os alinhamentos foram feitos com os programas MAFFT, Muscle ou RevTrans (136-138) e editados manualmente para a remoção das regiões com sinal filogenético pobre. Posteriomente, para identificar os melhores modelos de substituição de nucleotídeos e de aminoácidos, visando as análises filogenéticas, os alinhamentos nucleotídicos e de aminoácidos foram individualmente submetidos aos programas jModelTest (139) e ProTest (140), respectivamente. Três critérios estatísticos foram implementados nestes programas para definir o melhor modelo para o conjunto de dados, incluindo o hLRT (hierarchical likelihood ratio tests), o AIC (Akaike Information Criterion) e o critério BIC (Bayesian Information Criterion).

3.5.4.2. Árvores filogenéticas Para inferir a classificação taxonômica dos vírus, bem como seu processo evolutivo entre os grupos virais descritos, as árvores filogenéticas foram construídas usando o método probabilístico de Máxima Verossimilhança (do inglês Maximum likelihood - ML), com três algorítmos: PhyML, RaxML e IQ-TREE (141-144). Todas as análises filogenéticas foram realizadas com o melhor modelo estatístico previamente definido e os suportes estatísticos foram calculados utilizando bootstrap com 1000 réplicas. As árvores filogenéticas foram visualizadas e editadas com o Figtree v.1.4.2.

49

3.5.4.3. Análise de distância genética e predição de motifs Para determinar a divergência genética entre os vírus identificados e seus grupos virais foi utilizado o método de p-distance, incluindo o modelo de substituição de “d: Transitions + Transversions” e um bootstrap de 1000 réplicas, no programa MEGA v.6 (145), e também com o Sequence Demarcation Tool (SDT) (146). Motifs característicos foram identificados no programa Geneious 9.1.2 com base no alinhamento aminoacídico, como previamente descrito.

3.5.4.4. Análise de reassortments Para identificar potenciais eventos de recombinação ou reassortments foram observadas as topologias das árvores filogenéticas em conjunto, pelos métodos Bootscan, Geneconv, Chiamera, MaxChi e RDP no programa RDP4 (147). Para tanto, regiões codificantes completas, ou de todos os genes dos vírus segmentados, por exemplo, os membros da ordem Bunyavirales, foram alinhadas. Para a avaliação dos resultados considerou-se um valor de “p” superior a 0,05 com correção de Bonferroni para múltiplas comparações. Todas as configurações específicas do programa foram mantidas em seus valores padrões.

3.5.5. Database-integrated genome-screening (DIGS) Para explorar genomas virais (endógenos e exógenos) depositados em base de dados públicos como o Genbank, utilizou-se a Database-integrated genome-screening version 1.0 (DIGS), disponível em https://github.com/giffordlabcvr/DIGS-tool (148). Resumidamente, as sequências de vírus de interesse foram adicionadas no DIGS e em seguida, foram realizadas exaustivas comparações com o BLAST, buscando por sequências virais homólogas em genomas e transcriptomas de dados previamente publicados (Figura 14). Em seguida, os genomas encontrados foram refinados e classificados como previamente descrito. 50

Figura 14. Fluxo de etapas com a ferramenta DIGS.

3.6. RT-PCR PARA DETECÇÃO ESPECÍFICA DO VÍRUS DA HEPATITE E Foi desenvolvido um RT-PCR para determinar a frequência de uma nova espécie de vírus da Hepatite E. Deste modo, cada amostra individual incluída nos lotes para sequenciamento (descrito na secção 3.2.1), teve seu RNA extraído e submetido à síntese de cDNA como descrito anteriormente. A reação de PCR foi realizada com 5 µL de cDNA (5-50 ng), 2,5 µL do primers forward GAGGGCCGGGCCTC(T/C)TTTGTT e reverse CAGTGGGTTTAACGAGGCGGCATA (ambos a 10 pmol/µL), 25 µL do MasterMix, e 10 µL da enzima SuperFi, totalizando 50 µL de mistura reacional. Esta reação foi submetida a uma termociclagem de 98ºC por 30 segundos, e 35 ciclos de 98ºC por 10 segundos, 70ºC por 10 segundos e 72ºC por 30 segundos, e uma extensão final de 72ºC por 5 minutos. Os produtos de PCR foram submetidos a eletroforese em gel de agarose a 1,5% e aqueles com o tamanho esperado de ~800 pb foram preparados com ExoSAP-IT® (USB, EUA) e submetidos ao sequenciamento pelo método Sanger, no equipamento ABI 3130 Aviant automated sequencer (Applied Biosystems, EUA). Os resultados foram visualizados e analisados com o programa Geneious 9.1.2 (Biomatters, New Zealand), e para confirmar o sequenciamento na região de interesse, as sequências foram submetidas ao BLAST e alinhadas com sequências de referências.

51

4. RESULTADOS 4.1.GENOMAS DE VÍRUS ISOLADOS NAS AMÉRICAS 4.1.1. Gênero Orthobunyavirus (família Peribunyaviridae) 4.1.1.1. Caracterização genômica dos orthobunyavírus Os 35 orthobunyavírus sequenciados neste trabalho possuem genomas de RNA trisegmentado com polaridade negativa. Os segmentos L destes vírus codificam a proteína RNA polimerase dependente de RNA (RdRP), com tamanho entre 2.240 e 2.273 aminoácidos. As RdRPs possuem domínios altamente conservados, nomeados Pre-Motif A e Motifs A a E em posições aminoacídicas entre 951 a 1.252 (Figura 15). Os segmentos M codificam precursores das glicoproteínas (GPC) com 1.425 a 1.593 aminoácidos, e possuem um peptídeo sinal na região N terminal. As GPCs são clivadas nas proteínas estruturais Gn e Gc, e na proteína não estrutural NSm. A topologia das GPCs contém quatro domínios transmembrânicos (TMD) com exceção das GPCs dos vírus do grupo Gamboa (vírus Gamboa, Alajuela, Calchaqui, Pueblo Viejo e Soberania) que apresentam 7 TMDs, além de uma proteína NSm maior que as previamente descritas para o gênero Orthobunyavirus (Figura 15). Os locais de asparagina preditos para N-glicosilação nas GPCs dos orthobunyavirus sequenciados, variaram em número de sítios ou posições, enquanto que os segmentos S codificam uma nucleoproteína de 235 a 245 aminoácidos e alguns deles possuem uma ORF de mesma orientação, mas diferente frame, que codifica uma proteína não estrutural no segmento S (NSs). Interessantemente, identificamos uma potencial nova estratégia de codificação da proteína NSs nos vírus Enseada e nos membros dos grupos Patois e C, que apresentam uma potencial ORF codificadora para a proteína NSs antes da proteína N (Figura 15). 52

(a) Apeu strain BeAn 848 (e) Enseada strain 76V-25880 Large (6,913 nucleotides) Large (6,919 nucleotides)

261.22 kDa 262.67 kDa RdRp RdRp 1 21-123 951 1230 2248 1 79-118 951 1230 2248 Medium (4,521 nucleotides) Small (1,055 nucleotides) Medium (4,693 nucleotides) Small (1,114 nucleotides)

34.25 kDa 26.27 kDa 100.57 kDa 27 kDa 33.72 kDa 20.71 kDa 106.75 kDa 26.82 kDa Gn Nsm Gc N Gn Nsm Gc N 1 235 1-22 205 486 1068- 1384 1430 1-15 305 490 1062- 1389 1437 1 239 1091 11.9 kDa 185 668 918 59 185/245 675 856 1080 13.79 kDa NSs NSs 105 119 (b) Itaqui strain BeAn 12797 (f) Patois strain 63A49 Large (6,863 nucleotides) Large (6,960 nucleotides)

255.64 kDa 262.64 kDa RdRp RdRp 1 21-123 951 1230 2197 1 21-123 957 1231 2247 Medium (4,363 nucleotides) Small (1,085 nucleotides) Medium (4,637 nucleotides) Small (1,049 nucleotides)

34.10 kDa 24.99 kDa 102.80 kDa 26.79 kDa 32.41 kDa 20.68 kDa 106.85 kDa 26.84 kDa Gn Nsm Gc N Gn Nsm Gc N 1 235 1-22 204 486 1068- 1381 1428 1-22 208 489 1062- 1387 1437 1 235 1091 11.8 kDa 58 333 668 188 675 1085 14.78 kDa NSs NSs 105 119 (c) Capim strain BeAn 8582 (g) Tacaiuma strain BeAn 73 Large (6,933 nucleotides) Large (6,744 nucleotides)

262.31 kDa 259.73 kDa RdRp RdRp 1 79-118 951 1231 2252 1 18-119 946 1209 2240 Medium (4,789 nucleotides) Small (1,013 nucleotides) Medium (4,365 nucleotides) Small (975 nucleotides)

33.57 kDa 21.02 kDa 106.3 kDa 26.61 kDa 32.67 kDa 28.08 kDa 93.77 kDa 27.59 kDa Gn Nsm Gc N Gn Nsm Gc N 1 235 1-13 303 484 1054- 1381 1430 1-22 210 472 1050- 1480 1425 1 245 1073 183/243 668 804 687 999 1073

(d) Nepuyo strain BeAn 10709 (h) Gamboa strain MARU 10962 Large (6,820 nucleotides) Large (6,933 nucleotides)

261.87 kDa 264.38 kDa RdRp RdRp 1 21-123 951 1230 2249 1 77-115 957 1252 2273 Medium (4,403 nucleotides) Small (1,000 nucleotides) Medium (4,919 nucleotides) Small (1,154 nucleotides)

34.33 kDa 25.62 kDa 100.95 kDa 26.72 kDa 32.78 kDa 36.38 kDa 109.24 kDa 27.09 kDa Gn Nsm Gc N Gn Nsm Gc N 1 235 1-22 206 488 1068- 1386 1433 1-14 303 621 1213- 1546 1593 1 238 1091 12.1 kDa 673 59/96 244/347 442 636 805/845/850 1232 14.47 kDa NSs NSs 105 130 Figura 15. Genomas representativos dos 35 orthobunyavírus sequenciados.

4.1.1.2. Relação filogenética dos orthobunyavírus sequenciados no gênero Orthobunyavirus As árvores de ML construídas com sequências completas em nucleotídeos e aminoácidos produziram o mesmo padrão de grupos, mas em diferentes topologias, indicando que os sítios de saturação não afetam adversamente as inferências filogenéticas. As ORFs dos 139 orthobunyavírus com sequências completas, permitem agrupá-los em 16 clados monofiléticos com alto suporte estatístico (Figura 16). Entre estes, 11 clados correspondem aos grupos previamente estabelecidos no gênero Orthobunyavirus, que incluem Bunyamwera, , Guaroa, California Encephalitis, Bwamba, Nyando, Guama, Group C, Mapputta, Tete e Simbu. Os orthobunyavírus sequenciados neste estudo foram incluídos em cinco novos grupos, Gamboa, Patois, Capim, Enseada e Tacaíuma (Anophles A) e novos vírus do Grupo C.

53

Z68496 Inkoo KM280926 Murutucu BeAn974 KF254773 Oriboca BeAn17 HM007350 Jamestown Canyon Murutucu BeAn974 Oriboca BeAn17 KX817320 Jerry Slough KM280927 Restan KM280931 Murutucu BeAn974 KX817338 South River KF254771 Marituba BeAn15 Murutucu BeAn974 KT630290 Keystone 97 Marituba BeAn15 100 KM280932 Restan KX817329 Melao KF254782 Marituba IQE7620 KF254770 Marituba BeAn15 KX817335 Serra do Navio KM280928 Nepuyo Marituba BeAn15 EU294510 Snowshoe hare Nepuyo BeAn10709 100 Apeu BeAn848 KF719224 Chatanga KM280925 Gumbo Limbo JN157805 Marituba IQE7620 AF528167 La Crosse KF254788 Caraparu IQD5973 KM280933 Nepuyo TRVL 18462 99 KX817332 San Angelo 100 KF254794 Caraparu FMD0783 100 Nepuyo BeAn10709 KX817326 Lumbo KF254785 Caraparu FVB0426 KM280930 Gumbo Limbo 100 HM036211 Tahyna Caraparu BeAn3994 KF254790 Orthobunyavirus FSL2923 KR149247 Trivittatus encephalits California KF254777 Caraparu BeAn3994 KM092512 Itaya IQT9646 Group C Group 100 99 100 KJ867179 Pongola Bwamba Apeu BeAn848 KF254787 Caraparu IQD597 C Group KJ867182 Bwamba 100 100 KM280924 Bruconha 77V74814 KF254793 Caraparu FMD0783 99 NC_034632 Wolkberg KF254791 Orthobunyavirus FSL2923 KF254776 Caraparu BeAn3994 KJ867203 Kaeng Khoi KM092513 Itaya IQT9646 Caraparu BeAn3994 KJ867188 Nyando Madrid BT4075 Itaqui BeAn12797

KJ867200 Mojui dos Campos Nyando KF254780 Madrid BT4075 KF254784 Caraparu FVB0426 0.3 KC436108 Cache Valley 0.3 KF254774 Oriboca BeAn17 0.2 100 KF254779 Madrid BT4075 KX100118 Tlacotalpan 100 Oriboca BeAn17 98 Madrid BT4075 KX100121 Playas Itaqui BeAn12797 KM280929 Bruconha 77V74814 KX100103 Maguari NC_022038 Brazoran KP792666 Guama 98 FJ943507 Tensaw Zegla BT5012 KP792657 Bimiti JX846595 Batai Patois-like MP1078 100 KP792660 Catu KJ542627 Calovo 100 Shark River 64U80 KY013484 Ananindeua

KU159764 Anadyr 100 Patois 63A49 KP835520 Mahogany hammock Guama

NC_001927 Bunyamwera Abras 75V1183 Patois 100 100 KP792663 Guajara

Bunyamwera 99 99 KC608154 Ngari Babahoyo 75V2858 KU178980 Capim Capim KF234073 Ilesha KX161719 Bellavista KY013487 Mirim KJ710424 Abbey lake KY013488 Mirim Zegla BT5012 KR260740 Kairi 96 100 KP792665 Guama Patois 63A49 JN572076 Taiassui KY013485 Ananindeua Guama 100 Shark River 64U80 100 JN572079 Tucunduba KP835519 Mahogany hammock 99 Patois-like MP1078

100 Patois NC_034211 Tucunduba KU178981 Capim Capim Abras 75V1183 JN801033 Wyeomyia KP792662 Guajara 100 Babahoyo 75V2858 100 JN572070 Macaua 100 100 KP792656 Bimiti Guama KX161718 Bellavista JN572064 Anhembi KP792659 Catu KU178983 Enseada Enseada JN572067 Iaco KU178984 Enseada NC_022039 Brazoran

98 Wyeomyia Enseada JN572073 Sororoca Gamboa AN439546 JQ675598 Cat Que JN968592 Cachoeira Porteira Gamboa BeAR502380 JX983194 Oya KM245519 Guaroa Gamboa BeAR448848 KF697139 Ingwavuma JQ675600 Cat Que Gamboa TR61469 KF697153 Mermet JX983192 Oya Gamboa BeAR503385 KF697150 Manzanilla 90 KF697141 Ingwavuma 100 KM272181 Gamboa MARU10962 KF697160 Buttonwillow KF697152 Mermet KT950270 Gamboa GAM131 KF697138 Facey's Paddock KF697148 Manzanilla 100 Pueblo Viejo 100 KP691624 Perdoes KF697162 Buttonwillow Alajuela GML438524 100 KF697142 Iquitos KF697136 Facey's Paddock 100 Alajuela GML382716 KP052850 Oropouche 97 KP691626 Perdoes KM272187 Alajuela KF697147 Madre de Dios KF697144 Iquitos 100 KT950268 Alajuela 122 Gamboa JQ675603 Jatobal KP052852 Oropouche KT950269 Soberania GAM130 KF697157 Utive KF697146 Madre de Dios 100 KT950267 Soberania GAM118 KF697154 Utinga JQ675601 Jatobal 100 KM272175 Soberania GML435718 HM627178 Leanyer Simbu KF697156 Utinga KM272178 Soberania GML903023 NC_018463 Shamonda KF697158 Utive KM272184 Calchaqui 100 KC355457 Schmallenberg NC_018464 Shamonda KP792668 Koongol HE795090 Douglas

100 Simbu KC355459 Schmallenberg U88059 Inkoo NC_018461 Sathuperi NC_018462 Sathuperi HM007351 Jamestown Canyon 88 HE795096 Sabo HE795092 Douglas KX817319 Jerry Slough AB968525 Akabane AB968527 Akabane KX817337 South River 80 100 NC_018476 Simbu 100 AF362396 Sabo KX817334 Serra do Navio HE795099 Sango AF362401 Peaton KX817328 Melao HE795093 Peaton 98 HE795101 Sango 100 KT630289 Keystone NC_018465 Aino KC510272 Shuni EU262553 Snowshoe hare KF153118 Shuni NC_018460 Aino KF719225 Chatanga 100 KM972719 Tete NC_018477 Simbu 100 AF528166 La Crosse KP792654 Bahig 92 HM627177 Leanyer KX817331 San Angelo HM639780 Oyo Tete NC_026282 Maprik HM036212 Tahyna NC_026281 Maprik 80 KR013234 Gan Gan 100 KX817325 Lumbo KR013232 Gan Gan

100 KJ481921 Mapputta KR149248 Trivittatus encephalits California 100 KJ481923 Mapputta NC_022597 Murrumbidgee 100 KJ867180 Pongola NC_022595 Murrumbidgee

KJ481927 Bufalo Creek Mapputta Bwamba KJ867183 Bwamba KJ481929 Bufalo Creek Mapputta KT950259 Soberania GAM118 KC436107 Cache Valley KT950263 Soberania GAM118 KT950261 Soberania GAM130 KX100119 Tlacotalpan KT950265 Soberania GAM130 KM272176 Soberania GML435718 KX100122 Playas Alajuela GML438524 KM272182 Gamboa MARU10962 KX100104 Maguari Alajuela GML382716 Alajuela GML438524 FJ943506 Tensaw KT950266 Gamboa GAM131 KT950262 Gamboa GAM131 JX846596 Batai KM272174 Soberania GML435718 KM272179 Soberania GML903023 KC608153 Ngari KT950264 Alajuela GAM122 KT950260 Alajuela GAM122 KJ542628 Calovo KM272180 Gamboa MARU10962 Alajuela GML382716 KU159765 Anadyr KM272186 Alajuela KM272188 Alajuela KF234074 Ilesha KM272177 Soberania GML903023 Gamboa BeAR502380 100 NC_001926 Bunyamwera Bunyamwera Gamboa AN439546 Gamboa BeAN448848

KJ710423 Abbey lake Gamboa Gamboa Gamboa BeAR448848 Gamboa AN439546 KR260739 Kairi Gamboa BeAR502380 Gamboa BeAR503385 JN572078 Tucunduba Gamboa BeAR503385 100 Gamboa TR61469 NC_034213 Tucunduba 100 Gamboa TR61469 100 Pueblo Viejo JN801034 Wyeomyia 100 Pueblo Viejo KM272185 Calchaqui JN572069 Macaua KM272183 Calchaqui 94 KP792667 Koongol 100 100 JN572075 Taiassu KP792669 Koongol 99 100 Tacaiuma BeAn73 Tacaiuma JN572072 Sororoca EU789573 Inkoo Tacaiuma BeAr617554 JN968591 Cachoeira Porteira HM007352 Jamestown Canyon

100 Wyeomyia 81 KP792670 Lukuni Anopheles A JN572066 Iaco KX817318 Jerry Slough KM972724 Tataguine JN572063 Anhembi KX817336 South River 100 KM972721 Tete KM245520 Guaroa 98 KX817333 Serra do Navio KP792652 Bahig KJ867201 Mojui dos Campos KT630288 Keystone HM639778 Oyo Tete 100 KJ867189 Nyando KX817327 Melao KF254775 Oriboca BeAn17 NC_034631 Wolkberg AF528165 La Crosse Oriboca BeAn17 KJ867204 Kaeng Khoi Nyando EU203678 Snowshoe hare KM280934 Murutucu BeAn974 100 Tacaiuma BeAn73 100 Tacaiuma 100 KF719226 Chatanga Murutucu BeAn974 100 Tacaiuma BeAr617554 KX817330 San Angelo KM280935 Restan KP792671 Lukuni Anopheles A 98 KX817324 Lumbo KF254772 Marituba BeAn15 KM972723 Tataguine 100 HM036213 Tahyna Marituba BeAn15 KJ481925 Maprik KR149249 Trivittatus encephalits California 100 Apeu BeAn848 100 KR013233 Gan Gan 100 KJ867181 Pongola KF254783 Marituba IQE7620 KJ481922 Mapputta KJ867184 Bwamba Bwamba KM280936 Nepuyo TRVL18462 NC_022596 Murrumbidgee NC_034633 Wolkberg Nepuyo BeAn10709 KJ481928 Bufalo Creek Mapputta KJ867205 Kaeng Khoi KM280938 Gumbo Limbo KM972720 Tete 100 KJ867202 Mojui dos Campos KF254792 Orthobunyavirus FSL2923 C Group 100 KP792653 Bahig

KJ867190 Nyando Nyando

100 KM092514 Itaya IQT9646 HM639779 Oyo Tete KC436106 Cache Valley KF254789 Caraparu IQD5973 JQ675599 Cat Que KX100120 Tlacotalpan KF254786 Caraparu FVB0426 JX983193 Oya KX100123 Playas KF254795 Caraparu FMD0783 KF697151 Mermet KX100105 Maguari KF254778 Caraparu BeAn3994 KF697149 Manzanilla FJ943509 Tensaw Caraparu BeAn3994 KF697140 Ingwavuma JX846597 Batai 100 Itaqui BeAn12797 KF697161 Buttonwillow 88 KJ542629 Calovo KF254781 Madrid BT4075 JQ675602 Jatobal KU159766 Anadyr Madrid BT4075 KP691625 Perdoes NC_001925 Bunyamwera KM280937 Bruconha 77V74814 100 KF697159 Utive 99 KC608152 Ngari 89 KP792664 Guama KF697155 Utinga KF234075 Ilesha Bunyamwera KP792658 Catu KF697145 Madre de Dios KJ710425 Abbey lake 100 KP792655 Bimiti 81 KF697143 Iquitos KR260738 Kairi KY013486 Ananindeua KP052851 Oropouche JN572074 Taiassui 100 KP835518 Mahogany hammock Guama 100 KF697137 Facey's Paddock Simbu JN572077 Tucunduba 100 100 KU178982 Capim Capim HM627176 Leanyer NC_034212 Tucunduba KP792661 Guajara 100 NC_018467 Shamonda JN801035 Wyeomyia KY013489 Mirim HE795100 Sango 100 100 JN572068 Macaua 80 Zegla BT5012 HE795094 Peaton JN968590 Cachoeira Porteira 84 Patois 63A49 HE795097 Sabo JN572071 Sororoca Shark River 64U80 100 AB968526 Akabane 98 JN572065 Iaco Wyeomyia Patois-like MP1078 NC_018478 Simbu JN572062 Anhembi 100 Abras 75V1183 Patois HE795091 Douglas KM245521 Guaroa Babahoyo 75V2858 88 NC_018466 Sathuperi 100 Tacaiuma BeAn73 Tacaiuma KX161720 Bellavista KC355458 Schmallenberg 100 Tacaiuma BeAr617554 KU178985 Enseada Enseada NC_018459 Aino 100 KP792672 Lukuni Anopheles A NC_022037 Brazoran KF153117 Shuni KM972722 Tataguine Figura 16. Árvore de máxima verossimilhança do gênero Orthobunyavirus baseadas no segmento S (esquerda), segmento M (meio) e segmento L (direita). A barra de escala indica distância evolutiva em números de substituições nucleotidícas por sítio, e os valores de bootstrap são indicados nos principais ramos. As árvores foram inferidas com o modelo de substituições nucleotidícas GTR+I+G4 para todos os segmentos. Os vírus e grupos caracterizados neste estudo são destacados na cor vermelha.

As análises de distâncias evolutivas das proteínas N, GPC e RdRP neste gênero viral revelam que os orthobunyavírus sequenciados possuem padrão de distância genética aminoacídica similar ao dos previamente descritos, sendo a proteína RdRP, a mais conservada no gênero Orthobunyavirus (Figura 17). 54

Nucleoprotein 75% 70% 65% 60% 55% 50% 45% 40% 35% 30% 25% 20%

Glycoprotein precursor 70% 65% 60% 55% 50% 45% 40% 35% 30% 25% 20% RNA dependent RNA polymerase 60% 55% 50% 45% 40% 35% 30% 25% 20% 15% Tete Patois Capim Guama Guaroa Group C Group Enseada Koongol Gamboa Nyamdo Bwamba Brazoran Tacaiuma Mapputta Wyeomyia Bunyamwera Simbu -Clade A Sumbu-Clade B Simbu -Leanyer

California encephalits California Figura 17. Distância evolutiva em aminoacídos entre os grupos do gênero Orthobunyavirus. Os vírus e grupos caracterizados neste estudo são destacados na cor vermelha.

4.1.1.3. Análise de potenciais reassortments no gênero Orthobunyavirus. Combinando as inconsistências entre os ramos observados nas árvores filogenéticas com as análises obtidas a partir do programa RDP4, identificamos no gênero Orthobunyavirus dois novos vírus são reassortants naturais, um no grupo Gamboa, e outro no grupo Patois. Também foram redefinidos três eventos de reassortment no Grupo C (Figura 18). 55

(a) (b)

MTBV UNKN CARV UNKN MTBV UNKN CARV UNKN MTBV UNKN CARV UNKN

MTBV strain BeAn 15 Unknown CARV strain BeAn 3994 Unknown

MTBV CARV UNKN UNKN MTBV CARV

Apeu strain BeAn 848 Itaqui strain BeAn 12797 (c) (d)

MURV UNKN PATV UNKN MURV UNKN PATV UNKN MURV UNKN PATV UNKN

MURV strain BeAn 15 Unknown PATV strain 63A19 Unknown

MURV ZEGV UNKN UNKN MURV ZEGV

Oriboca strain BeAn 848 ZEGV strain BT5012 (e) (f) Methods APEUV ITQV ORIV ZEGV SOBV

MARU 10962 UNKN RDP --- 3.366x10-140 1.710x10-45 4.341x10-56 6.81x10-195 MARU 10962 UNKN MARU 10962 UNKN GENECONV --- 1.590x10-96 8.365x10-27 1.519x10-42 1.45x10-227

-67 Gamboa strain MARU 10962 Unknown BootScan ------1.205x10 4.87x10-224

MaxChi 4.626x10-17 1.222x10-09 2.849x10-39 8.541x10-45 1.28x10-42

MARU 10962 Chimaera 1.978x10-24 6.817x10-56 1.870x10-46 2.363x10-33 2.15x10-47 UNKN MARU 10962 SiScan 2.644x10-30 9.355x10-101 5.360x10-44 1.828x10-70 3.04x10-100

3Seq 3.941x10-32 8.585x10-196 2.610x10-130 3.074x10-43 1.57x10-81 Soberania strain 118 Figura 18. Eventos de reassortments naturais no gênero Orthobunyavirus. Hipóteses dos eventos de reassortments (a-e), e parâmetros estatísticos destes eventos determinados pelo programa RDP4 (f).

4.1.2. Gênero Phlebovirus (família Phenuiviridae) 4.1.2.1. Caracterização genômica dos phlebovírus Os oito phlebovírus sequenciados neste trabalho possuem genomas de RNA trisegmentado com polaridade negativa. Os segmentos L codificam uma proteína RdRP de 2.020 a 2.096 aminoácidos, com domínios altamente conservados: Pre-Motif A, e Motifs A a E, em posições aminoacídicas entre 915 a 1.189 (Figura 19). Os segmentos M codificam uma GPC de 1.302 a 1.429 aminoácidos, que contém um peptídeo sinal na região N terminal. Também, as GPCs são clivadas em três proteínas: Gn e Gc (estruturais), e a NSm (não estrutural). Todos os phlebovírus sequenciados possuem uma NSm com sequência upstream da proteína Gn, sugerindo uma organização típica para alguns phlebovírus (família Phenuiviridae). A topologia das GPCs incluiu três TMDs, a primeira na região C-terminal da proteína Gn e as outras duas, nas regiões N e C-terminal da proteína Gc (Figura 19). Os 56 locais de asparagina preditos para N glicosilação da GPC variaram em número de sítios ou posições (Figura 19). Interessantemente, os sítios de N-glicosilação das GPCs localizaram-se na porção da poliproteína voltada para o lúmen do retículo endoplasmático e do aparelho de Golgi, indicando que poderiam ser glicosilados durante a replicação viral. Por fim, todos os segmentos S dos phlebovírus são ambisense, ou seja, possuem duas ORFs que codificam em sentidos opostos, sendo a proteína N codificada no sentido negativo, e a proteína NSs no sentido positivo. O tamanho destas proteínas foi de 244 a 250 aminoácidos para a proteína N, e 249 a 289 aminoácidos para a NSs (Figura 19).

A Bujaru virus E Uriurana virus L segment (6510 nucleotides) L segment (6405 nucleotides) 3` 5` 3` 5` 238.36 KDa 238.55 KDa RdRP RdRP 1 921 1188 2090 1 920 1187 2093

M segment (4786 nucleotides) S segment (1980 nucleotides) M segment (4180 nucleotides) S segment (1819 nucleotides) 3` 5` 3` 5` 3` 5` 3` 5` Polyprotein 157.94 KDa Polyprotein 144.33 KDa 27.08 KDa 30.9 KDa 26.74 KDa 30.79 KDa 103.64 KDa 54.33 KDa 89.22 KDa 55.13 KDa N NSs N NSs NSm-Gn Gc 1 246 1 268 NSm-Gn Gc 1 244 1 265 1-24 1429 1-22 1302 817 904 1397 692/712 1264 430 602 1025 74 221 898/933 B Munguba virus F Urucuri virus L segment (6433 nucleotides) L segment (6504 nucleotides) 3` 5` 3` 5` 238.2 KDa 241.65 KDa RdRP RdRP 1 921 1188 2090 1 921 1188 2120

M segment (4624 nucleotides) S segment (1790 nucleotides) M segment (4528 nucleotides) S segment (1864 nucleotides) 3` 5` 3` 5` 3` 5` 3` 5` Polyprotein 156.1 KDa Polyprotein 150.52 KDa 26.92 KDa 31.06 KDa 27.76 KDa 31.16 KDa 91.60 KDa 64.51 KDa 94.64 KDa 55.90 KDa N NSs N NSs NSm-Gn Gc 1 246 1 269 NSm-Gn Gc 1 247 1 265 1-22 1418 1-22 1352 805/893 1383 726 827 1318 418 34/57 263 985/1075/1191 C Anhanga virus G Ambe virus L segment (6402 nucleotides) L segment (6410 nucleotides) 3` 5` 3` 5` 238.91 KDa 237.41 KDa RdRP RdRP 1 922 1189 2096 1 917 1184 2087

M segment (4538 nucleotides) S segment (1628 nucleotides) M segment (4366 nucleotides) S segment (1863 nucleotides) 3` 5` 3` 5` 3` 5` 3` 5` Polyprotein 151.82 KDa Polyprotein 154.2 KDa 27.53 KDa 28.76 KDa 27.13 KDa 33.9 KDa 96.79 KDa 55.06 KDa 97.87 KDa 56.35 KDa N NSs N NSs NSm-Gn Gc 1 245 1 249 NSm-Gn Gc 1 245 1 289 1-25 1376 1-22 747 833 13221359 753 847 1337 954/991 1296 63 290 400/479 981/1005 D Joa virus H Tapara virus L segment (6407 nucleotides) L segment (6394 nucleotides) 3` 5` 3` 5` 236.02 KDa 238.88 KDa RdRP RdRP 1 915 1182 2083 1 919 1186 2089

M segment (4505 nucleotides) S segment (1764 nucleotides) M segment (4233 nucleotides) S segment (1823 nucleotides) 3` 5` 3` 5` 3` 5` 3` 5` Polyprotein 148.86 KDa Polyprotein 151.05 KDa 26.88 KDa 30.64 KDa 28.12 KDa 30.89 KDa 87.47 KDa 61.40 KDa 33.46 KDa 62.03 KDa 55.59 KDa N NSs N NSs NSm-Gn Gc 1 245 1 267 NSm-Gn Gc 1 250 1 269 1-22 740/760 1318 1353 1-22 728 818 1306 1341 90 961/985 1232 549/616 1181

Signal peptide Transmembrane region Motifs (Pre-A, A-E) Predicted N-glycosylation site NSm-Gn Gc Figura 19. Genomas dos phlebovírus sequenciados.

4.1.2.2. Relação filogenética dos phlebovírus sequenciados no gênero Phlebovirus As árvores de ML com sequências completas dos genes em nucleotídeos e aminoácidos produziram o mesmo padrão de grupo em diferentes topologias. As ORFs das sequências completas dos quatro genes de 85 phlebovírus, mostram-nos agrupados em 18 grupos monofiléticos com alto suporte estatístico. Entre estes, onze clados bem suportados correspondem às espécies virais já estabelecidas pelo ICTV, que incluem Bujaru, Chagres, Candiru, Frijoles, Icoaraci, Punta Toro, Rift Valley, Salehabad, Sandfly fever Naples, SFTS e 57

Uukuniemi. Em adição, também encontraram-se outros grupos ainda não reconhecidos pelo ICTV, como o Bhanja, Sandfly Sicilian Turkey e Karimabad (149). As análises filogenéticas revelaram que os phlebovírus sequenciados formam três grupos. Os vírus Bujaru e Munguba compõem o grupo Bujaru. Os vírus Uriurana e Tapará formam um clado único e bem estabelecido nos quatro genes, com alto suporte estatístico, constituindo o grupo Tapará. E o vírus Joá é membro do grupo Frijoles, porém, o protótipo deste grupo ainda não dispõe de genoma completo. Interessantemente, os vírus Anhangá e Urucuri apresentam distintas topologias nas árvores filogenéticas e não são agrupados (Figura 20).

HM466936 Jacunda HM466936 Jacunda HM119424 Morumbi HM119424 Morumbi HM119421 Mucura HM119421 Mucura NC_015375 Candiru NC_015375 Candiru HM119430 Serra Norte HM119430 Serra Norte HM119418 Itaituba HM119406 Ariquemes A HM119406 Ariquemes B HM119415 Maldonado HM119415 Maldonado HM119418 Itaituba 100 HM119436 Oriximina HM119436 Oriximina HM119403 Alenquer 100 HM119412 Echarte HM119427 Nique HM119433 Turuna HM119412 Echarte HM119403 Alenquer HM119433 Turuna HM119427 Nique 90 KP272024_Punta Toro KP272024_Punta Toro NC_027202 Punta Toro 100 NC_027202 Punta Toro KP272006 Punta Toro KP272006 Punta Toro KR912210 Punta Toro KR912210 Punta Toro KP272035 Cocle 98 KP272035 Cocle 97 94 HM566153 Phlebovirus CoAr 171616 KP272003 Buenaventura KP272003 Buenaventura HM566151 Phlebovirus CoAr 170255 HM566151 Phlebovirus CoAr 170255 KP272042 Campana KP272042 Campana HM566153 Phlebovirus CoAr 171616 97 HM566148 Chagres HM566139 Aguacate 100 HM566190 Uriurana 100 100 HM566142 Armero Uriuruna BeAR479776 98 HM566161 Ixcanal Tapara_BeAR413570 HM566156 Durania Munguba BeAR389707 88 Urucuri BeAN100049 HM566166 Munguba 100 Joa_BeAR371637 91 Bujaru BeAn47693 HM627184 Salobo 100 NC_015413 Sandfly Sicilian Turkey 100 NC_015413 Sandfly Sicilian Turkey KP966621 Toros 57 94 KP966621 Toros HM566139 Aguacate 98 KF297905 Gabek Forest 100 HM566142 Armero 86 KF297914 Karimabad 100 HM566161 Ixcanal Ambe BeAR407981 94 HM566156 Durania DQ380157 Rift Valley DQ380167 Rift Valley 100 DQ380146 Rift Valley 100 DQ380146 Rift Valley DQ380167 Rift Valley DQ380157 Rift Valley 85 100 HM566148 Chagres Ambe BeAR407981 99 HM566190 Uriurana 99 Joa_BeAR371637 Uriuruna BeAR479776 HM627184 Salobo 58 Tapara_BeAR413570 99 KF297905 Gabek Forest Munguba BeAR389707 KF297914 Karimabad 100 HM566166 Munguba 56 Anhanga BeAR46852 92 Bujaru BeAn47693 Urucuri BeAN100049 Anhanga BeAR46852 NC_006318 Toscana JX472402 Arbia JX867536 Toscana KU297253 Medjerda 99 KP694242 Toscana KR363192 Alcube HM566170 Sandfly fever Naples JX472405 Salehabad JF939848 Tehran 100 KJ939332 Adana KP966618 Zerdali HM566175 Odrenisrou 100 KP863801 Arrabida NC_023634 Arumowot EU725773 Massilia HQ642768 FTLS FJ848987 Punique HQ141597 SFTS KF297902 Gordil NC_018137 SFTS HM566175 Odrenisrou HQ419240 Huaiyangshan 90 NC_023634 Arumowot 100 KT328591 Guertu 100 JX472402 Arbia NC_024496 Heartland KU297253 Medjerda KF186496 Malsoor 100 KR363192 Alcube 80 NC_027142 Bhanja JX472405 Salehabad JX961627 Forecariah KJ939332 Adana NC_022632 Razdan KM114251 Uukuniemi 100 JQ956381 Palma KF892042 Zaliv Terpeni KM114254 Kismayo KM114248 Uukuniemi NC_021244 Lone Star JF838326 Chize KM114251 Uukuniemi 100 HM566160 EgAN 182561 KF892042 Zaliv Terpeni JF838329 Grand Arbaud KM114248 Uukuniemi 97 JF838332 Murre JF838326 Chize HM566180 Precarious point 98 HM566160 EgAN 182561 100 KM114256 Silverwater JF838329 Grand Arbaud KM817735 Huangpi Tick Virus 2 98 HM566180 Precarious point NC_018137 SFTS JF838332 Murre HQ419240 Huaiyangshan 92 100 KM114256 Silverwater HQ141597 SFTS KM817735 Huangpi Tick Virus 2 HQ642768 FTLS NC_006318 Toscana 100 KT328591 Guertu JX867536 Toscana NC_024496 Heartland KP694242 Toscana KF186496 Malsoor JF939848 Tehran 100 JQ956381 Palma KP966618 Zerdali NC_022632 Razdan HM566170 Sandfly fever Naples NC_027142 Bhanja KP863801 Arrabida 100 JX961627 Forecariah 100 EU725773 Massilia KM114254 Kismayo FJ848987 Punique NC_021244 Lone Star KF297902 Gordil

0.2 0.3 HM119417 Itaituba HM466934 Jacunda HM119414 Maldonado HM119422 Morumbi HM119429 Serra Norte HM119419 Mucura HM466935 Jacunda NC_015374 Candiru HM119435 Oriximina HM119428 Serra Norte HM119420 Mucura HM119416 Itaituba C HM119405 Ariquemes D HM119404 Ariquemes HM119423 Morumbi HM119413 Maldonado 50 HM119432 Turuna HM119434 Oriximina HM119402 Alenquer Candiru 100 HM119410 Echarte HM119426 Nique HM119431 Turuna NC_015373 Candiru Punta Toro HM119401 Alenquer 100 HM119411 Echarte HM119425 Nique KP272005 Punta Toro Chagres 100 KP272022 Punta Toro KP272023 Punta Toro NC_027203 Punta Toro NC_027201 Punta Toro KP272004 Punta Toro KR912209 Punta Toro Tapara KR912208 Punta Toro 99 KP272034 Cocle 100 KP272036 Cocle KP272002 Buenaventura Bujaru KP272001 Buenaventura HM566149 Phlebovirus CoAr 170255 HM566150 Phlebovirus CoAr 170255 KP272041 Campana Sandfly Sicilian Turkey KP272040 Campana HM566154 Phlebovirus CoAr 171616 HM566152 Phlebovirus CoAr 171616 98 100 HM566146 Chagres Aguacate 100 HM566147 Chagres HM566188 Uriurana 100 HM566189 Uriurana Uriuruna BeAR479776 Rift Valley Uriuruna BeAR479776 Tapara_BeAR413570 Tapara_BeAR413570 Munguba BeAR389707 Ambe 99 Munguba BeAR389707 93 HM566165 Munguba HM566164 Munguba Bujaru BeAn47693 Icoaraci Bujaru BeAn47693 Anhanga BeAR46852 100 Anhanga BeAR46852 DQ380204 Rift Valley Frijoles DQ375430 Rift Valley 74 100 DQ380217 Rift Valley 100 DQ375419 Rift Valley DQ380193 Rift Valley Karimabad DQ375409 Rift Valley 100 KF297904 Gabek Forest 100 Joa_BeAR371637 KF297913 Karimabad Anhanga HM627185 Salobo 100 NC_015411 Sandfly Sicilian Turkey Ambe BeAR407981 KP966620 Toros Urucuri HM566138 Aguacate 100 Joa_BeAR371637 HM566140 Armero HM627183 Salobo 100 HM566162 Ixcanal HM566141 Armero Sandly Fever Naples 100 98 100 HM566155 Durania HM566163 Ixcanal Salehabad 100 KF297903 Gabek Forest 93 100 HM566137 Aguacate KF297912 Karimabad HM566157 Durania Uukuniemi JX472400 Arbia Urucuri BeAN100049 KU255114 Medjerda Valley 90 Ambe BeAR407981 KR363190 Alcube KR363191 Alcube Silverwater 94 JX472403 Salehabad JX472401 Arbia 100 KJ939330 Adana KJ939331 Adana SFTS NC_023635 Arumowot 99 KU255115 Medjerda HM566174 Odrenisrou JX472404 Salehabad Bhanja 100 NC_015412 Sandfly Sicilian Turkey 100 NC_023633 Arumowot KP966619 Toros HM566173 Odrenisrou Urucuri BeAN100049 NC_006320 Toscana 93 NC_006319 Toscana KP694241 Toscana JX867534 Toscana JX867535 Toscana KP694240 Toscana JF939847 Tehran JF939846 Tehran KP966617 Zerdali KP966616 Zerdali HM566171 Sandfly fever Naples HM566172 Sandfly fever Naples 100 EU725772 Massilia KP863799 Arrabida 100 JF920134 Punique 100 EU725771 Massilia KP863800 Arrabida 100 JF920133 Punique KF297901 Gordil KF297900 Gordil KM114250 Uukuniemi KM114249 Uukuniemi KF892041 Zaliv Terpenia KF892040 Zaliv Terpenia KM114247 Uukuniemi KM114246 Uukuniemi JF838325 Chize JF838324 Chize HM566158 EgAN 1825-61 100 HM566159 EgAN 1825-61 100 JF838331 Murre JF838327 Grand Arbaud 100 HM566179 Precarious 100 100 HM566181 Precarious point JF838328 Grand Arbaud JF838330 Murre 100 KM114255 Silverwater 100 KM114257 Silverwater KM817707 Huangpi Tick Virus 2 KM817668 Huangpi Tick Virus 2 HQ642767 FTLS HQ141595 SFTS HQ141596 SFTS JF906056 Huaiyangshan JF906057 Huaiyangshan HQ642766 FTLS NC_018138 SFTS NC_018136 SFTS 100 KT328592 Guertu 100 KT328593 Guertu NC_02449 Heartland NC_024495 Heartland 100 KF186495 Malsoor KF186494 Malsoor JQ956380 Palma JQ956379 Palma NC_022631 Razdan NC_022630 Razdan 100 NC_027141 Bhanja NC_027140 Bhanja JX961626 Forecariah 100 JX961625 Forecariah KM114253 Kismayo KM114252 Kismayo NC_021243 Lone Star NC_021242 Lone Star

0.5 0.5 58

Figura 20. Árvore de máxima verossimilhança do gênero Phlebovirus baseadas nas sequências aminoacídicas da protéina N (A), protéina NSs (B) protéina GPC (C) e protéina RdRP (D). A barra de escala indica distância evolutiva em números de substituições aminoacídicas por sítio, e os valores de bootstrap são indicados nos principais ramos. As árvores foram inferidas com o modelo de substituições aminoacídicas de LG para as protéinas GPC e RdRp, e o modelo de JTT para as protéinas N e NSs. Os vírus e grupos caracterizados neste estudo são destacados na cor vermelha.

Análises de distâncias evolutivas das proteínas N, NSs, GPC e RdRP do gênero Phlebovirus revelaram que os vírus transmitidos por carrapatos possuem maior divergência aminoacídica que os transmitidos por moscas e mosquitos, exceto no caso dos vírus do grupo e Sandfly Sicilian Turkey que exibem distância de proteínas NSs semelhante a dos phlebovírus transmitidos por carrapatos (Figura 21). No entanto, os novos phlebovírus sequenciados neste trabalho apresentam divergência aminoacídica semelhante aos phlebovírus transmitidos por moscas e mosquitos (Figura 21). Interessantemente, os resultados observados nas árvores de ML são similares aos observados na análise da distância evolutiva, especialmente quando os phlebovírus são comparados com base em seus vetores (Figura 20).

A Nucleoprotein B Non-Strutural Protein 80% 100%

90% 70%

80%

60% 70%

50% 60%

50% 40%

40%

30% 30%

20% 20%

Ambe SFTS Bujaru Bhanja Chagres Candiru Frijoles Urucuri Ambe SFTS Aguacate Bujaru Bhanja Punta Toro Rift Valley Karimabad Salehabad Silverwater Uukuniemi Chagres Candiru Frijoles Urucuri Aguacate Punta Toro Rift Valley Karimabad Salehabad Silverwater Uukuniemi

Sandfly Fever Naples Sandfly Sicilian Turkey Sandfly Fever Naples Sandfly Sicilian Turkey

C Glycoprotein D RNA dependent RNA polymerase 90% 75%

70%

80% 65%

70% 60%

55%

60% 50%

50% 45%

40%

40% 35%

30% 30%

SFTS Ambe SFTS Bujaru Ambe Bujaru Frijoles Urucuri Bhanja Candiru Frijoles Urucuri Bhanja Chagres Candiru Chagres Aguacate Aguacate Rift Valley Salehabad Punta Toro Rift Valley Karimabad Salehabad Silverwater Uukuniemi Punta Toro Karimabad Silverwater Uukuniemi

Sandfly Fever Naples Sandfly Fever Naples Sandfly Sicilian Turkey Sandfly Sicilian Turkey Figura 21. Distância evolutiva em aminoácidos entre os grupos do gênero Phlebovirus.

4.1.2.3. Análises de potenciais reassortments no gênero Phlebovirus. Combinando as inconsistências entre os ramos observados nas árvores filogenéticas com as análises com RDP4, não foi observado reassortments nos phlebovírus sequenciados em nosso estudo. No entanto, o vírus Medjerda Valley foi identificado como um potencial evento uma vez que as análises sugerem que possui segmentos S e L do vírus Arbia, e o 59 segmento M de um vírus com origem evolutiva desconhecida, provavelmente única (Figura 22). (a) (b) Medjerda Methods Valley Arbia UNKN -04 Arbia UNKN RDP 2.75x10 Arbia UNKN GENECONV ---

Arbia Unknown BootScan ---

MaxChi 8.25x10-16 Arbia UNKN Chimaera 8.25x10-17 Arbia

SiScan 8.25x10-19

Medjerda Valley 3Seq 1.22x10-10

Figura 22. Evento de reassortment natural encontrado no gênero Phlebovirus. Hipóteses do evento de reassortments (a), e parâmetros estatísticos do evento determinados pelo programa RDP4 (b).

4.1.3. Orthonairovirus Estero Real (família Nairoviridae) 4.1.3.1. Caracterização genômica do orthonairovírus Estero Real O genoma do vírus Estero Real (ERV) possui RNA trisegmentado com polaridade negativa. O segmento L, com 11.816 nucleotídeos, codifica uma proteína RdRp de 3.925 aminoácidos com domínios conservados de polimerase, nomeados Pre-Motif A e Motifs A a E, na posição aminoacídica 2.265 a 2.573. Também, identificou-se na proteína RdRp um motif catalítico, conhecido como OUT-like (Ovarian Tumor family) (Figura 23). O segmento M do ERV codifica uma GPC de 1.402 aminoácidos e um peptídeo sinal na região N- terminal. Além disso, três TMDs foram identificadas na GPC, quatro locais de N-glicosilação e onze locais de O-Glicosilação. Motifs de clivagem da GPC foram identificados entre a posição aminoácidica 389 e 392 (RKLL). O segmento S codifica proteína N de 505 aminoácidos, mas nenhuma ORF que poderia codificar a proteína NSs foi identificada (Figura 23). 60

Figura 23. Organização genômica do orthonairovírus Estero Real (a). Modelo das glicoproteínas do orthonairovírus Estero Real

4.1.3.2. Relação filogenética do orthonairovírus Estero Real no gênero Orthonairovirus Árvores de ML construídas com sequências aminoacídicas de ERV e 40 genomas completos de orthonairovírus, mostraram 15 clados monofiléticos com alto suporte estatístico, mas com topologias diferentes em cada segmento. Quatorze dos clados bem suportados correspondem a espécies de orthonairovírus estabelecidas (150). Observou-se que o ERV forma clado monofilético único relacionado aos vírus da espécie Hughes em todos os segmentos, sugerindo que esses vírus tenham mesma origem evolutiva (Figura 24). Além disso, combinando as topologias filogenéticas com o RDP4, não observou reassortment no ERV.

Figura 24. Árvore de máxima verossimilhança do gênero Orthonairovirus baseadas nas sequências aminoacídicas Proteína N (A), Proteína GPC (B) e Proteína RdRP (C). A barra de escala indica distância 61 evolutiva em números de substituições aminoacídicas por sítio, e os valores de bootstrap são indicados nos principais ramos. As árvores foram inferidas com o modelo de substituições aminoacídicas de LG+I+G4 para todas as protéinas. O vírus caracterizados neste estudo é destacado na cor vermelha.

4.1.4. Vesiculovírus Piry (família Rhabdoviridae) 4.1.4.1. Caracterização genômica do Vesiculovírus Piry O vesiculovírus Piry (PIRV) possui organização típica dos vírus do gênero Vesiculovirus, apresenta regiões não codificantes terminais 3 'e 5' com respectivamente 103 e 70 nucleotídeos e cinco regiões codificadoras intercaladas por sequências reguladoras de transcrição, dispostas na seguinte ordem: nucleoproteína, fosfoproteína, glicoproteína, proteína de matriz e polimerase (Figura 25). A nucleoproteína possui 427 aminoácidos e a fosfoproteína 329 aminoácidos, incluindo mais 21 aminoácidos que todas as outras fosfoproteínas descritas no gênero Vesiculovirus. Esta porção extra encontra-se na “hinge region” da fosfoproteína, entre os domínios I e II (posição aminoacídica 188 a 208) (Figura 25). A proteína de matriz possui 229 aminoácidos e a glicoproteína é composta por 529 aminoácidos incluindo um peptídeo sinal de 18 aminoácidos na região N-terminal. Também, a glicoproteína apresenta dois resíduos de asparagina, locais de putativas N-glicosilações, na posição aminoacídica 181 e 340. A polimerase possui 2.095 aminoácidos altamente conservados no gênero, com motifs característicos da ordem : os domínios I a VI e os motifs Pré-A, A-D do Domínio III (Figura 25).

Figura 25. Organização genômica do vesiculovirus Piry.

4.1.4.2. Relação filogenética do vírus Piry no gênero Vesiculovirus A árvore filogenética baseada no genoma de 33 vesiculovírus revelou que estes são divididos em dois principais clados. Um dos clados inclui os causadores de estomatites vesiculares como Indiana, Alagoas, New Jersey, além dos vírus Cocal, Morreton, Marabá e Carajás. O outro clado é composto pelos vesiculovírus Jurona, Malpais Spring, Isfahan, Chandipura e o PIRV. Portanto, este segundo clado é constiduído de prováveis arbovírus filogeneticamente relacionados ao vesiculovírus Perinet (Figura 26). 62

Figura 26. Árvore de máxima verossimilhança baseado nas sequências completas dos genomas completos dos Vesiculovirus. A barra de escala indica distância evolutiva em números de substituições nucleotidícas por sítio, e os valores de bootstrap são indicados nos principais ramos. As árvores foram inferidas com o modelo de substituições nucleotidícas GTR. O vírus caracterizados neste estudo é destacado na cor vermelha.

4.2.PROSPEÇÃO DE NOVOS VÍRUS NO BRASIL 4.2.1. Chapparvovírus (família Parvoviridae) Uma nova espécie de chapparvovírus foi identificada em morcegos hematófagos da espécie Desmodus rotundus coletados em Araçatuba, São Paulo. Este vírus foi denominado Desmodus rotundus parvovirus, com genoma de 4.284 nucleotídeos, que codifica dois genes: uma proteína não estrutural (NS), também conhecida como replicase, com 668 aminoácidos; e o gene da proteína do capsídeo, conhecida como VP, com 484 aminoácidos. Utilizando o programa DIGS v.1.0 para triagem in silico foram encontrados 19 genomas parciais de novos chapparvovírus em 350 genomas de invertebrados e vertebrados, analizados. Dois chapparvovírus foram encontrados nos genomas de aves das espécies Mesitornis unicolor e Serinus canaria; outro no genoma do réptil Protobothrops mucrosquamatus, um no do primata Cebus imitator e o outro no de morcego da espécie Myotis davidii. Também, foram encontrados cinco novos chapparvovírus nos genomas de espécies marinhas incluindo dois em peixes, Syngnathus scovelli e Hippocampus comes e outros três em invertebrados marinhos, incluindo polvo da espécie Octopus bimaculoides, estrela-do-mar da espécie Patiria miniata, e centopeia da espécie Strigamia maritima (Tabela 63

5). Além disso, foram identificados genomas parciais de chapparvovírus em invertebrados terrestres, incluindo três espécies de aranhas, Latrodectus hesperus, Parasteatoda tepidariorum e Loxosceles reclusa; e em outros invertebrados terrestres, Catajapyx aquilonaris (inseto), Saccoglossus kowalevskii (inseto), Eisenia fetida (minhoca), Onthophagus taurus (besouro), Agrilus planipennis (grilo) e Mesobuthus martensii (escorpião) (Tabela 5). Interessantemente, estes vírus possuem ampla distribuição geográfica e infectam grande variedade de hospedeiros.

Tabela 5. Chapparvovírus identificados neste estudo.

Virus Animal Amostra Localização Ambiente No. GenBank Desmodus Desmodus Araçatuba, São rotundus Rim Nativo KX907333 rotundus Paulo, Brazil parvovirus Cebus capucinus Cebus capucinus - Costa Rica - LVWQ01135885 imitator imitator Mesitornis Mesitornis - Madagascar - JJRI01094129 unicolor unicolor Protobothrops Protobothrops - Okinawa, Japão - BCNE02131058 mucrosquamatus mucrosquamatus Baço, rim e Caverna de Taiyi, Myotis davidii Myotis davidii intestisino Nativo ALWT01091740 Xianning, China delgado Serinus canaria Serinus canaria - - - CAVT010188449 Saccoglossus Saccoglossus - EUA Nativo ACQM01061598 kowalevskii kowalevskii Octopus Octopus Oceano Pacífico, Gônadas Nativo LGKD01682827 bimaculoides bimaculoides USA Oceano Pacífico, Patiria miniata Patiria miniata Esperma Nativo AKZP01065322 EUA Eisenia fetida Eisenia fetida - - - CYRZ010396261 https://creskolab.u Syngnathus Syngnathus Animal completo EUA Cativeiro oregon.edu/pipefi scovelli scovelli sh/) Onthophagus Onthophagus Animal completo EUA Nativo JHOM01022742 taurus taurus Strigami maritima Strigami maritima - - - AFFK01023528 Agrilus Agrilus Animal completo EUA Urbano JENH01067900 planipennis planipennis Hippocampus Hippocampus Músculo - - LVHJ01006034 comes comes Latrodectus Latrodectus Animal completo EUA Nativo JJRX01097408 hesperus hesperus Catajapyx Catajapyx Animal completo Austria Nativo JYFJ01046956 aquilonaris aquilonaris Parasteatoda Parasteatoda Animal completo - - AOMJ02182105 tepidariorum tepidariorum Mesobuthus Mesobuthus Animal completo China - AYEL01046460 martensii martensii Loxosceles Loxosceles Animal completo - - JJRW011214679 reclusa reclusa

Também identificamos os motifs “HXH” e “GPXNTGKS”, característicos da proteína NS de todos os membros da família Parvoviridae. Interessantemente, os chapparvovírus 64 encontrados sobrepõem 8 a 11 nucleotídeos nos dois genes. Além disso, observamos stop codon no gene NS em três novos chapparvovírus, identificados em centopeia da espécie Strigamia maritima, aranha da espécie Parasteatoda tepidariorum e escorpião da espécie Mesobuthus martensii (Figura 27).

HXH GPXNTGKS

Non-structural Desmodus rotundus 5’ 3’ parvovirus Capsid 4,284 nt

Syngnathus scovelli 2,626 3,720 2,722 nt 999 2,639

Octopus bimaculoides 1,065 nt 1,356 292

Patiria miniata ine 15,161 14,172 r 990 nt a

M Strigamia maritima * 961 nt 25,478 26,438

Hippocampus comes 318 nt 12,042 -11,725

Latrodectus hesperus 4,923 5,690 2,917 nt 2,774 4,846

Catajapyx aquilonaris 1,878 nt 24,766 22,889

Saccoglossus kowalevskii 1,461 nt 824 2,284

Eisenia fetida * 861 nt 1,601 741

Parasteatoda tepidariorum * * 705nt 3,060 3,764 ial r

Onthophagus taurus est

r 627 nt 5,988 5,362 r e T Agrilus planipennis 510 nt 590 1,099

Mesobuthus martensii 459 nt 1,211 1,669

Loxosceles reclusa 402 nt 4,737 4,336

Mesitornis unicolor 2,622 4,131 4,284 nt 611 2,629

Protobothrops muscrosquamatus 2,463 3,884 3,844 nt 524 2,473

Cebus capucinus imitator 1,442 2,932 3,032 nt 1 1,449

Myotis davidii 1,494 nt 137 1,494

Serinus canaria 929 nt 64 929

Figura 27. Organização genômica dos chapparvovírus identificados neste estudo.

65

As árvores de ML construídas com sequências completas dos genes NS e VP produziram o mesmo padrão de grupos, mas com diferentes topologias. As regiões conservadas em sequências de ambos os genes, mostram que os parvovírus formam três grupos monofiléticos com alto suporte estatístico. Entre estes grupos, observam-se dois clados bem suportados correspondentes às subfamílias Densovirinae e Parvovirinae já estabelecidas pelo ICTV. O terceiro clado é constituído por chapparvovírus cuja subfamília é nomeada “Chapparvovirinae”, uma potencial subfamília dos Parvoviridae. Análise filogenética com a proteína NS revelou que os chapparvovírus identificados em invertebrados formam um grupo monofilético basal em relação aos chapparvovírus encontrados em vertebrados (Figura 28). A análise filogenética com a proteína VP apresenta a mesma topologia da árvore ML da proteína NS, mas não mostrou agrupamento de chapparvovírus basalmente para Chapparvovirinae.

Desmodus rotundus parvovirus Eidolon helvum parvovirus 1 (a) Eidolon helvum parvovirus 2 (b) Cebus capucinus imitator Ungulate tetraparvovirus 1 Myotis davidii Porcine parvovirus 4 Rat parvovirus 2 Protobothrops mucrosquamatus Bovine parvovirus 2 Terrestrial Porcine parvovirus 7 Human parvovirus B19

Parvovirus partridge inae

r Adeno-associated virus Go-1 Marine Protoparvovirus HK-2014

Serinus canaria vi mAAV-EVE

Mesitornis unicolor o Snake parvovirus

Turkey parvovirus v

Onthophagus taurus r Goose parvovirus Agrilus planipennis Catajapyx aquilonaris Chicken parvovirus Saccoglossus kowalevskii Pigeon parvovirus A

Hippocampus comes nae Canine bocavirus r 0.3 Syngnathus scovelli

Latrodectus hesperus 0.4 Rhinolophus sinicus bat bocaparvovirus vi Chappa Strigami maritima o

Porcine bocavirus 1 v Mesobuthus martensii r

Eisenia fetida Human bocavirus a

Parasteatoda tepidariorum Bovine parvovirus P Loxosceles reclusa Patiria miniata Raccoon dog amdovirus Octopus bimaculoides Aleutian mink disease virus Myzus persicae densovirus Dysaphis plantaginea densovirus Porcine parvovirus Cherax quadricarinatus densovirus Canine parvovirus Parus major densovirus

Blattella germanica densovirus inae Sea otter parvovirus Culex pipiens densovirus r Megabat bufavirus

Diatraea saccharalis densovirus vi Mpulungu bufavirus Periplaneta fuliginosa densovirus o Helicoverpa armigera densovirus Cebus capucinus imitator Bombyx mori densovirus 1

Dendrolimus punctatus densovirus ens Desmodus rotundus parvovirus Acheta domestica densovirus D Porcine parvovirus 7 inae

Acheta domesticus mini ambidensovirus r Cavia porcellus-EVE Rat parvovirus 2 Oryctolagus cuniculus-EVE vi Protobothrops mucrosquamatus o

Papio hamadryas-EVE v

Loxodonta africana-EVE Latrodectus hesperus r Adeno-associated virus Go-1 Syngnathus scovelli mAAV-EVE Goose parvovirus Mesitornis unicolor Tursiops truncatus-EVE Turkey parvovirus Snake parvovirus

Porcine parvovirus 4 Protoparvovirus HK-2014 Chappa Bovine parvovirus 2

inae Diatraea saccharalis densovirus

Sea otter parvovirus r Mpulungu bufavirus Culex pipiens densovirus vi Megabat bufavirus Acheta domestica densovirus Porcine parvovirus o Canine parvovirus v Parus major densovirus r

Aleutian mink disease virus a Blattella germanica densovirus inae

Raccoon dog amdovirus r P Eidolon helvum parvovirus 1 Dysaphis plantaginea densovirus Ungulate tetraparvovirus 1 vi

Myzus persicae densovirus o Human parvovirus B19 Pigeon parvovirus A Cherax quadricarinatus densovirus

Chicken parvovirus Bombyx mori densovirus 1 ens Bovine parvovirus D Porcine bocavirus 1 Dendrolimus punctatus densovirus Rhinolophus sinicus bat bocaparvovirus Helicoverpa armigera densovirus Canine bocavirus Human bocavirus Acheta domesticus mini ambidensovirus Figura 28. Árvore de máxima verossimilhança mostrando relacionamento dos chapparvovírus com a família Parvoviridae. (A) Proteína não estrutural (B) Proteína do capsídeo. A barra de escala indica distância evolutiva em números de substituições aminoacídicas por sítio, e os valores de bootstrap (> 75) são indicados nos principais ramos com círculos pretos. As árvores foram inferidas com o modelo de substituições aminoacídicas rtREV+F+G4 para protéina não estrutural e Blosum62+F+G4 para proteína do capsídeo. Os vírus identificados neste estudo são destacados com a silhuetas dos seus hospedeiros e nomes em cores, animais terrestres (laranja) e marinhos (azul).

66

4.2.2. Família Anelloviridae 4.2.2.1. Caracterização genômica de novos anellovírus Foram identificados 26 anellovírus classificados em 11 novas espécies. Os vírus, identificados em amostras de roedores, morcegos e gambás, incluem 17 genomas completos e 10 genomas parciais (Tabela 6).

Tabela 6. Anellovírus identificados neste estudo.

Gênero Espécie Cepa ORF1 NT Hospdeiro Espécie Amostra N Local Data Torque teno Calomys Deltatorquevirus 138 Parcial 1,865 Roedor Calomys tener Sangue 38 Ribeirao Preto 2008 tener virus (TTCtV) Torque teno Carollia Carollia Sigmatorquevirus perspicillata virus 2 Parcial 1,728 Morcego Fígado 18 Araçatuba 2010 perspicillata (TTCpV) Torque teno Desmodus Desmodus Sigmatorquevirus rotundus virus 182 Completo 2,529 Morcego Fígado 8 Araçatuba 2010 rotundus (TTDrV) Torque teno Didelphis Didelphis Teodoro Sigmatorquevirus 3470 Completo 2,605 Gambá Soro 14 2009 albiventris (TTDaV) albiventris Sampaio Rodent Torque teno Omegatorquevirus 250 Completo 2,538 Roedor Necromys lasiurus Sangue 58 Ribeirao Preto 2008 virus 3 (RoTTV-3) Rodent Torque teno Omegatorquevirus 188 Completo 2,561 Roedor Calomys tener Sangue 37 Ribeirao Preto 2008 virus 4 (RoTTV-4) Rodent Torque teno 2008 - Omegatorquevirus 117 Completo 2,577 Roedor Mus musculus Sangue 24 Ribeirao Preto virus 4 (RoTTV-4) 2009 Rodent Torque teno Omegatorquevirus 332 Completo 2,684 Roedor Necromys lasiurus Sangue 58 Ribeirao Preto 2008 virus 4 (RoTTV-4) Rodent Torque teno Omegatorquevirus 4269 Completo 2,594 Roedor Necromys lasiurus Sangue 52 Ribeirao Preto 2009 virus 4 (RoTTV-4) Rodent Torque teno Omegatorquevirus 1259 Completo 2,588 Roedor Necromys lasiurus Sangue 59 Ribeirao Preto 2008 virus 4 (RoTTV-4) Rodent Torque teno Omegatorquevirus 108 Completo 2,577 Roedor Necromys lasiurus Sangue 59 Ribeirao Preto 2008 virus 4 (RoTTV-4) Rodent Torque teno 2012 - Omegatorquevirus 319 Completo 2,536 Roedor Necromys lasiurus Sangue 24 Ribeirao Preto virus 4 (RoTTV-4) 2013 Rodent Torque teno Omegatorquevirus 67 Parcial 1,340 Roedor Akodon montensis Sangue 55 Ribeirao Preto 2008 virus 4 (RoTTV-4) Rodent Torque teno Omegatorquevirus 152 Parcial 1,099 Roedor Calomys tener Sangue 37 Ribeirao Preto 2008 virus 4 (RoTTV-4) Rodent Torque teno Oligoryzomys 2008 - Omegatorquevirus 2216 Parcial 1,047 Roedor Sangue 43 Ribeirao Preto virus 4 (RoTTV-4) nigripes 2009 Rodent Torque teno Oligoryzomys 2007 - Omegatorquevirus 1458 Parcial 1,087 Roedor Fígado 10 Vale do Ribeira virus 4 (RoTTV-4) nigripes 2008 Rodent Torque teno 2012 - Omegatorquevirus 2 Completo 3,433 Roedor Akodon montensis Sangue 48 Ribeirao Preto virus 5 (RoTTV-5) 2013 Rodent Torque teno 2012 - Omegatorquevirus 22 Completo 2,617 Roedor Akodon montensis Sangue 48 Ribeirao Preto virus 5 (RoTTV-5) 2013 Rodent Torque teno Oligoryzomys 2007 - Omegatorquevirus 2192 Completo 2,689 Roedor Fígado 10 Vale do Ribeira virus 5 (RoTTV-5) nigripes 2008 Rodent Torque teno Omegatorquevirus 49 Parcial 1,830 Roedor Akodon cursor Pulmão 4 Nazare Paulista 2009 virus 5 (RoTTV-5) Rodent Torque teno Omegatorquevirus 1012 Parcial 1,111 Roedor Akodon cursor Soro 8 Nazaré Paulista 2009 virus 5 (RoTTV-5) Rodent Torque teno Omegatorquevirus 1594 Parcial 1,406 Roedor Necromys lasiurus Sangue 52 Ribeirao Preto 2009 virus 5 (RoTTV-5) Rodent Torque teno Oligoryzomys 2008 - Omegatorquevirus 2404 Completo 2,505 Roedor Sangue 43 Ribeirao Preto virus 6 (RoTTV-6) nigripes 2009 Rodent Torque teno 2012 - Omegatorquevirus 15 Completo 2,379 Roedor Akodon montensis Sangue 48 Ribeirao Preto virus 7 (RoTTV-7) 2013 Rodent Torque teno Oligoryzomys 2007 - Omegatorquevirus 2252 Completo 2,325 Roedor Fígado 10 Vale do Ribeira virus 8 (RoTTV-8) nigripes 2008 Opossum torque teno Didelphis Teodoro Alphatorquevirus 13255 Completo 2,220 Gambá Serum 17 2009 virus (OTTV) albiventris Sampaio

Os anellovírus possuem genoma de DNA fita simples (ssDNA) com 2,3 a 2,7 kb. A maioria de suas sequências apresentam região não traduzida (UTR) rica em GC (>60%), além de uma putativa região TATA-box e um sinal de cauda de poliadenilação (Figura 29). Todos os anellovírus apresentam uma ORF que codifica uma putativa proteína ORF1 de 541 a 580 aminoácidos. A única exceção é o Torque teno calomys tener virus (TTCtV) que possui a proteína ORF1 com 337 aminoácidos. Além disso, identificamos a ORF2 que codifica uma 67 putativa proteína de 103 a 168 aminoácidos nos Opossum torque teno vírus (OTTV) e Torque Teno didelphis albiventris vírus (TTDaV) (Figura 29). A ORF3 codifica uma proteína putativa de 127 a 154 aminoácidos nos TTCtV, TTDaV, Torque teno desmodus rotundus vírus (TTDrV) e Torque teno carollia perspicillata vírus (TTCpV). Além disso, foram identificadas putativas ORFs anteriormente não caracterizadas, que foram denominadas “ORF-?”, podendo codificar proteínas de 109 a 152 aminoácidos nos RoTTV-3 a RoTTV-8, TTDrV e TTCtV (Figura 31). As “ORF-?” não apresentaram homologia com proteínas de anellovírus ou de outras famílias virais.

TTRoV - Torque teno rodent virus TTDaV - Torque teno didelphis albiventris virus TTV - Torque teno virus TTDrV - Torque teno desmodus rotundus virus TTCpV - Torque teno carollia perspicillata virus TTCrV - Torque teno calomys tener

Rodents Bats Opossum

Figure 29. Organização genômica dos anellovírus identificados neste estudo. 68

4.2.2.2. A análise filogenética revela dois novos gêneros na família Anelloviridae Para estudar relações filogenéticas entre novos anellovírus na família Anelloviridae, construiu-se uma árvore filogenética com 123 sequências completas de nucleotídeos da ORF1. Todos os anellovírus conhecidos foram divididos em dois grandes grupos, anellovírus de primatas e não primatas, e distribuídos em 14 clados monofiléticos com alto suporte estatístico. Doze dos clados bem suportados corresponderam a gêneros já estabelecidos dentro da família Anelloviridae: Alphatorquevirus, Betatorquevirus, Deltatorquevirus, Epsilontorquevirus, Etatorquevirus, Gammatorquevirus, Gyrovirus, Iotatorquevirus, Kappatorquevirus, Lambdatorquevirus, Thetatorquevirus e Zetatorquevirus, incluindo as 68 espécies de anellovírus reconhecidos pela ICTV. Por outro lado, dois destes clados identificados foram distintos destes gêneros acima referidos (Figura 30). Para determinar se os vírus identificados nestes dois clados distintos pertenciam a gêneros anteriormente não caracterizados, o p-distance da ORF1 de todos os representantes da família Anelloviridae foi calculado (Figura 31). Utilizando critérios de classificação taxonômica do ICTV, com valores de corte para a distância em nucleotídeos em isolados ou cepas de até 20%, e em espécies de 20 a 55%, foi confirmado que onze dos 26 vírus identificados neste estudo, constituem novas espécies de anellovírus distribuídas em quatro gêneros. Também os dois clados divergentes descritos anteriormente representam dois novos gêneros na família Anelloviridae, que foram denominados Omegatorquevirus e Sigmatorquevirus (Figura 30 e 31).

69

AB060597 Torque teno virus 24 AF348409 Torque teno virus 21 AB049607 Torque teno virus 23 100 AX174942 Torque teno virus 22 100 Opossum torque teno virus AB025946 Torque teno virus 19 AB060594 Torque teno virus 20 AB017613 Torque teno virus 16 AB028668 Torque teno virus 15 100 AX025718 Torque teno virus 18 AX025830 Torque teno virus 17 AB037926 Torque teno virus 14 AF345526 Torque teno virus 13 AF261761 Torque teno virus 7 100 DQ361268 Torque teno virus ViPi04 AB054647 Torque teno virus 8 AF435014 Torque teno virus 6 Alphatorquevirus AB064605 Torque teno virus 12 DQ187006 Torque teno virus 9 AB064607 Torque teno virus 10 AF345524 Torque teno virus 11 100 93 AY666122 Torque teno virus 3 AF345523 Torque teno virus 5 AB008394 Torque teno virus 1 100 AB049608 Torque teno virus 2 AB041957 Torque teno virus 4 AB064595 Torque teno virus 27 AB064598 Torque teno virus 28 AB038621 Torque teno virus 29 96 AB041958 Torque teno virus 26 NC_026663 Simian torque teno virus 30 NC_026662 Simian torque teno virus 31 NC_026664 Simian torque teno virus 32 NC_026764 Simian torque teno virus 33 AB041959 Torque teno virus 25 NC_026765 Simian torque teno virus 34 AB303559 Torque teno midi virus 9 AB303561 Torque teno midi virus 11 AB290919 Torque teno midi virus 2 AB303564 Torque teno midi virus 13 AB303562 Torque teno midi virus 12 AB303566 Torque teno midi virus 14 AB303554 Torque teno midi virus 7 100 EF538875 Torque teno midi virus 3 Gammatorquevirus EF538876 Torque teno midi virus 4 AB290918 Torque teno midi virus 1 AB303552 Torque teno midi virus 5 AB303558 Torque teno midi virus 8 100 AB303560 Torque teno midi virus 10 AB303553 Torque teno midi virus 6 AB449062 Torque teno midi virus 15 100 AF291073 Torque teno mini virus 8 AB038631 Torque teno mini virus 9 AB038627 Torque teno mini virus 7 100 AB026929 Torque teno mini virus 6 EF538882 Torque teno mini virus 12 AB038629 Torque teno mini virus 2 AB038630 Torque teno mini virus 3 AB026931 Torque teno mini virus 1 Betatorquevirus EF538880 Torque teno mini virus 10 EF538881 Torque teno mini virus 11 100 NC_020498 Torque teno mini virus LY1 KF76470 Torque teno mini virus D11 AB041963 Torque teno mini virus 4 AB041962 Torque teno mini virus 5 99 AB041961 Torque teno douroucouli virus Zetatorquevirus AB041960 Torque teno tamarin virus Epsilontorquevirus KJ194623 Rodent Torque teno virus 1 - AS 1012 Sp1 KJ194619 Rodent Torque teno virus 1 - AS WM1 Se2 KJ194625 Rodent Torque teno virus 1 - AS 1014 Fae2 KJ194631 Rodent Torque teno virus 1 - MA ML89 Li1 KJ194630 Rodent Torque teno virus 1 - MA ML89 Li4 KJ194633 Rodent Torque teno virus 1 - MG ML211 Li1 Deltatorquevirus 100 Torque teno Calomys tener virus HQ335082 VEM Anellovirus SDBVL A AB057358 Torque teno tupaia virus 0.3 AB076001 Torque teno sus virus 1a 97 AY823990 Torque teno sus virus 1b KR902501 Torque teno equus virus 1 Iotatorquevirus NC_015212 Seal anellovirus NC_024891 Seal anellovirus 2 98 NC_024890 Seal anellovirus 3 Lambdatorquevirus 86 100 FJ459582 Torque teno zalophus virus 1 AB076003 Torque teno felis virus EF538877 Torque teno felis virus 2 Etatorquevirus 93 JN704611 Pine marten torque teno virus AB076002 Torque teno canis virus Thetatorquevirus Torque teno Carollia perspicillata virus 100 Torque teno Didelphis albiventris Torque teno Desmodus rotundus virus 95 “Sigmatorquevirus” KM434181 Torque teno Tadarida brasiliensis virus 100 GU570203 Torque teno sus virus k2a JQ406846 Torque teno sus virus k2b Kappatorquevirus Rodent Torque teno virus 4 strain 117 Rodent Torque teno virus 4 strain 67 Rodent Torque teno virus 4 strain 2216 Rodent Torque teno virus 4 strain 319 Rodent Torque teno virus 4 strain 4269 Rodent Torque teno virus 4 strain 332 Rodent Torque teno virus 4 strain 152 Rodent Torque teno virus 4 strain 108 Rodent Torque teno virus 4 strain 188 100 Rodent Torque teno virus 4 strain 1259 Rodent Torque teno virus 4 strain 1458 Rodent Torque teno virus 3 strain 250 89 Rodent Torque teno virus 5 strain 22 Rodent Torque teno virus 5 strain 1594 Rodent Torque teno virus 5 strain 1012 “Omegatorquevirus” 87 100 Rodent Torque teno virus 5 strain 49 Rodent Torque teno virus 5 strain 2192 81 Rodent Torque teno virus 5 strain 2 Rodent Torque teno virus 6 strain 2404 HQ335084 Mosquito VEM Anellovirus SDRB A 78 HQ335085 Mosquito VEM Anellovirus SDRB B KJ194607 Rodent Torque teno virus 2 - AS 1012 Sp2 KJ194614 Rodent Torque teno virus 2 - MA ML89 Li11 98 KJ194616 Rodent Torque teno virus 2 - AS 1014 sp2 NC_025966 Rodent Torque teno virus 2 - RN2 Se15 KM609325 Rodent Torque teno virus 2 - RN8 Se11 KM668485 Rodent Torque teno virus 2 - RN 5 Se5 99 Rodent Torque teno virus 7 Rodent Torque teno virus 8 NC_001427 Chicken anemia virus Figure 30. Árvore de máxima verossimilhança mostrando o relacionamento dos anellovírus descritos na família Anelloviridae. A barra de escala indica distância evolutiva em números de substituições nucleotidícas por sítio, e os valores de bootstrap (> 75) são indicados nos principais ramos com círculos pretos. As árvores foram inferidas com o modelo de substituições nucleotidícas GTR+I+G4. Os vírus identificados neste estudo são destacados com a silhuetas dos seus hospedeiros e nomes dos vírus na cor verde, e os gêneros propostos na cor rosa.

70 AB076002 Torque teno canis virus

1.00 NC_026764 Simian torque teno virus 33

1.00 0.61 NC_026664 Simian torque teno virus 32

1.00 0.65 0.60 NC_024890 Seal anellovirus 3

1.00 0.61 0.58 0.58 NC_026662 Simian torque teno virus 31

1.00 0.64 0.63 0.62 0.60 AB041958 Torque teno virus 26

1.00 0.62 0.62 0.62 0.59 0.57 NC_026765 Simian torque teno virus 34

1.00 0.61 0.60 0.61 0.61 0.60 0.59 AB041959 Torque teno virus 25

1.00 0.63 0.60 0.59 0.61 0.60 0.58 0.58 AB064598 Torque teno virus 28

1.00 0.61 0.61 0.58 0.59 0.60 0.60 0.56 0.59 AB064595 Torque teno virus 27 1.00 0.68 0.63 0.62 0.60 0.59 0.58 0.61 0.59 0.58

AB038621 Torque teno virus 29

1.00 0.69 0.69 0.61 0.60 0.59 0.61 0.59 0.60 0.59 0.58 JQ406846 Torque teno sus virus k2b

1.00 0.58 0.60 0.59 0.60 0.59 0.57 0.58 0.58 0.57 0.60 0.59 GU570203 Torque teno sus virus k2a

1.00 0.63 0.62 0.60 0.61 0.60 0.56 0.57 0.59 0.62 0.58 0.58 0.61 AB041960 Torque teno tamarin virus

1.00 0.60 0.58 0.60 0.61 0.61 0.58 0.59 0.55 0.56 0.60 0.59 0.56 0.61 KM434181 Torque teno Tadarida brasiliensis virus

1.00 0.62 0.61 0.60 0.61 0.59 0.60 0.60 0.58 0.57 0.58 0.59 0.59 0.60 0.62 Torque teno Desmodus rotundus virus

1.00 0.91 0.63 0.60 0.61 0.60 0.61 0.57 0.60 0.60 0.60 0.61 0.58 0.63 0.60 0.61 Torque teno Didelphis albiventris virus

1.00 0.67 0.67 0.62 0.61 0.60 0.60 0.59 0.59 0.59 0.59 0.58 0.59 0.58 0.62 0.60 0.58 Torque teno Carollia perspicillata virus

1.00 0.70 0.69 0.70 0.59 0.58 0.59 0.59 0.60 0.60 0.58 0.59 0.57 0.59 0.59 0.60 0.57 0.59 Rodent Torque teno virus 7

1.00 0.57 0.58 0.58 0.58 0.60 0.59 0.59 0.60 0.60 0.58 0.60 0.60 0.58 0.62 0.59 0.60 0.60 0.58 KJ194614 Rodent Torque teno virus 2 - MA ML89 Li11

1.00 0.64 0.61 0.60 0.60 0.59 0.59 0.60 0.61 0.60 0.59 0.58 0.58 0.58 0.60 0.61 0.60 0.60 0.59 0.58 KJ194607 Rodent Torque teno virus 2 - AS 1012 Sp2 1.00 0.97 0.64 0.58 0.59 0.59 0.60 0.57 0.61 0.60 0.59 0.60 0.58 0.58 0.59 0.60 0.61 0.61 0.61 0.58 0.58

KJ194616 Rodent Torque teno virus 2 - AS 1014 sp2 1.00 0.88 0.87 0.63 0.59 0.60 0.59 0.60 0.55 0.60 0.60 0.59 0.58 0.60 0.57 0.58 0.57 0.59 0.59 0.61 0.58 0.59 HQ335085 Mosquito VEM Anellovirus SDRB B

1.00 0.65 0.64 0.64 0.62 0.58 0.60 0.58 0.58 0.60 0.61 0.58 0.57 0.58 0.59 0.58 0.58 0.59 0.58 0.59 0.59 0.56 0.58 HQ335084 Mosquito VEM Anellovirus SDRB A

1.00 0.70 0.63 0.63 0.63 0.61 0.59 0.58 0.60 0.61 0.62 0.60 0.59 0.62 0.60 0.58 0.59 0.56 0.57 0.59 0.61 0.60 0.56 0.56 Rodent Torque teno virus 6 strain 2404

1.00 0.67 0.63 0.62 0.64 0.64 0.61 0.60 0.60 0.62 0.62 0.58 0.59 0.59 0.57 0.58 0.61 0.57 0.57 0.58 0.57 0.59 0.58 0.58 0.58 Rodent Torque teno virus 5 strain 1594

1.00 0.69 0.68 0.65 0.67 0.65 0.65 0.66 0.64 0.61 0.60 0.61 0.64 0.61 0.64 0.64 0.62 0.63 0.62 0.63 0.63 0.64 0.59 0.64 0.63 0.61 Rodent Torque teno virus 5 strain 49

1.00 0.97 0.71 0.67 0.66 0.67 0.67 0.67 0.66 0.63 0.61 0.63 0.62 0.64 0.62 0.63 0.63 0.62 0.63 0.63 0.65 0.64 0.64 0.61 0.63 0.65 0.63 Rodent Torque teno virus 5 strain 1012

1.00 0.99 0.97 0.71 0.68 0.65 0.67 0.67 0.66 0.64 0.62 0.59 0.64 0.62 0.64 0.61 0.64 0.65 0.63 0.64 0.63 0.64 0.63 0.63 0.62 0.63 0.64 0.62 Rodent Torque teno virus 5 strain 22

1.00 0.97 0.97 0.97 0.69 0.64 0.64 0.64 0.64 0.64 0.59 0.59 0.59 0.60 0.61 0.57 0.61 0.59 0.58 0.57 0.60 0.59 0.59 0.57 0.60 0.59 0.58 0.58 0.59 Rodent Torque teno virus 5 strain 2

1.00 0.82 0.81 0.83 0.82 0.67 0.65 0.66 0.64 0.64 0.64 0.63 0.58 0.60 0.58 0.60 0.59 0.60 0.58 0.57 0.59 0.57 0.59 0.58 0.59 0.59 0.57 0.60 0.59 0.60 Rodent Torque teno virus 5 strain 2192

1.00 0.81 0.79 0.80 0.81 0.79 0.68 0.66 0.65 0.64 0.64 0.63 0.60 0.58 0.60 0.58 0.59 0.59 0.61 0.59 0.59 0.56 0.58 0.61 0.60 0.59 0.58 0.60 0.61 0.59 0.58 Rodent Torque teno virus 4 strain 2216 1.00 0.72 0.71 0.75 0.73 0.73 0.72 0.69 0.67 0.67 0.67 0.69 0.67 0.66 0.63 0.63 0.61 0.61 0.65 0.63 0.64 0.65 0.63 0.63 0.66 0.65 0.62 0.68 0.60 0.66 0.66 0.65

Rodent Torque teno virus 4 strain 67 1.00 0.99 0.71 0.71 0.73 0.72 0.72 0.72 0.69 0.67 0.66 0.67 0.69 0.66 0.66 0.63 0.64 0.62 0.60 0.65 0.62 0.64 0.65 0.63 0.63 0.66 0.63 0.62 0.67 0.59 0.65 0.67 0.65 Rodent Torque teno virus 4 strain 319

1.00 0.99 0.98 0.72 0.71 0.74 0.71 0.71 0.71 0.67 0.65 0.66 0.64 0.64 0.64 0.63 0.57 0.58 0.58 0.57 0.59 0.58 0.57 0.59 0.57 0.60 0.59 0.58 0.58 0.60 0.58 0.59 0.57 0.60 Rodent Torque teno virus 4 strain 4269

1.00 0.99 1.00 0.99 0.71 0.70 0.73 0.71 0.71 0.71 0.67 0.64 0.65 0.64 0.64 0.64 0.63 0.59 0.59 0.59 0.58 0.59 0.59 0.57 0.57 0.57 0.58 0.61 0.59 0.57 0.58 0.60 0.60 0.57 0.60 Rodent Torque teno virus 4 strain 117

1.00 0.99 0.99 1.00 0.99 0.71 0.70 0.73 0.71 0.71 0.71 0.66 0.64 0.65 0.64 0.64 0.64 0.63 0.57 0.60 0.58 0.59 0.60 0.58 0.57 0.56 0.58 0.59 0.60 0.58 0.57 0.58 0.60 0.60 0.58 0.59 Rodent Torque teno virus 4 strain 1259

1.00 0.96 0.96 0.96 0.95 0.94 0.71 0.70 0.73 0.71 0.72 0.71 0.65 0.64 0.65 0.62 0.63 0.64 0.62 0.58 0.59 0.59 0.57 0.58 0.58 0.58 0.60 0.58 0.58 0.59 0.58 0.56 0.59 0.59 0.59 0.57 0.59 Rodent Torque teno virus 4 strain 188

1.00 0.99 0.95 0.95 0.95 0.95 0.94 0.71 0.70 0.73 0.71 0.72 0.71 0.66 0.64 0.65 0.63 0.64 0.64 0.62 0.58 0.59 0.59 0.58 0.58 0.59 0.58 0.60 0.58 0.57 0.60 0.58 0.55 0.58 0.58 0.61 0.58 0.59 Rodent Torque teno virus 4 strain 152

1.00 0.93 0.94 0.95 0.95 0.95 0.92 0.91 0.72 0.70 0.73 0.71 0.71 0.71 0.68 0.66 0.65 0.65 0.63 0.63 0.65 0.56 0.62 0.60 0.60 0.63 0.59 0.63 0.59 0.59 0.63 0.62 0.63 0.60 0.62 0.59 0.63 0.63 0.58 Rodent Torque teno virus 4 strain 332

1.00 1.00 0.96 0.96 0.96 0.97 0.96 0.95 0.95 0.71 0.71 0.74 0.73 0.72 0.73 0.66 0.64 0.64 0.64 0.64 0.64 0.62 0.58 0.59 0.58 0.58 0.59 0.60 0.57 0.56 0.58 0.58 0.59 0.58 0.56 0.59 0.59 0.60 0.58 0.60 Rodent Torque teno virus 4 strain 108

1.00 0.99 0.99 0.96 0.96 0.97 0.96 0.96 0.95 0.95 0.72 0.71 0.74 0.73 0.72 0.73 0.66 0.63 0.64 0.64 0.64 0.64 0.63 0.58 0.59 0.58 0.58 0.59 0.59 0.58 0.56 0.58 0.58 0.60 0.57 0.56 0.59 0.60 0.60 0.58 0.59 Rodent Torque teno virus 4 strain 1458

1.00 0.82 0.82 0.81 0.81 0.82 0.82 0.81 0.82 0.56 0.54 0.72 0.70 0.74 0.56 0.56 0.58 0.67 0.66 0.66 0.65 0.66 0.65 0.64 0.65 0.63 0.61 0.63 0.65 0.63 0.64 0.64 0.65 0.64 0.63 0.62 0.62 0.66 0.62 0.66 0.66 0.63 Rodent Torque teno virus 3 strain 250

1.00 0.78 0.75 0.75 0.72 0.75 0.75 0.76 0.75 0.75 0.76 0.75 0.70 0.70 0.69 0.69 0.69 0.68 0.67 0.64 0.63 0.62 0.65 0.64 0.62 0.57 0.59 0.58 0.58 0.58 0.57 0.59 0.57 0.57 0.60 0.58 0.55 0.58 0.60 0.60 0.59 0.60 0.57 AB057358 Torque teno tupaia virus

1.00 0.60 0.60 0.58 0.59 0.58 0.58 0.59 0.59 0.59 0.59 0.59 0.63 0.59 0.61 0.58 0.61 0.62 0.59 0.61 0.60 0.57 0.60 0.59 0.59 0.58 0.60 0.59 0.61 0.60 0.59 0.59 0.59 0.58 0.60 0.59 0.61 0.60 0.58 0.63 0.59 0.62 0.58 0.60 AB449062 Torque teno midi virus 15

1.00 0.62 0.57 0.65 0.58 0.59 0.63 0.59 0.59 0.58 0.60 0.58 0.62 0.64 0.61 0.58 0.58 0.65 0.64 0.61 0.61 0.61 0.60 0.61 0.60 0.60 0.58 0.61 0.61 0.60 0.64 0.59 0.59 0.59 0.60 0.61 0.59 0.60 0.60 0.57 0.57 0.59 0.58 0.57 0.57 Torque teno Calomys tener virus 1.00 0.63 0.65 0.62 0.59 0.61 0.61 0.57 0.62 0.62 0.62 0.61 0.61 0.53 0.54 0.61 0.65 0.60 0.58 0.55 0.59 0.65 0.61 0.62 0.62 0.60 0.59 0.62 0.61 0.61 0.59 0.61 0.63 0.62 0.62 0.60 0.64 0.63 0.63 0.60 0.61 0.63 0.58 0.62 0.62 0.58

AB303560 Torque teno midi virus 10

1.00 0.67 0.61 0.59 0.57 0.61 0.57 0.57 0.62 0.56 0.56 0.58 0.57 0.58 0.63 0.64 0.59 0.59 0.59 0.62 0.63 0.62 0.60 0.61 0.61 0.58 0.59 0.60 0.58 0.62 0.61 0.62 0.63 0.57 0.60 0.60 0.62 0.59 0.61 0.61 0.59 0.56 0.57 0.59 0.59 0.56 0.60 AB303561 Torque teno midi virus 11

1.00 0.62 0.64 0.61 0.60 0.57 0.65 0.56 0.56 0.61 0.57 0.57 0.57 0.57 0.58 0.63 0.63 0.58 0.60 0.59 0.66 0.67 0.65 0.59 0.60 0.61 0.58 0.59 0.60 0.59 0.62 0.59 0.60 0.62 0.58 0.61 0.59 0.60 0.59 0.59 0.59 0.56 0.61 0.56 0.58 0.59 0.55 0.59 AB303559 Torque teno midi virus 9

1.00 0.66 0.62 0.66 0.63 0.60 0.59 0.63 0.58 0.58 0.60 0.59 0.59 0.61 0.59 0.59 0.63 0.63 0.60 0.60 0.60 0.63 0.65 0.62 0.61 0.62 0.60 0.57 0.60 0.59 0.60 0.58 0.62 0.60 0.62 0.58 0.61 0.57 0.61 0.61 0.60 0.61 0.57 0.58 0.59 0.60 0.58 0.56 0.58 AB303554 Torque teno midi virus 7

1.00 0.65 0.65 0.62 0.62 0.63 0.60 0.59 0.62 0.59 0.58 0.59 0.58 0.58 0.58 0.59 0.59 0.62 0.62 0.59 0.61 0.60 0.62 0.63 0.64 0.61 0.60 0.58 0.61 0.58 0.60 0.59 0.62 0.59 0.62 0.62 0.58 0.59 0.58 0.61 0.62 0.59 0.57 0.58 0.57 0.58 0.59 0.58 0.58 0.59 AB303562 Torque teno midi virus 12

1.00 0.65 0.63 0.63 0.63 0.64 0.60 0.59 0.58 0.64 0.59 0.59 0.61 0.60 0.59 0.59 0.59 0.61 0.65 0.65 0.60 0.62 0.61 0.64 0.65 0.64 0.62 0.61 0.61 0.60 0.62 0.61 0.61 0.61 0.60 0.62 0.61 0.59 0.60 0.60 0.60 0.61 0.61 0.60 0.58 0.56 0.57 0.58 0.58 0.56 0.57 AB303566 Torque teno midi virus 14

1.00 0.64 0.65 0.62 0.62 0.62 0.63 0.60 0.59 0.57 0.62 0.59 0.58 0.63 0.57 0.57 0.58 0.58 0.61 0.63 0.63 0.58 0.58 0.59 0.63 0.64 0.64 0.60 0.61 0.60 0.60 0.60 0.59 0.60 0.59 0.60 0.61 0.60 0.60 0.59 0.57 0.61 0.58 0.59 0.59 0.58 0.59 0.57 0.58 0.60 0.56 0.60 AB303553 Torque teno midi virus 6

1.00 0.65 0.62 0.64 0.63 0.63 0.64 0.62 0.62 0.58 0.57 0.63 0.59 0.58 0.63 0.60 0.60 0.59 0.59 0.59 0.65 0.66 0.61 0.61 0.61 0.64 0.64 0.65 0.61 0.60 0.60 0.59 0.60 0.60 0.60 0.62 0.60 0.60 0.59 0.58 0.60 0.59 0.59 0.59 0.60 0.59 0.57 0.59 0.57 0.58 0.55 0.57 0.58 AB303558 Torque teno midi virus 8

1.00 0.65 0.65 0.63 0.64 0.63 0.63 0.63 0.64 0.61 0.60 0.57 0.61 0.58 0.58 0.61 0.59 0.59 0.59 0.58 0.59 0.64 0.64 0.59 0.60 0.60 0.62 0.62 0.62 0.62 0.59 0.60 0.59 0.59 0.60 0.60 0.61 0.59 0.60 0.61 0.58 0.60 0.59 0.60 0.58 0.59 0.57 0.58 0.59 0.57 0.57 0.58 0.57 0.58 AB303552 Torque teno midi virus 5

1.00 0.66 0.65 0.63 0.64 0.63 0.65 0.63 0.64 0.64 0.61 0.58 0.55 0.63 0.59 0.59 0.62 0.58 0.58 0.58 0.59 0.59 0.65 0.64 0.60 0.59 0.60 0.62 0.62 0.61 0.58 0.62 0.61 0.57 0.60 0.59 0.59 0.59 0.61 0.59 0.60 0.57 0.60 0.60 0.61 0.60 0.60 0.60 0.56 0.57 0.55 0.58 0.60 0.59 0.59 AB303564 Torque teno midi virus 13

1.00 0.63 0.64 0.64 0.64 0.63 0.63 0.63 0.63 0.62 0.64 0.62 0.59 0.60 0.63 0.59 0.58 0.61 0.59 0.59 0.59 0.59 0.59 0.64 0.63 0.60 0.62 0.59 0.66 0.65 0.64 0.60 0.59 0.61 0.59 0.60 0.60 0.60 0.62 0.60 0.59 0.60 0.59 0.57 0.58 0.60 0.59 0.62 0.60 0.58 0.56 0.57 0.59 0.59 0.57 0.60 AB290919 Torque teno midi virus 2 1.00 0.67 0.63 0.64 0.65 0.65 0.66 0.63 0.64 0.65 0.64 0.63 0.62 0.57 0.59 0.62 0.58 0.58 0.62 0.58 0.58 0.58 0.58 0.59 0.63 0.63 0.58 0.59 0.60 0.63 0.62 0.62 0.61 0.59 0.59 0.59 0.60 0.59 0.60 0.59 0.61 0.63 0.62 0.57 0.60 0.57 0.61 0.59 0.59 0.58 0.58 0.58 0.58 0.58 0.59 0.56 0.57

EF538876 Torque teno midi virus 4

1.00 0.64 0.64 0.63 0.63 0.64 0.64 0.63 0.63 0.62 0.65 0.63 0.64 0.62 0.60 0.58 0.64 0.61 0.61 0.63 0.60 0.60 0.59 0.59 0.60 0.64 0.65 0.57 0.58 0.59 0.63 0.64 0.63 0.60 0.59 0.61 0.59 0.59 0.59 0.60 0.59 0.62 0.60 0.60 0.55 0.59 0.60 0.61 0.59 0.60 0.60 0.56 0.58 0.57 0.58 0.57 0.57 0.58 EF538875 Torque teno midi virus 3

1.00 0.67 0.63 0.65 0.65 0.64 0.63 0.62 0.64 0.65 0.63 0.63 0.64 0.62 0.61 0.60 0.57 0.63 0.56 0.56 0.59 0.57 0.57 0.58 0.58 0.57 0.61 0.61 0.57 0.60 0.58 0.60 0.59 0.60 0.59 0.59 0.60 0.59 0.58 0.57 0.58 0.60 0.58 0.61 0.60 0.59 0.59 0.61 0.62 0.62 0.61 0.60 0.60 0.56 0.58 0.57 0.59 0.58 0.58 AB290918 Torque teno midi virus 1

1.00 0.67 0.64 0.66 0.65 0.65 0.65 0.65 0.64 0.64 0.64 0.64 0.63 0.64 0.65 0.59 0.60 0.58 0.62 0.58 0.59 0.63 0.60 0.59 0.60 0.60 0.61 0.64 0.65 0.57 0.59 0.56 0.61 0.61 0.64 0.60 0.62 0.60 0.58 0.60 0.60 0.61 0.56 0.61 0.60 0.61 0.57 0.60 0.59 0.58 0.57 0.59 0.59 0.56 0.60 0.56 0.59 0.58 0.57 0.60 EF538881 Torque teno mini virus 11

1.00 0.60 0.61 0.61 0.60 0.61 0.62 0.61 0.62 0.62 0.60 0.61 0.61 0.61 0.61 0.64 0.61 0.60 0.58 0.64 0.58 0.58 0.61 0.58 0.58 0.58 0.58 0.60 0.63 0.64 0.58 0.62 0.58 0.63 0.63 0.64 0.60 0.62 0.59 0.57 0.58 0.57 0.59 0.58 0.60 0.61 0.61 0.58 0.58 0.60 0.59 0.59 0.60 0.59 0.57 0.59 0.55 0.59 0.59 0.57 0.58 AB041962 Torque teno mini virus 5

1.00 0.63 0.61 0.61 0.59 0.62 0.61 0.61 0.61 0.62 0.61 0.62 0.62 0.63 0.62 0.60 0.65 0.61 0.60 0.59 0.62 0.57 0.57 0.62 0.56 0.56 0.58 0.58 0.58 0.64 0.64 0.58 0.63 0.60 0.61 0.63 0.61 0.61 0.59 0.60 0.60 0.59 0.60 0.62 0.60 0.59 0.61 0.62 0.61 0.60 0.60 0.60 0.60 0.60 0.59 0.58 0.61 0.57 0.58 0.59 0.57 0.58 EF538880 Torque teno mini virus 10

1.00 0.63 0.62 0.61 0.62 0.60 0.60 0.62 0.62 0.61 0.63 0.61 0.62 0.61 0.61 0.62 0.60 0.64 0.62 0.59 0.58 0.64 0.58 0.59 0.64 0.58 0.57 0.59 0.59 0.61 0.63 0.62 0.59 0.61 0.60 0.64 0.67 0.63 0.59 0.61 0.61 0.60 0.56 0.59 0.59 0.57 0.61 0.60 0.61 0.60 0.60 0.60 0.59 0.59 0.60 0.59 0.57 0.57 0.57 0.56 0.58 0.56 0.60 Rodent Torque teno virus 8

1.00 0.61 0.61 0.60 0.60 0.61 0.61 0.62 0.62 0.59 0.61 0.60 0.61 0.62 0.61 0.60 0.62 0.61 0.61 0.59 0.63 0.61 0.63 0.62 0.62 0.63 0.62 0.61 0.61 0.61 0.61 0.65 0.66 0.60 0.62 0.60 0.65 0.65 0.64 0.61 0.64 0.62 0.60 0.62 0.62 0.62 0.60 0.58 0.60 0.61 0.62 0.61 0.59 0.58 0.60 0.58 0.60 0.57 0.57 0.61 0.62 0.59 0.59 0.60 NC_020498 Torque teno mini virus LY1

1.00 0.63 0.63 0.61 0.61 0.62 0.64 0.60 0.62 0.62 0.59 0.62 0.61 0.63 0.63 0.62 0.63 0.62 0.61 0.64 0.62 0.60 0.56 0.64 0.58 0.58 0.63 0.57 0.58 0.58 0.57 0.57 0.63 0.63 0.59 0.59 0.58 0.64 0.65 0.62 0.62 0.60 0.59 0.61 0.61 0.59 0.59 0.57 0.61 0.59 0.61 0.58 0.60 0.62 0.60 0.59 0.60 0.58 0.57 0.56 0.59 0.59 0.59 0.57 0.56 KF76470 Torque teno mini virus D11

1.00 0.65 0.63 0.62 0.64 0.61 0.62 0.63 0.60 0.62 0.61 0.62 0.61 0.61 0.61 0.61 0.62 0.62 0.62 0.63 0.65 0.62 0.61 0.60 0.62 0.59 0.59 0.62 0.57 0.57 0.57 0.56 0.57 0.62 0.61 0.58 0.58 0.59 0.63 0.63 0.63 0.62 0.62 0.58 0.62 0.60 0.61 0.58 0.58 0.59 0.63 0.60 0.58 0.59 0.58 0.61 0.62 0.61 0.59 0.59 0.57 0.57 0.56 0.57 0.57 0.59 AB041963 Torque teno mini virus 4

1.00 0.65 0.64 0.60 0.61 0.64 0.64 0.62 0.61 0.61 0.61 0.61 0.63 0.60 0.61 0.62 0.62 0.63 0.62 0.60 0.61 0.62 0.60 0.61 0.56 0.65 0.56 0.56 0.62 0.58 0.57 0.56 0.56 0.56 0.62 0.63 0.57 0.56 0.59 0.63 0.65 0.64 0.60 0.57 0.59 0.59 0.59 0.59 0.58 0.59 0.57 0.61 0.62 0.59 0.58 0.56 0.59 0.59 0.60 0.58 0.62 0.58 0.57 0.60 0.57 0.55 0.61 AB038627 Torque teno mini virus 7 1.00 0.64 0.65 0.62 0.64 0.62 0.62 0.63 0.61 0.63 0.60 0.60 0.61 0.61 0.60 0.62 0.62 0.61 0.62 0.61 0.62 0.60 0.64 0.61 0.60 0.57 0.62 0.59 0.59 0.60 0.58 0.58 0.60 0.60 0.59 0.61 0.62 0.57 0.60 0.61 0.64 0.63 0.62 0.58 0.61 0.59 0.59 0.60 0.59 0.55 0.57 0.62 0.62 0.59 0.59 0.59 0.59 0.58 0.62 0.61 0.60 0.58 0.59 0.58 0.60 0.56 0.55 0.57

AB038630 Torque teno mini virus 3

1.00 0.63 0.62 0.62 0.63 0.62 0.62 0.62 0.62 0.62 0.62 0.61 0.62 0.63 0.62 0.61 0.58 0.62 0.63 0.60 0.65 0.61 0.62 0.64 0.62 0.60 0.58 0.60 0.57 0.57 0.61 0.57 0.57 0.57 0.56 0.56 0.61 0.62 0.59 0.58 0.61 0.62 0.61 0.63 0.61 0.60 0.62 0.59 0.61 0.60 0.60 0.57 0.61 0.60 0.60 0.57 0.59 0.60 0.60 0.59 0.59 0.59 0.56 0.59 0.56 0.59 0.58 0.54 0.60 AB038629 Torque teno mini virus 2

1.00 0.64 0.63 0.63 0.63 0.63 0.60 0.61 0.61 0.61 0.62 0.62 0.62 0.59 0.61 0.59 0.61 0.61 0.61 0.61 0.63 0.64 0.61 0.63 0.61 0.61 0.59 0.57 0.63 0.58 0.58 0.61 0.58 0.57 0.58 0.58 0.59 0.63 0.63 0.58 0.62 0.59 0.63 0.62 0.63 0.58 0.58 0.58 0.59 0.59 0.59 0.59 0.57 0.59 0.62 0.60 0.57 0.59 0.62 0.58 0.60 0.59 0.59 0.57 0.57 0.56 0.57 0.58 0.56 0.57 AB026931 Torque teno mini virus 1

1.00 0.64 0.64 0.64 0.64 0.64 0.62 0.61 0.62 0.62 0.62 0.62 0.63 0.61 0.62 0.63 0.61 0.62 0.59 0.62 0.61 0.63 0.62 0.60 0.61 0.63 0.61 0.60 0.59 0.60 0.58 0.57 0.61 0.57 0.57 0.57 0.57 0.57 0.65 0.63 0.58 0.60 0.58 0.63 0.62 0.61 0.59 0.63 0.63 0.61 0.59 0.59 0.59 0.59 0.60 0.61 0.60 0.59 0.59 0.59 0.58 0.60 0.59 0.59 0.58 0.59 0.56 0.59 0.58 0.56 0.55 AF291073 Torque teno mini virus 8

1.00 0.65 0.65 0.64 0.64 0.64 0.64 0.64 0.61 0.65 0.63 0.62 0.61 0.62 0.63 0.60 0.62 0.61 0.59 0.61 0.61 0.62 0.63 0.60 0.62 0.61 0.63 0.60 0.62 0.60 0.65 0.59 0.60 0.62 0.60 0.59 0.60 0.60 0.61 0.64 0.63 0.60 0.63 0.58 0.63 0.63 0.63 0.62 0.61 0.62 0.58 0.60 0.60 0.58 0.57 0.59 0.61 0.61 0.59 0.60 0.59 0.60 0.61 0.60 0.60 0.57 0.60 0.57 0.59 0.58 0.57 0.57 AB038631 Torque teno mini virus 9

1.00 0.66 0.63 0.61 0.63 0.63 0.64 0.62 0.61 0.62 0.61 0.62 0.60 0.61 0.64 0.61 0.61 0.60 0.60 0.61 0.61 0.61 0.64 0.61 0.60 0.61 0.60 0.64 0.62 0.60 0.62 0.63 0.62 0.61 0.64 0.61 0.62 0.61 0.60 0.62 0.65 0.65 0.59 0.59 0.61 0.64 0.64 0.63 0.63 0.62 0.59 0.59 0.59 0.60 0.59 0.56 0.60 0.61 0.63 0.57 0.61 0.60 0.58 0.60 0.60 0.59 0.57 0.58 0.57 0.58 0.60 0.55 0.58 EF538882 Torque teno mini virus 12

1.00 0.60 0.65 0.62 0.61 0.63 0.63 0.62 0.61 0.62 0.59 0.61 0.61 0.60 0.61 0.62 0.60 0.60 0.60 0.63 0.61 0.60 0.59 0.59 0.60 0.60 0.61 0.61 0.64 0.60 0.61 0.60 0.64 0.62 0.59 0.62 0.59 0.59 0.59 0.60 0.59 0.65 0.65 0.59 0.60 0.59 0.62 0.63 0.62 0.60 0.61 0.60 0.59 0.60 0.59 0.60 0.57 0.61 0.59 0.61 0.59 0.60 0.60 0.60 0.60 0.60 0.59 0.57 0.58 0.57 0.59 0.58 0.57 0.59 AB026929 Torque teno mini virus 6

1.00 0.65 0.64 0.64 0.63 0.62 0.61 0.65 0.64 0.61 0.61 0.63 0.60 0.60 0.62 0.59 0.62 0.61 0.61 0.62 0.62 0.62 0.59 0.60 0.60 0.61 0.62 0.62 0.59 0.65 0.61 0.60 0.58 0.64 0.57 0.60 0.62 0.59 0.59 0.58 0.58 0.60 0.61 0.61 0.60 0.60 0.59 0.64 0.63 0.61 0.60 0.60 0.60 0.60 0.60 0.61 0.58 0.61 0.60 0.61 0.63 0.58 0.59 0.58 0.59 0.61 0.59 0.59 0.57 0.58 0.58 0.59 0.55 0.55 0.59 AF348409 Torque teno virus 21

1.00 0.60 0.60 0.60 0.60 0.60 0.59 0.61 0.61 0.59 0.61 0.60 0.62 0.61 0.59 0.61 0.62 0.62 0.59 0.60 0.60 0.59 0.62 0.61 0.59 0.60 0.61 0.61 0.60 0.63 0.65 0.60 0.60 0.59 0.65 0.59 0.60 0.63 0.59 0.59 0.60 0.61 0.59 0.65 0.65 0.61 0.60 0.60 0.66 0.65 0.64 0.60 0.61 0.59 0.60 0.57 0.57 0.60 0.59 0.59 0.60 0.62 0.57 0.58 0.59 0.59 0.59 0.58 0.58 0.57 0.58 0.59 0.60 0.59 0.57 0.59 AX174942 Torque teno virus 22

1.00 0.66 0.59 0.59 0.58 0.58 0.58 0.59 0.57 0.58 0.59 0.58 0.58 0.61 0.57 0.58 0.58 0.59 0.60 0.57 0.59 0.60 0.58 0.58 0.58 0.59 0.61 0.60 0.60 0.59 0.60 0.64 0.59 0.61 0.62 0.64 0.61 0.61 0.64 0.60 0.61 0.61 0.61 0.60 0.66 0.65 0.60 0.61 0.60 0.65 0.65 0.64 0.61 0.61 0.60 0.60 0.60 0.61 0.60 0.58 0.59 0.60 0.60 0.58 0.60 0.60 0.60 0.61 0.60 0.59 0.58 0.61 0.59 0.61 0.57 0.59 0.61 AB060597 Torque teno virus 24

1.00 0.68 0.65 0.59 0.58 0.58 0.59 0.56 0.58 0.60 0.57 0.58 0.57 0.58 0.61 0.59 0.56 0.60 0.58 0.60 0.58 0.58 0.59 0.58 0.58 0.59 0.59 0.58 0.59 0.58 0.59 0.60 0.64 0.58 0.59 0.59 0.64 0.59 0.58 0.61 0.58 0.59 0.58 0.58 0.59 0.65 0.65 0.59 0.62 0.59 0.64 0.64 0.66 0.58 0.59 0.58 0.59 0.60 0.60 0.60 0.59 0.60 0.58 0.62 0.57 0.59 0.59 0.59 0.61 0.60 0.58 0.62 0.59 0.60 0.63 0.61 0.60 0.61 AB049607 Torque teno virus 23 1.00 0.68 0.66 0.66 0.57 0.59 0.58 0.59 0.60 0.58 0.57 0.59 0.59 0.59 0.59 0.63 0.59 0.60 0.60 0.58 0.61 0.59 0.60 0.60 0.57 0.57 0.59 0.60 0.60 0.60 0.59 0.59 0.59 0.65 0.59 0.61 0.60 0.65 0.58 0.59 0.61 0.60 0.60 0.60 0.60 0.62 0.67 0.66 0.57 0.61 0.60 0.66 0.68 0.65 0.59 0.59 0.61 0.61 0.60 0.59 0.60 0.61 0.61 0.62 0.62 0.59 0.59 0.59 0.60 0.60 0.59 0.59 0.61 0.59 0.62 0.61 0.60 0.59 0.59

AF345526 Torque teno virus 13 1.00 0.63 0.62 0.62 0.62 0.58 0.60 0.58 0.59 0.61 0.60 0.60 0.61 0.59 0.59 0.61 0.60 0.59 0.59 0.58 0.59 0.60 0.59 0.57 0.59 0.58 0.57 0.62 0.59 0.58 0.57 0.58 0.58 0.62 0.63 0.61 0.61 0.59 0.62 0.59 0.60 0.62 0.59 0.59 0.61 0.59 0.59 0.66 0.66 0.59 0.59 0.58 0.65 0.65 0.64 0.60 0.58 0.58 0.59 0.59 0.59 0.60 0.59 0.59 0.60 0.60 0.61 0.61 0.57 0.60 0.59 0.59 0.57 0.60 0.61 0.59 0.61 0.60 0.59 0.56 AB037926 Torque teno virus 14

1.00 0.67 0.66 0.61 0.63 0.60 0.57 0.57 0.58 0.59 0.58 0.58 0.59 0.57 0.57 0.56 0.58 0.61 0.57 0.57 0.58 0.60 0.58 0.59 0.57 0.60 0.57 0.57 0.59 0.60 0.57 0.57 0.59 0.58 0.59 0.62 0.58 0.62 0.60 0.65 0.59 0.59 0.62 0.58 0.58 0.60 0.58 0.60 0.66 0.67 0.59 0.58 0.60 0.66 0.66 0.65 0.58 0.60 0.58 0.58 0.58 0.58 0.59 0.59 0.60 0.59 0.62 0.60 0.58 0.58 0.61 0.61 0.60 0.58 0.58 0.59 0.59 0.60 0.60 0.59 0.61 AX025830 Torque teno virus 17 1.00 0.63 0.62 0.65 0.63 0.62 0.64 0.60 0.61 0.59 0.61 0.60 0.58 0.58 0.60 0.59 0.61 0.61 0.63 0.61 0.61 0.60 0.61 0.62 0.60 0.60 0.60 0.60 0.61 0.62 0.60 0.60 0.59 0.61 0.61 0.61 0.63 0.60 0.59 0.59 0.67 0.61 0.61 0.64 0.60 0.59 0.60 0.59 0.59 0.66 0.66 0.60 0.60 0.59 0.63 0.63 0.63 0.61 0.60 0.59 0.59 0.62 0.60 0.62 0.57 0.61 0.60 0.63 0.59 0.59 0.60 0.59 0.59 0.62 0.60 0.60 0.60 0.59 0.62 0.61 0.59 0.60

AB028668 Torque teno virus 15

1.00 0.66 0.63 0.63 0.66 0.65 0.65 0.62 0.59 0.58 0.59 0.59 0.62 0.59 0.60 0.61 0.59 0.59 0.63 0.60 0.61 0.60 0.62 0.58 0.59 0.60 0.61 0.60 0.61 0.61 0.61 0.59 0.59 0.60 0.60 0.58 0.60 0.64 0.59 0.60 0.59 0.64 0.59 0.59 0.64 0.59 0.59 0.58 0.58 0.59 0.69 0.69 0.59 0.62 0.60 0.66 0.65 0.65 0.60 0.59 0.60 0.61 0.60 0.59 0.60 0.60 0.62 0.62 0.61 0.58 0.57 0.61 0.63 0.61 0.62 0.59 0.60 0.61 0.61 0.62 0.60 0.61 0.59 AB017613 Torque teno virus 16

1.00 0.68 0.65 0.62 0.63 0.62 0.64 0.63 0.63 0.60 0.60 0.59 0.59 0.61 0.61 0.59 0.58 0.59 0.61 0.60 0.61 0.60 0.60 0.60 0.59 0.61 0.59 0.60 0.60 0.60 0.60 0.60 0.61 0.59 0.60 0.60 0.60 0.62 0.66 0.59 0.59 0.60 0.64 0.59 0.59 0.62 0.57 0.57 0.59 0.58 0.60 0.64 0.64 0.60 0.59 0.60 0.64 0.65 0.65 0.59 0.62 0.60 0.59 0.60 0.60 0.61 0.58 0.60 0.61 0.59 0.60 0.58 0.59 0.60 0.60 0.62 0.59 0.60 0.60 0.57 0.61 0.59 0.60 0.59 NC_001427 Chicken anemia virus

1.00 0.60 0.61 0.61 0.61 0.60 0.60 0.61 0.62 0.57 0.56 0.56 0.57 0.59 0.58 0.57 0.57 0.58 0.57 0.56 0.57 0.56 0.55 0.56 0.56 0.58 0.55 0.57 0.58 0.58 0.59 0.57 0.58 0.56 0.57 0.56 0.60 0.56 0.56 0.55 0.56 0.55 0.57 0.59 0.58 0.58 0.59 0.58 0.57 0.58 0.58 0.58 0.60 0.58 0.56 0.57 0.55 0.56 0.58 0.59 0.54 0.59 0.58 0.57 0.56 0.58 0.56 0.56 0.57 0.56 0.58 0.57 0.59 0.60 0.56 0.57 0.59 0.60 0.60 0.59 0.61 0.56 0.62 0.60 0.57 AX025718 Torque teno virus 18

1.00 0.64 0.67 0.65 0.66 0.63 0.62 0.63 0.64 0.63 0.63 0.56 0.57 0.57 0.58 0.58 0.57 0.59 0.57 0.58 0.58 0.60 0.59 0.61 0.57 0.59 0.59 0.58 0.58 0.60 0.58 0.58 0.60 0.58 0.58 0.59 0.59 0.58 0.58 0.60 0.63 0.61 0.61 0.60 0.67 0.58 0.59 0.62 0.58 0.59 0.58 0.58 0.56 0.65 0.66 0.58 0.58 0.56 0.67 0.65 0.66 0.59 0.59 0.60 0.60 0.60 0.60 0.60 0.59 0.58 0.58 0.59 0.58 0.59 0.59 0.60 0.60 0.60 0.59 0.59 0.61 0.59 0.60 0.58 0.58 0.61 AB060594 Torque teno virus 20

1.00 0.64 0.60 0.64 0.63 0.64 0.63 0.61 0.63 0.66 0.62 0.63 0.61 0.60 0.60 0.58 0.58 0.60 0.59 0.59 0.58 0.58 0.60 0.63 0.59 0.60 0.60 0.59 0.60 0.61 0.60 0.59 0.59 0.60 0.58 0.59 0.60 0.61 0.61 0.61 0.60 0.65 0.58 0.64 0.58 0.66 0.60 0.60 0.65 0.61 0.60 0.60 0.60 0.60 0.65 0.66 0.59 0.61 0.59 0.64 0.66 0.64 0.63 0.58 0.59 0.61 0.59 0.61 0.58 0.61 0.60 0.61 0.61 0.56 0.60 0.61 0.60 0.63 0.60 0.59 0.58 0.60 0.58 0.61 0.57 0.58 0.57 AB025946 Torque teno virus 19

1.00 0.65 0.64 0.60 0.64 0.64 0.63 0.63 0.64 0.65 0.66 0.65 0.62 0.59 0.60 0.57 0.57 0.57 0.58 0.58 0.59 0.57 0.58 0.59 0.57 0.57 0.58 0.60 0.57 0.57 0.59 0.58 0.58 0.58 0.58 0.58 0.60 0.59 0.59 0.59 0.59 0.60 0.65 0.58 0.60 0.59 0.64 0.60 0.60 0.62 0.62 0.61 0.61 0.60 0.61 0.66 0.66 0.57 0.61 0.60 0.64 0.65 0.65 0.57 0.59 0.57 0.59 0.60 0.60 0.59 0.60 0.60 0.59 0.61 0.59 0.57 0.59 0.60 0.59 0.60 0.59 0.58 0.59 0.59 0.61 0.59 0.61 0.59 Opossum torque teno virus

1.00 0.71 0.62 0.64 0.57 0.64 0.64 0.65 0.63 0.62 0.63 0.63 0.64 0.62 0.56 0.58 0.59 0.58 0.57 0.59 0.58 0.58 0.59 0.59 0.60 0.58 0.59 0.57 0.59 0.57 0.58 0.57 0.58 0.58 0.59 0.58 0.57 0.58 0.58 0.57 0.59 0.59 0.59 0.61 0.58 0.57 0.57 0.63 0.57 0.57 0.59 0.55 0.56 0.56 0.55 0.55 0.64 0.63 0.57 0.58 0.58 0.63 0.62 0.61 0.57 0.56 0.59 0.58 0.57 0.58 0.59 0.58 0.57 0.58 0.58 0.61 0.59 0.62 0.62 0.58 0.62 0.61 0.57 0.58 0.59 0.57 0.61 0.58 0.58 AF345524 Torque teno virus 11 1.00 0.63 0.61 0.61 0.61 0.59 0.60 0.59 0.61 0.59 0.60 0.61 0.58 0.60 0.61 0.61 0.59 0.59 0.58 0.59 0.58 0.60 0.59 0.57 0.59 0.61 0.59 0.60 0.59 0.59 0.60 0.61 0.59 0.60 0.59 0.60 0.61 0.58 0.60 0.60 0.59 0.60 0.60 0.60 0.64 0.59 0.62 0.59 0.64 0.59 0.59 0.63 0.60 0.60 0.59 0.59 0.59 0.65 0.65 0.57 0.59 0.59 0.66 0.67 0.66 0.60 0.60 0.62 0.59 0.61 0.61 0.61 0.58 0.61 0.60 0.60 0.61 0.60 0.60 0.60 0.61 0.61 0.59 0.60 0.60 0.58 0.62 0.60 0.58 0.59

DQ187006 Torque teno virus 9 1.00 0.67 0.67 0.65 0.66 0.67 0.56 0.67 0.66 0.64 0.63 0.61 0.66 0.65 0.67 0.64 0.60 0.63 0.63 0.64 0.63 0.62 0.64 0.63 0.63 0.62 0.61 0.59 0.64 0.60 0.63 0.62 0.59 0.63 0.63 0.64 0.63 0.62 0.63 0.65 0.65 0.63 0.62 0.62 0.62 0.60 0.61 0.59 0.59 0.60 0.59 0.59 0.55 0.60 0.59 0.60 0.60 0.60 0.56 0.57 0.61 0.62 0.58 0.55 0.57 0.59 0.61 0.61 0.59 0.58 0.60 0.62 0.59 0.60 0.60 0.62 0.63 0.64 0.61 0.63 0.63 0.58 0.59 0.65 0.62 0.60 0.62 0.58 0.63 0.59 0.60 AB064607 Torque teno virus 10

1.00 0.71 0.68 0.61 0.60 0.61 0.60 0.59 0.60 0.61 0.60 0.61 0.58 0.62 0.61 0.61 0.62 0.60 0.58 0.59 0.58 0.61 0.62 0.62 0.58 0.61 0.61 0.59 0.59 0.61 0.60 0.60 0.59 0.62 0.58 0.60 0.61 0.59 0.59 0.58 0.61 0.60 0.60 0.59 0.60 0.59 0.65 0.60 0.62 0.59 0.66 0.58 0.59 0.65 0.59 0.59 0.61 0.60 0.58 0.65 0.65 0.60 0.59 0.60 0.65 0.65 0.66 0.60 0.62 0.59 0.57 0.59 0.58 0.59 0.62 0.59 0.59 0.60 0.58 0.60 0.59 0.59 0.61 0.61 0.60 0.59 0.59 0.59 0.61 0.59 0.59 0.58 AB064605 Torque teno virus 12

1.00 0.69 0.70 0.68 0.62 0.60 0.61 0.61 0.59 0.60 0.61 0.62 0.62 0.60 0.63 0.62 0.61 0.61 0.59 0.59 0.61 0.59 0.61 0.59 0.61 0.60 0.60 0.60 0.62 0.59 0.60 0.59 0.59 0.59 0.60 0.62 0.60 0.60 0.58 0.59 0.59 0.58 0.60 0.60 0.61 0.58 0.61 0.63 0.60 0.61 0.60 0.64 0.58 0.58 0.62 0.58 0.59 0.59 0.57 0.58 0.65 0.65 0.57 0.59 0.59 0.63 0.64 0.63 0.60 0.59 0.59 0.59 0.59 0.61 0.60 0.60 0.60 0.61 0.61 0.60 0.59 0.58 0.60 0.62 0.60 0.60 0.61 0.60 0.58 0.61 0.58 0.58 0.59 KJ194633 Rodent Torque teno virus 1 - MG ML211 Li1

1.00 0.65 0.62 0.60 0.65 0.61 0.62 0.63 0.62 0.54 0.63 0.64 0.64 0.62 0.66 0.64 0.63 0.64 0.64 0.61 0.63 0.64 0.63 0.63 0.63 0.64 0.62 0.64 0.62 0.62 0.61 0.62 0.62 0.63 0.63 0.60 0.61 0.67 0.64 0.63 0.62 0.66 0.63 0.63 0.65 0.62 0.63 0.65 0.62 0.62 0.62 0.61 0.60 0.59 0.61 0.58 0.62 0.63 0.61 0.61 0.60 0.58 0.57 0.60 0.60 0.60 0.59 0.58 0.59 0.61 0.62 0.63 0.59 0.62 0.62 0.60 0.59 0.59 0.62 0.62 0.61 0.64 0.62 0.64 0.61 0.61 0.63 0.59 0.60 0.62 0.59 0.62 0.64 0.59 KJ194630 Rodent Torque teno virus 1 - MA ML89 Li4

1.00 0.72 0.67 0.65 0.59 0.67 0.64 0.62 0.63 0.63 0.58 0.62 0.64 0.64 0.64 0.63 0.64 0.63 0.66 0.63 0.61 0.61 0.64 0.62 0.62 0.62 0.60 0.64 0.64 0.63 0.64 0.62 0.63 0.63 0.63 0.63 0.60 0.63 0.63 0.65 0.62 0.63 0.63 0.63 0.63 0.65 0.63 0.63 0.64 0.64 0.62 0.63 0.62 0.60 0.60 0.62 0.56 0.60 0.60 0.61 0.61 0.60 0.56 0.57 0.61 0.60 0.62 0.54 0.59 0.55 0.63 0.61 0.62 0.60 0.61 0.62 0.61 0.62 0.64 0.61 0.61 0.61 0.62 0.63 0.61 0.60 0.60 0.62 0.61 0.61 0.62 0.58 0.60 0.64 0.61 KJ194631 Rodent Torque teno virus 1 - MA ML89 Li1

1.00 0.82 0.74 0.65 0.65 0.58 0.66 0.62 0.64 0.65 0.63 0.60 0.65 0.64 0.63 0.61 0.63 0.63 0.64 0.66 0.65 0.62 0.61 0.64 0.61 0.62 0.62 0.62 0.61 0.63 0.64 0.62 0.61 0.63 0.62 0.64 0.66 0.63 0.61 0.64 0.65 0.63 0.63 0.63 0.63 0.62 0.61 0.63 0.63 0.66 0.63 0.65 0.62 0.62 0.59 0.60 0.61 0.59 0.61 0.61 0.61 0.61 0.60 0.60 0.60 0.62 0.60 0.61 0.58 0.59 0.58 0.63 0.63 0.64 0.63 0.62 0.62 0.62 0.61 0.64 0.61 0.61 0.62 0.64 0.61 0.60 0.60 0.62 0.61 0.62 0.61 0.62 0.60 0.62 0.63 0.59 KJ194619 Rodent Torque teno virus 1 - AS WM1 Se2 1.00 0.71 0.73 0.69 0.63 0.64 0.60 0.64 0.62 0.60 0.63 0.63 0.55 0.63 0.62 0.63 0.63 0.63 0.64 0.65 0.64 0.63 0.61 0.62 0.61 0.61 0.61 0.59 0.60 0.62 0.59 0.63 0.63 0.64 0.61 0.61 0.63 0.64 0.60 0.60 0.62 0.62 0.62 0.61 0.62 0.63 0.62 0.62 0.62 0.61 0.62 0.62 0.60 0.59 0.62 0.63 0.61 0.62 0.57 0.62 0.61 0.64 0.61 0.59 0.57 0.54 0.61 0.64 0.61 0.57 0.56 0.57 0.61 0.65 0.61 0.61 0.59 0.62 0.63 0.57 0.60 0.59 0.59 0.63 0.62 0.62 0.59 0.59 0.61 0.61 0.61 0.59 0.61 0.56 0.60 0.59 0.60

KJ194623 Rodent Torque teno virus 1 - AS 1012 Sp1 1.00 0.83 0.70 0.72 0.70 0.63 0.64 0.58 0.63 0.62 0.61 0.62 0.62 0.57 0.64 0.64 0.63 0.65 0.60 0.65 0.60 0.64 0.63 0.62 0.61 0.61 0.61 0.60 0.62 0.62 0.63 0.61 0.60 0.62 0.63 0.60 0.63 0.64 0.64 0.60 0.61 0.64 0.62 0.60 0.61 0.61 0.62 0.62 0.63 0.63 0.63 0.62 0.62 0.63 0.58 0.60 0.60 0.64 0.64 0.58 0.63 0.63 0.63 0.64 0.57 0.56 0.57 0.60 0.64 0.63 0.53 0.54 0.56 0.61 0.63 0.61 0.62 0.61 0.63 0.63 0.61 0.62 0.62 0.60 0.60 0.61 0.64 0.61 0.59 0.61 0.61 0.62 0.59 0.62 0.59 0.61 0.63 0.59 KJ194625 Rodent Torque teno virus 1 - AS 1014 Fae2

1.00 0.83 0.83 0.70 0.71 0.68 0.64 0.65 0.61 0.63 0.61 0.63 0.63 0.62 0.56 0.64 0.62 0.62 0.63 0.60 0.64 0.63 0.63 0.63 0.60 0.62 0.59 0.60 0.60 0.63 0.59 0.61 0.59 0.59 0.62 0.63 0.61 0.61 0.63 0.61 0.59 0.61 0.62 0.63 0.62 0.63 0.63 0.63 0.60 0.63 0.62 0.62 0.63 0.62 0.62 0.61 0.61 0.59 0.60 0.61 0.57 0.60 0.61 0.62 0.62 0.60 0.58 0.56 0.62 0.63 0.62 0.55 0.58 0.58 0.61 0.64 0.62 0.61 0.60 0.60 0.62 0.61 0.61 0.59 0.57 0.61 0.61 0.63 0.60 0.61 0.61 0.61 0.60 0.58 0.61 0.56 0.62 0.63 0.60 AF435014 Torque teno virus 6

1.00 0.63 0.65 0.62 0.65 0.65 0.64 0.61 0.62 0.66 0.61 0.62 0.59 0.61 0.60 0.59 0.61 0.59 0.63 0.60 0.59 0.60 0.60 0.60 0.61 0.59 0.58 0.60 0.57 0.58 0.61 0.60 0.60 0.57 0.59 0.59 0.63 0.60 0.58 0.61 0.61 0.59 0.58 0.60 0.60 0.57 0.58 0.59 0.58 0.61 0.58 0.61 0.59 0.61 0.64 0.60 0.61 0.59 0.64 0.60 0.61 0.63 0.59 0.59 0.61 0.59 0.60 0.66 0.66 0.58 0.60 0.61 0.65 0.64 0.65 0.62 0.58 0.59 0.59 0.58 0.59 0.59 0.59 0.62 0.60 0.61 0.58 0.59 0.59 0.59 0.61 0.61 0.60 0.59 0.60 0.59 0.60 0.58 0.58 0.60 DQ361268 Torque teno virus ViPi04

1.00 0.64 0.65 0.65 0.65 0.64 0.66 0.63 0.63 0.62 0.66 0.61 0.62 0.61 0.61 0.61 0.60 0.63 0.61 0.62 0.58 0.59 0.61 0.62 0.61 0.61 0.61 0.59 0.62 0.59 0.59 0.59 0.61 0.59 0.61 0.59 0.61 0.61 0.61 0.60 0.60 0.62 0.63 0.62 0.59 0.61 0.59 0.61 0.61 0.60 0.62 0.61 0.59 0.59 0.62 0.64 0.61 0.60 0.59 0.65 0.60 0.58 0.64 0.58 0.59 0.58 0.58 0.58 0.64 0.65 0.60 0.60 0.58 0.64 0.64 0.64 0.60 0.60 0.61 0.61 0.60 0.59 0.62 0.60 0.60 0.61 0.62 0.59 0.59 0.60 0.60 0.61 0.59 0.59 0.58 0.57 0.58 0.61 0.60 0.58 0.59 AF261761 Torque teno virus 7

1.00 0.69 0.66 0.62 0.65 0.64 0.63 0.63 0.61 0.62 0.62 0.68 0.62 0.62 0.61 0.62 0.60 0.58 0.61 0.61 0.61 0.61 0.59 0.60 0.60 0.59 0.63 0.61 0.60 0.60 0.58 0.59 0.59 0.61 0.60 0.58 0.61 0.62 0.59 0.60 0.61 0.61 0.61 0.61 0.59 0.61 0.59 0.61 0.58 0.59 0.60 0.58 0.59 0.59 0.61 0.62 0.66 0.61 0.62 0.60 0.66 0.61 0.60 0.64 0.59 0.59 0.60 0.60 0.59 0.67 0.67 0.60 0.59 0.57 0.65 0.66 0.66 0.59 0.58 0.58 0.60 0.59 0.60 0.59 0.60 0.62 0.62 0.61 0.58 0.59 0.59 0.59 0.60 0.60 0.59 0.58 0.62 0.58 0.61 0.59 0.58 0.60 AB054647 Torque teno virus 8

1.00 0.69 0.66 0.64 0.62 0.63 0.64 0.64 0.64 0.64 0.60 0.63 0.69 0.62 0.61 0.63 0.59 0.59 0.60 0.62 0.61 0.62 0.62 0.61 0.62 0.62 0.62 0.61 0.58 0.57 0.59 0.60 0.58 0.60 0.61 0.58 0.59 0.58 0.57 0.60 0.60 0.59 0.60 0.61 0.61 0.60 0.60 0.58 0.58 0.59 0.59 0.61 0.60 0.60 0.59 0.59 0.61 0.65 0.61 0.59 0.61 0.67 0.57 0.58 0.64 0.59 0.59 0.57 0.57 0.58 0.67 0.66 0.58 0.61 0.59 0.63 0.63 0.64 0.60 0.59 0.58 0.60 0.60 0.60 0.59 0.58 0.59 0.62 0.61 0.60 0.57 0.61 0.57 0.58 0.59 0.60 0.60 0.59 0.59 0.62 0.59 0.59 0.60 AB041957 Torque teno virus 4 1.00 0.63 0.63 0.62 0.62 0.60 0.64 0.60 0.63 0.65 0.62 0.62 0.62 0.66 0.61 0.62 0.60 0.61 0.63 0.59 0.63 0.62 0.62 0.62 0.61 0.63 0.63 0.64 0.61 0.59 0.59 0.58 0.60 0.57 0.57 0.58 0.58 0.60 0.60 0.57 0.59 0.57 0.58 0.60 0.59 0.61 0.58 0.60 0.60 0.59 0.58 0.59 0.58 0.59 0.62 0.61 0.57 0.59 0.63 0.58 0.58 0.59 0.65 0.57 0.58 0.64 0.59 0.58 0.57 0.58 0.58 0.64 0.63 0.60 0.61 0.58 0.64 0.66 0.64 0.59 0.59 0.58 0.60 0.60 0.60 0.61 0.56 0.60 0.60 0.60 0.60 0.59 0.60 0.59 0.61 0.59 0.62 0.59 0.60 0.59 0.62 0.59 0.60 0.60

AF345523 Torque teno virus 5

1.00 0.63 0.63 0.62 0.63 0.62 0.59 0.61 0.59 0.58 0.60 0.58 0.62 0.61 0.57 0.61 0.58 0.61 0.61 0.62 0.58 0.64 0.62 0.64 0.63 0.60 0.61 0.62 0.60 0.61 0.61 0.60 0.62 0.59 0.62 0.61 0.57 0.59 0.61 0.60 0.60 0.57 0.60 0.60 0.60 0.62 0.56 0.56 0.59 0.62 0.61 0.60 0.60 0.60 0.61 0.61 0.60 0.60 0.61 0.60 0.59 0.60 0.57 0.61 0.55 0.57 0.61 0.59 0.58 0.57 0.57 0.58 0.63 0.64 0.59 0.58 0.61 0.64 0.64 0.64 0.57 0.58 0.58 0.58 0.60 0.57 0.58 0.56 0.58 0.60 0.60 0.59 0.57 0.57 0.61 0.62 0.62 0.62 0.61 0.59 0.60 0.57 0.60 0.60 0.58 AB049608 Torque teno virus 2

1.00 0.66 0.68 0.62 0.61 0.60 0.62 0.61 0.62 0.63 0.61 0.63 0.63 0.61 0.60 0.65 0.61 0.62 0.62 0.62 0.61 0.63 0.62 0.61 0.60 0.62 0.62 0.62 0.62 0.62 0.60 0.56 0.58 0.57 0.59 0.59 0.58 0.57 0.57 0.57 0.59 0.59 0.61 0.59 0.57 0.58 0.58 0.59 0.59 0.59 0.57 0.59 0.58 0.60 0.57 0.59 0.58 0.59 0.58 0.59 0.62 0.59 0.61 0.60 0.67 0.58 0.60 0.62 0.58 0.59 0.59 0.58 0.58 0.65 0.66 0.58 0.60 0.58 0.63 0.62 0.63 0.58 0.59 0.58 0.58 0.59 0.59 0.60 0.59 0.60 0.60 0.59 0.60 0.59 0.59 0.60 0.59 0.61 0.63 0.61 0.61 0.62 0.60 0.60 0.60 0.59 AY666122 Torque teno virus 3

1.00 0.69 0.67 0.65 0.63 0.62 0.63 0.64 0.61 0.63 0.64 0.62 0.63 0.65 0.63 0.63 0.65 0.61 0.63 0.63 0.60 0.64 0.59 0.61 0.61 0.61 0.62 0.61 0.63 0.63 0.60 0.61 0.57 0.58 0.58 0.59 0.58 0.58 0.59 0.58 0.60 0.59 0.59 0.60 0.62 0.59 0.58 0.59 0.59 0.61 0.60 0.61 0.59 0.60 0.61 0.59 0.60 0.58 0.59 0.59 0.59 0.64 0.57 0.62 0.59 0.64 0.57 0.58 0.64 0.58 0.58 0.58 0.57 0.58 0.63 0.64 0.59 0.61 0.60 0.66 0.64 0.63 0.60 0.62 0.61 0.60 0.60 0.60 0.60 0.60 0.60 0.63 0.61 0.62 0.60 0.60 0.59 0.60 0.60 0.62 0.59 0.60 0.58 0.61 0.60 0.60 0.59 AB008394 Torque teno virus 1

1.00 0.68 0.66 0.65 0.64 0.62 0.61 0.61 0.63 0.63 0.65 0.63 0.64 0.65 0.64 0.61 0.61 0.65 0.61 0.59 0.59 0.61 0.61 0.59 0.62 0.59 0.62 0.60 0.60 0.60 0.61 0.60 0.61 0.59 0.60 0.61 0.58 0.60 0.59 0.60 0.61 0.60 0.60 0.59 0.61 0.62 0.59 0.60 0.62 0.63 0.61 0.62 0.62 0.61 0.61 0.63 0.60 0.62 0.61 0.62 0.62 0.61 0.65 0.60 0.61 0.59 0.69 0.60 0.60 0.63 0.59 0.59 0.60 0.60 0.60 0.64 0.65 0.62 0.60 0.61 0.65 0.67 0.66 0.60 0.59 0.60 0.61 0.59 0.59 0.59 0.60 0.60 0.60 0.61 0.59 0.61 0.59 0.59 0.60 0.60 0.58 0.59 0.58 0.59 0.62 0.58 0.59 0.60 KR902501 Torque teno equus virus 1

1.00 0.60 0.60 0.57 0.57 0.60 0.59 0.59 0.59 0.58 0.62 0.62 0.61 0.63 0.61 0.63 0.59 0.59 0.63 0.58 0.57 0.58 0.58 0.59 0.58 0.60 0.60 0.58 0.58 0.55 0.60 0.58 0.60 0.59 0.58 0.59 0.61 0.57 0.60 0.57 0.60 0.59 0.58 0.58 0.60 0.63 0.58 0.59 0.57 0.59 0.57 0.58 0.57 0.58 0.58 0.59 0.59 0.58 0.59 0.59 0.59 0.59 0.57 0.62 0.60 0.59 0.57 0.63 0.59 0.59 0.61 0.59 0.58 0.59 0.59 0.58 0.65 0.66 0.57 0.60 0.60 0.63 0.64 0.62 0.59 0.60 0.61 0.58 0.59 0.59 0.59 0.59 0.59 0.59 0.59 0.58 0.58 0.59 0.59 0.58 0.58 0.58 0.57 0.60 0.58 0.59 0.60 0.61 0.57 HQ335082 Mosquito VEM Anellovirus SDBVL A

1.00 0.64 0.61 0.60 0.61 0.57 0.62 0.62 0.62 0.60 0.63 0.59 0.59 0.61 0.60 0.59 0.58 0.62 0.61 0.56 0.61 0.63 0.61 0.61 0.63 0.59 0.61 0.62 0.61 0.61 0.59 0.62 0.62 0.63 0.62 0.60 0.61 0.61 0.62 0.58 0.61 0.59 0.60 0.60 0.60 0.61 0.60 0.60 0.60 0.59 0.61 0.61 0.61 0.62 0.60 0.60 0.61 0.60 0.61 0.59 0.60 0.61 0.59 0.63 0.58 0.61 0.60 0.62 0.58 0.61 0.61 0.57 0.61 0.61 0.62 0.60 0.57 0.58 0.58 0.61 0.59 0.60 0.57 0.58 0.55 0.60 0.61 0.60 0.59 0.60 0.61 0.58 0.57 0.59 0.62 0.60 0.63 0.58 0.62 0.59 0.58 0.59 0.62 0.60 0.59 0.64 0.58 0.63 0.62 0.60 EF538877 Torque teno felis virus 2

1.00 0.59 0.64 0.62 0.63 0.62 0.58 0.63 0.62 0.63 0.63 0.61 0.57 0.59 0.56 0.56 0.55 0.59 0.62 0.64 0.61 0.63 0.58 0.62 0.61 0.64 0.56 0.63 0.62 0.61 0.61 0.59 0.62 0.62 0.62 0.64 0.59 0.63 0.60 0.59 0.60 0.61 0.61 0.61 0.60 0.60 0.59 0.57 0.57 0.58 0.61 0.59 0.61 0.60 0.63 0.61 0.62 0.63 0.63 0.62 0.61 0.61 0.60 0.59 0.61 0.58 0.60 0.63 0.59 0.59 0.59 0.59 0.57 0.61 0.60 0.60 0.59 0.57 0.57 0.58 0.59 0.59 0.60 0.60 0.60 0.60 0.59 0.63 0.58 0.60 0.57 0.58 0.59 0.59 0.58 0.58 0.59 0.61 0.60 0.63 0.59 0.59 0.62 0.63 0.62 0.61 0.62 0.60 0.61 0.64 0.60 AY823990 Torque teno sus virus 1b

1.00 0.65 0.63 0.61 0.59 0.58 0.58 0.57 0.60 0.59 0.59 0.59 0.58 0.60 0.62 0.61 0.61 0.62 0.62 0.60 0.60 0.61 0.59 0.58 0.57 0.58 0.59 0.59 0.59 0.59 0.59 0.58 0.61 0.59 0.58 0.57 0.59 0.58 0.58 0.60 0.59 0.57 0.59 0.59 0.59 0.59 0.58 0.57 0.60 0.57 0.58 0.58 0.58 0.58 0.58 0.57 0.59 0.58 0.58 0.57 0.58 0.57 0.58 0.60 0.59 0.57 0.61 0.58 0.60 0.57 0.62 0.59 0.59 0.63 0.59 0.59 0.59 0.59 0.58 0.61 0.66 0.59 0.60 0.59 0.60 0.61 0.63 0.60 0.59 0.62 0.59 0.61 0.61 0.58 0.57 0.61 0.60 0.61 0.57 0.58 0.59 0.56 0.57 0.59 0.58 0.59 0.56 0.58 0.58 0.58 0.58 0.57 AB076001 Torque teno sus virus 1a 1.00 0.65 0.60 0.62 0.58 0.60 0.58 0.57 0.62 0.58 0.59 0.59 0.57 0.59 0.61 0.61 0.60 0.62 0.62 0.62 0.58 0.58 0.61 0.58 0.59 0.58 0.60 0.59 0.58 0.61 0.57 0.57 0.58 0.57 0.59 0.57 0.59 0.57 0.59 0.59 0.58 0.58 0.58 0.59 0.59 0.59 0.60 0.58 0.56 0.61 0.58 0.58 0.58 0.58 0.57 0.57 0.58 0.57 0.59 0.58 0.57 0.59 0.57 0.56 0.57 0.60 0.59 0.61 0.57 0.58 0.59 0.63 0.61 0.61 0.62 0.60 0.60 0.62 0.62 0.62 0.64 0.63 0.58 0.60 0.61 0.60 0.61 0.62 0.58 0.58 0.58 0.58 0.59 0.60 0.61 0.58 0.60 0.58 0.58 0.59 0.58 0.61 0.58 0.56 0.57 0.59 0.58 0.57 0.58 0.59 0.59 0.60 0.58

JN704611 Pine marten torque teno virus 1.00 0.58 0.60 0.58 0.63 0.59 0.59 0.62 0.60 0.59 0.60 0.59 0.60 0.60 0.60 0.58 0.59 0.61 0.61 0.58 0.60 0.60 0.60 0.59 0.61 0.58 0.60 0.61 0.59 0.56 0.59 0.60 0.59 0.59 0.62 0.60 0.60 0.60 0.63 0.59 0.58 0.60 0.58 0.60 0.56 0.57 0.58 0.60 0.57 0.58 0.59 0.58 0.56 0.59 0.58 0.57 0.59 0.57 0.58 0.57 0.58 0.58 0.59 0.61 0.59 0.58 0.58 0.57 0.60 0.59 0.58 0.59 0.63 0.57 0.57 0.61 0.58 0.58 0.58 0.58 0.59 0.66 0.65 0.57 0.58 0.57 0.63 0.63 0.62 0.57 0.60 0.59 0.59 0.59 0.59 0.58 0.58 0.59 0.60 0.61 0.59 0.61 0.59 0.57 0.58 0.58 0.59 0.60 0.59 0.60 0.58 0.61 0.59 0.58 NC_026663 Simian torque teno virus 30

1.00 0.62 0.59 0.60 0.63 0.61 0.60 0.60 0.59 0.60 0.62 0.60 0.58 0.59 0.59 0.58 0.61 0.64 0.63 0.65 0.64 0.64 0.60 0.59 0.61 0.59 0.60 0.59 0.58 0.58 0.60 0.60 0.60 0.62 0.61 0.61 0.58 0.60 0.57 0.59 0.59 0.57 0.58 0.59 0.58 0.58 0.59 0.57 0.57 0.58 0.59 0.58 0.59 0.62 0.59 0.57 0.58 0.59 0.58 0.60 0.58 0.58 0.58 0.58 0.60 0.59 0.59 0.60 0.59 0.64 0.58 0.60 0.60 0.65 0.58 0.57 0.62 0.58 0.58 0.58 0.58 0.58 0.64 0.63 0.58 0.60 0.59 0.66 0.66 0.65 0.59 0.59 0.59 0.58 0.60 0.59 0.60 0.59 0.60 0.60 0.60 0.61 0.59 0.60 0.61 0.58 0.60 0.61 0.59 0.61 0.59 0.61 0.58 0.59 0.60 NC_024891 Seal anellovirus 2

1.00 0.60 0.59 0.61 0.58 0.59 0.58 0.62 0.63 0.61 0.62 0.58 0.62 0.62 0.62 0.62 0.61 0.60 0.59 0.61 0.58 0.58 0.63 0.61 0.60 0.56 0.60 0.57 0.61 0.61 0.62 0.55 0.60 0.62 0.61 0.61 0.60 0.60 0.63 0.62 0.61 0.59 0.62 0.62 0.59 0.58 0.59 0.60 0.59 0.60 0.57 0.60 0.61 0.63 0.61 0.60 0.58 0.58 0.61 0.60 0.60 0.61 0.61 0.61 0.63 0.60 0.59 0.57 0.62 0.61 0.60 0.59 0.58 0.59 0.60 0.60 0.60 0.62 0.61 0.60 0.60 0.61 0.60 0.61 0.60 0.60 0.60 0.59 0.61 0.59 0.58 0.60 0.61 0.59 0.59 0.58 0.61 0.61 0.57 0.61 0.60 0.60 0.61 0.61 0.61 0.58 0.60 0.60 0.61 0.60 0.57 0.61 0.62 0.60 0.62 0.57 NC_015212 Seal anellovirus

1.00 0.65 0.61 0.61 0.60 0.60 0.63 0.56 0.59 0.64 0.60 0.59 0.59 0.58 0.61 0.63 0.60 0.61 0.62 0.62 0.61 0.60 0.60 0.61 0.60 0.62 0.59 0.60 0.59 0.62 0.61 0.62 0.57 0.59 0.62 0.59 0.60 0.60 0.61 0.60 0.61 0.61 0.60 0.60 0.61 0.62 0.62 0.59 0.59 0.60 0.59 0.60 0.58 0.60 0.59 0.60 0.61 0.60 0.58 0.60 0.61 0.59 0.61 0.59 0.61 0.62 0.59 0.60 0.60 0.61 0.61 0.61 0.61 0.56 0.59 0.59 0.61 0.58 0.59 0.58 0.58 0.59 0.61 0.61 0.64 0.65 0.60 0.61 0.59 0.60 0.60 0.60 0.61 0.62 0.62 0.58 0.60 0.59 0.61 0.61 0.59 0.60 0.62 0.61 0.59 0.61 0.58 0.60 0.62 0.61 0.60 0.60 0.60 0.63 0.62 0.60 0.58 FJ459582 Torque teno zalophus virus 1

1.00 0.62 0.63 0.61 0.59 0.60 0.60 0.61 0.60 0.58 0.61 0.60 0.60 0.58 0.59 0.62 0.61 0.60 0.62 0.62 0.60 0.61 0.61 0.59 0.58 0.61 0.64 0.61 0.63 0.60 0.61 0.62 0.60 0.57 0.64 0.61 0.61 0.62 0.59 0.61 0.62 0.63 0.61 0.61 0.60 0.61 0.61 0.61 0.59 0.61 0.62 0.59 0.60 0.60 0.60 0.61 0.59 0.61 0.60 0.60 0.59 0.60 0.60 0.60 0.64 0.60 0.60 0.62 0.63 0.60 0.63 0.62 0.61 0.62 0.56 0.59 0.62 0.59 0.59 0.61 0.59 0.59 0.59 0.60 0.59 0.59 0.61 0.60 0.60 0.61 0.61 0.62 0.60 0.59 0.60 0.59 0.59 0.61 0.61 0.58 0.58 0.58 0.61 0.60 0.60 0.58 0.62 0.61 0.60 0.60 0.62 0.63 0.58 0.61 0.60 0.60 0.59 0.58 KM668485 Rodent Torque teno virus 2 - RN 5 Se5

1.00 0.62 0.61 0.61 0.59 0.59 0.60 0.60 0.61 0.59 0.62 0.60 0.60 0.61 0.58 0.59 0.60 0.60 0.60 0.60 0.60 0.62 0.61 0.62 0.63 0.60 0.59 0.59 0.59 0.58 0.56 0.61 0.59 0.60 0.55 0.59 0.62 0.60 0.59 0.60 0.59 0.58 0.61 0.60 0.60 0.58 0.58 0.57 0.59 0.59 0.59 0.58 0.60 0.57 0.57 0.60 0.60 0.59 0.60 0.59 0.58 0.60 0.60 0.59 0.61 0.59 0.60 0.59 0.62 0.59 0.57 0.59 0.59 0.63 0.58 0.59 0.61 0.68 0.62 0.62 0.62 0.62 0.62 0.61 0.62 0.60 0.67 0.67 0.63 0.61 0.62 0.65 0.66 0.64 0.62 0.62 0.62 0.63 0.62 0.61 0.60 0.60 0.58 0.59 0.60 0.58 0.61 0.58 0.58 0.58 0.57 0.59 0.58 0.56 0.60 0.61 0.58 0.57 0.60 KM609325 Rodent Torque teno virus 2 - RN8 Se11 1.00 0.91 0.63 0.60 0.63 0.59 0.59 0.58 0.57 0.62 0.60 0.60 0.60 0.60 0.60 0.55 0.61 0.59 0.61 0.59 0.59 0.61 0.61 0.61 0.63 0.60 0.61 0.59 0.59 0.58 0.60 0.59 0.61 0.58 0.59 0.56 0.59 0.63 0.59 0.59 0.57 0.58 0.59 0.60 0.59 0.60 0.59 0.57 0.60 0.60 0.58 0.58 0.57 0.57 0.57 0.59 0.60 0.60 0.59 0.60 0.60 0.58 0.60 0.60 0.60 0.59 0.59 0.61 0.60 0.59 0.59 0.58 0.59 0.58 0.60 0.59 0.59 0.60 0.66 0.61 0.61 0.59 0.62 0.61 0.60 0.60 0.60 0.68 0.68 0.61 0.60 0.61 0.63 0.66 0.63 0.61 0.62 0.62 0.61 0.61 0.60 0.60 0.58 0.58 0.59 0.59 0.57 0.60 0.58 0.58 0.59 0.58 0.61 0.58 0.57 0.58 0.63 0.60 0.58 0.59

NC_025966 Rodent Torque teno virus 2 - RN2 Se15 1.00 0.99 0.92 0.63 0.60 0.62 0.59 0.59 0.59 0.59 0.62 0.62 0.60 0.59 0.62 0.60 0.55 0.61 0.60 0.59 0.59 0.58 0.59 0.60 0.60 0.62 0.59 0.60 0.60 0.59 0.57 0.60 0.58 0.61 0.59 0.58 0.55 0.59 0.58 0.59 0.60 0.57 0.59 0.58 0.61 0.59 0.60 0.60 0.57 0.60 0.58 0.57 0.59 0.58 0.57 0.57 0.58 0.61 0.60 0.61 0.60 0.60 0.58 0.60 0.59 0.59 0.59 0.59 0.62 0.59 0.61 0.59 0.59 0.59 0.58 0.61 0.58 0.58 0.60 0.66 0.60 0.60 0.59 0.60 0.60 0.59 0.60 0.60 0.66 0.66 0.61 0.60 0.61 0.66 0.66 0.63 0.61 0.61 0.61 0.62 0.61 0.60 0.59 0.57 0.58 0.59 0.59 0.58 0.61 0.58 0.57 0.58 0.57 0.59 0.57 0.58 0.58 0.63 0.59 0.58 0.58 AB076003 Torque teno felis virus

1.00 0.59 0.59 0.59 0.61 0.64 0.59 0.61 0.59 0.59 0.60 0.60 0.57 0.60 0.62 0.59 0.60 0.57 0.62 0.61 0.60 0.60 0.63 0.57 0.55 0.58 0.61 0.60 0.58 0.61 0.60 0.53 0.59 0.59 0.63 0.61 0.60 0.59 0.60 0.61 0.63 0.61 0.58 0.62 0.62 0.63 0.59 0.58 0.58 0.59 0.59 0.57 0.58 0.58 0.58 0.59 0.57 0.58 0.58 0.60 0.55 0.59 0.60 0.58 0.60 0.60 0.60 0.58 0.57 0.59 0.59 0.59 0.60 0.56 0.59 0.58 0.55 0.59 0.59 0.59 0.62 0.60 0.60 0.54 0.59 0.60 0.59 0.59 0.60 0.61 0.57 0.58 0.59 0.58 0.61 0.62 0.59 0.57 0.58 0.59 0.58 0.58 0.58 0.58 0.57 0.61 0.59 0.57 0.62 0.59 0.60 0.58 0.58 0.59 0.61 0.61 0.59 0.62 0.59 0.63 0.62 0.57 AB041961 Torque teno douroucouli virus

1.00 0.63 0.58 0.60 0.58 0.60 0.59 0.60 0.59 0.59 0.58 0.59 0.62 0.59 0.57 0.58 0.58 0.59 0.56 0.56 0.56 0.57 0.57 0.57 0.64 0.61 0.61 0.61 0.61 0.60 0.58 0.59 0.60 0.58 0.57 0.59 0.59 0.60 0.60 0.58 0.59 0.59 0.58 0.59 0.58 0.59 0.59 0.57 0.56 0.55 0.56 0.57 0.55 0.55 0.56 0.55 0.59 0.55 0.56 0.58 0.57 0.53 0.56 0.56 0.58 0.54 0.54 0.55 0.55 0.57 0.55 0.55 0.56 0.56 0.55 0.57 0.56 0.62 0.56 0.59 0.58 0.65 0.60 0.59 0.61 0.59 0.59 0.59 0.58 0.59 0.64 0.66 0.58 0.59 0.57 0.62 0.64 0.62 0.60 0.59 0.60 0.60 0.60 0.59 0.59 0.58 0.58 0.58 0.58 0.57 0.57 0.58 0.57 0.58 0.55 0.56 0.57 0.57 0.59 0.60 0.58 0.58 0.57

AB041961 Torque teno douroucouli virus AB076003 Torque teno felis virus NC_025966 Rodent Torque teno virus 2 - RN2 Se15 KM609325 Rodent Torque teno virus 2 - RN8 Se11 KM668485 Rodent Torque teno virus 2 - RN 5 Se5 FJ459582 Torque teno zalophus virus 1 NC_015212 Seal anellovirus NC_024891 Seal anellovirus 2 NC_026663 Simian torque teno virus 30 JN704611 Pine marten torque teno virus AB076001 Torque teno sus virus 1a AY823990 Torque teno sus virus 1b EF538877 Torque teno felis virus 2 HQ335082 Mosquito VEM Anellovirus SDBVL A KR902501 Torque teno equus virus 1 AB008394 Torque teno virus 1 AY666122 Torque teno virus 3 AB049608 Torque teno virus 2 AF345523 Torque teno virus 5 AB041957 Torque teno virus 4 AB054647 Torque teno virus 8 AF261761 Torque teno virus 7 DQ361268 Torque teno virus ViPi04 AF435014 Torque teno virus 6 KJ194625 Rodent Torque teno virus 1 - AS 1014 Fae2 KJ194623 Rodent Torque teno virus 1 - AS 1012 Sp1 KJ194619 Rodent Torque teno virus 1 - AS WM1 Se2 KJ194631 Rodent Torque teno virus 1 - MA ML89 Li1 KJ194630 Rodent Torque teno virus 1 - MA ML89 Li4 KJ194633 Rodent Torque teno virus 1 - MG ML211 Li1 AB064605 Torque teno virus 12 AB064607 Torque teno virus 10 DQ187006 Torque teno virus 9 AF345524 Torque teno virus 11 Opossum torque teno virus AB025946 Torque teno virus 19 AB060594 Torque teno virus 20 AX025718 Torque teno virus 18 NC_001427 Chicken anemia virus AB017613 Torque teno virus 16 AB028668 Torque teno virus 15 AX025830 Torque teno virus 17 AB037926 Torque teno virus 14 AF345526 Torque teno virus 13 AB049607 Torque teno virus 23 AB060597 Torque teno virus 24 AX174942 Torque teno virus 22 AF348409 Torque teno virus 21 AB026929 Torque teno mini virus 6 EF538882 Torque teno mini virus 12 AB038631 Torque teno mini virus 9 AF291073 Torque teno mini virus 8 AB026931 Torque teno mini virus 1 AB038629 Torque teno mini virus 2 AB038630 Torque teno mini virus 3 AB038627 Torque teno mini virus 7 AB041963 Torque teno mini virus 4 KF76470 Torque teno mini virus D11 NC_020498 Torque teno mini virus LY1 Rodent Torque teno virus 8 EF538880 Torque teno mini virus 10 AB041962 Torque teno mini virus 5 EF538881 Torque teno mini virus 11 AB290918 Torque teno midi virus 1 EF538875 Torque teno midi virus 3 EF538876 Torque teno midi virus 4 AB290919 Torque teno midi virus 2 AB303564 Torque teno midi virus 13 AB303552 Torque teno midi virus 5 AB303558 Torque teno midi virus 8 AB303553 Torque teno midi virus 6 AB303566 Torque teno midi virus 14 AB303562 Torque teno midi virus 12 AB303554 Torque teno midi virus 7 AB303559 Torque teno midi virus 9 AB303561 Torque teno midi virus 11 AB303560 Torque teno midi virus 10 Torque teno Calomys tener virus AB449062 Torque teno midi virus 15 AB057358 Torque teno tupaia virus Rodent Torque teno virus 3 strain 250 Rodent Torque teno virus 4 strain 1458 Rodent Torque teno virus 4 strain 108 Rodent Torque teno virus 4 strain 332 Rodent Torque teno virus 4 strain 152 Rodent Torque teno virus 4 strain 188 Rodent Torque teno virus 4 strain 1259 Rodent Torque teno virus 4 strain 117 Rodent Torque teno virus 4 strain 4269 Rodent Torque teno virus 4 strain 319 Rodent Torque teno virus 4 strain 67 Rodent Torque teno virus 4 strain 2216 Rodent Torque teno virus 5 strain 2192 Rodent Torque teno virus 5 strain 2 Rodent Torque teno virus 5 strain 22 Rodent Torque teno virus 5 strain 1012 Rodent Torque teno virus 5 strain 49 Rodent Torque teno virus 5 strain 1594 Rodent Torque teno virus 6 strain 2404 HQ335084 Mosquito VEM Anellovirus SDRB A HQ335085 Mosquito VEM Anellovirus SDRB B KJ194616 Rodent Torque teno virus 2 - AS 1014 sp2 KJ194607 Rodent Torque teno virus 2 - AS 1012 Sp2 KJ194614 Rodent Torque teno virus 2 - MA ML89 Li11 Rodent Torque teno virus 7 Torque teno Carollia perspicillata virus Torque teno Didelphis albiventris virus Torque teno Desmodus rotundus virus KM434181 Torque teno Tadarida brasiliensis virus AB041960 Torque teno tamarin virus GU570203 Torque teno sus virus k2a JQ406846 Torque teno sus virus k2b AB038621 Torque teno virus 29 AB064595 Torque teno virus 27 AB064598 Torque teno virus 28 AB041959 Torque teno virus 25 NC_026765 Simian torque teno virus 34 AB041958 Torque teno virus 26 NC_026662 Simian torque teno virus 31 NC_024890 Seal anellovirus 3 NC_026664 Simian torque teno virus 32 NC_026764 Simian torque teno virus 33 AB076002 Torque teno canis virus

Figure 31. Análise de p-distance dos membros da família Anelloviridae. Os vírus descritos são destacados em negrito. 71

O gênero Omegatorquevirus é constituído pelos vírus RoTTV 3 a RoTTV 8 identificados neste estudo, além de quatro anellovírus previamente descritos: Rodent Torque teno virus RN, AS 1014, bem como o Mosquito VEM Anellovirus SDRB A e B (151, 152) (Figura 30). O gênero Sigmatorquevirus é composto por quatro vírus que representam três novas espécies de anellovírus: TTDaV, TTCpV, e TTDrV que está relacionado ao vírus Torque teno tadarida brasiliensis (TTTbV) (153). Apesar dos TTDrV e TTTbV terem sido encontrados em diferentes hospedeiros, eles exibem 91% de identidade nucleotídica, portanto, são a mesma espécie viral. Foram encontradas também duas novas espécies de anellovírus, TTCtV e OTTV, classificadas nos gêneros Deltatorquevirus e Alphatorquevirus, respectivamente (Figura 30).

4.2.2.3. Frequência e diversidade dos anellovírus Um total de 45% (18/40) dos lotes de pequenos mamíferos coletados no estado de São Paulo foram positivos para anellovírus. Isto significa que os anellovírus foram encontrados em 9 das 13 espécies de animais testadas. Observou-se uma alta frequência de anellovírus em sete espécies de pequenos mamíferos, com frequência superior a 40% (Figura 32a). Necromys lasiurus e Mus musculus com uma frequência de detecção de 100% e Calomys tener com 70% de frequência. Todos os anellovírus foram detectados nas amostras de sangue (Figura 32a). Por outro lado, a maior diversidade de espécies de anellovírus foi observada em Oligoryzomys nigripes e Akodon montesis, com 36% e 27% das 11 novas espécies de anellovírus, respectivamente. Curiosamente, a diversidade de anellovírus em Oligoryzomys nigripes foi observada nas amostras de sangue, fígado ou em ambas (Figura 32b). 72

(a) Necromys lasiurus Mus musculus Calomys tener Akodon montensis Oligoryzomys nigripes Carollia perspicillata Desmodus rotundus Akodon cursor Didelphis albiventris Akodon sp Artibeus lituratus Glossophaga soricina Molossus rufus 0% 20% 40% 60% 80% 100% (b) Necromys lasiurus Mus musculus Calomys tener Akodon montensis Oligoryzomys nigripes Carollia perspicillata Desmodus rotundus Akodon cursor Didelphis albiventris Akodon sp Artibeus lituratus Glossophaga soricina Molossus rufus 0% 5% 10% 15% 20% 25% 30% 35% 40% Blood Liver Lung Serum Liver and blood Figure 32. Frequência (a) e diversidade (b) dos anellovírus identificados neste estudo.

4.2.3. Família Hepeviridae Uma nova espécie de orthohepevírus foi identificada nos Necromys lasiurus e Calomys tener capturados na região de Ribeirão Preto, estado de São Paulo. Os dois vírus encontrados, representantes desta nova espécie, foram denominados Necromys orthohepevírus (NeHEV) e Calomys orthohepevírus (CaHEV), com base nas espécies de roedores nas quais foram identificados. Para o NeHEV encontramos um genoma quase completo com 6.819 nt, enquanto para o CaHEV encontramos dois genomas parciais, com 752 e 1.500 nt. O NeHEV apresenta organização genômica típica dos membros do gênero Orthohepevirus possuindo duas ORFs, uma codificando a poliproteína e outra, a proteína do capsídeo (Figura 33a). Para avaliar a filogenia e a taxonomia do NeHEV, a árvore filogenética foi construída com a ORF1 (poliproteína não estrutural). A análise revelou cinco clados distintos e bem suportados (>95% de bootstrap), representando as espécies de ortohepevírus A à D. Surpreendentemente, o quinto clado incluiu NeHEV, CaHEV e o kestrel HEV (Figura 33b). 73

(a) ~7kb

Necromys HEV 6,819 nt 5’ ORF1 Capsid 3’ 1 4,851 4,897 6,819

Calomys HEV 752 nt (contig 1) ORF1 Capsid 3’ 1,500 (contig 2) 1 752 1 1,500

(b) M73218 Human HEV M74506 Human HEV KJ496143 Camelus HEV KX387865 Camelus HEV FJ906895 Rabbit HEV 100 AF082843 Swine HEV AJ272108 Human HEV A KF736234 Yak HEV KU356189 Cow HEV KU356182 Goat HEV AB573435 Wild boar HEV 99 AB602441 Wild boar HEV KM516906 Rat HEV

100 GU345042 Rat HEV JX120573 Rat HEV 0.3 100 C AB847305 Rat HEV Orthohepevirurus

99 JN998606 Ferret HEV 85 Calomys HEV 99 Necromys HEV E KU670940 Kestrel HEV

100 JQ001749 Bat HEV 100 NC_034008 Bat HEV D 80 KJ562187 Bat HEV 96 AY535004 Chicken HEV KX589065 Little egret HEV B HQ731075 Cutthroat trout virus

Figure 33. Organização genômica dos orthohepevírus identificados (a). Árvore de máxima verossimilhança mostrando o relacionamento dos orthohepevírus descritos entre a família Hepeviridae (b). A barra de escala indica distância evolutiva em números de substituições aminoacídicas por sítio, e os valores de bootstrap (> 75) são indicados nos principais ramos com círculos pretos. A árvore foi inferida com o modelo de substituições aminoacídicas LG+F+G4. Os vírus identificados neste estudo são destacados com a silhuetas dos seus hospedeiros e nomes dos vírus na cor laranja.

Além disso, o NeHEV e o CaHEV compartilhavam apenas 62 a 64% de identidade aminoacídica com kestrel HEV, e menos de 60% com outros membros representativos do ortohepevírus tanto na poliproteína não estrutural, quanto no cápsideo (Figuras 34). Baseado nos critérios de demarcação de espécies do ICTV para a família Hepeviridae e nos resultados obtidos neste estudo, propomos que NeHEV, CaHEV e o Kestrel HEV constituam uma nova espécie HEV do gênero Orthohepevirus, que denominamos provisoriamente de "Orthohepevirus E". Para determinar a frequência de "Orthohepevirus E" nas amostras de 74 roedores incluídas neste estudo, foi realizado uma RT-PCR específica, cujo resultado apontou a presença de genoma viral em 1,08% das amostras (7/647), incluindo três de Necromys lasiurus e quatro de Calomys tener.

M73218 Human HEV 1.00 M74506 Human HEV 0.74 1.00 AB573435 Wild boar HEV 0.72 0.72 1.00 AB602441 Wild boar HEV 0.73 0.72 0.77 1.00 AJ272108 Human HEV 0.73 0.72 0.75 0.76 1.00 KF736234 Yak HEV 0.73 0.73 0.74 0.75 0.83 1.00 KU356182 Goat HEV 0.74 0.73 0.75 0.76 0.83 0.96 1.00 KU356189 Cow HEV 0.74 0.73 0.75 0.76 0.83 0.95 0.99 1.00 AF082843 Swine HEV 0.73 0.73 0.73 0.72 0.73 0.73 0.74 0.73 1.00 FJ906895 Rabbit HEV 0.72 0.71 0.72 0.72 0.72 0.72 0.73 0.72 0.77 1.00 KJ496143 Camelus HEV 0.73 0.72 0.73 0.73 0.73 0.73 0.74 0.73 0.75 0.74 1.00 KX387865 Camelus HEV 0.72 0.72 0.72 0.73 0.73 0.73 0.73 0.72 0.73 0.73 0.74 1.00 Necromys HEV 0.59 0.59 0.60 0.58 0.58 0.59 0.59 0.59 0.59 0.59 0.58 0.58 1.00 Calomys HEV 0.61 0.60 0.59 0.61 0.61 0.59 0.61 0.61 0.60 0.59 0.59 0.59 0.66 1.00 KU670940 Kestrel HEV 0.58 0.57 0.58 0.59 0.59 0.57 0.58 0.58 0.59 0.58 0.58 0.58 0.62 0.64 1.00 AB847305 Rat HEV 0.56 0.57 0.57 0.56 0.56 0.56 0.56 0.55 0.57 0.56 0.56 0.56 0.59 0.62 0.57 1.00 JX120573 Rat HEV 0.57 0.57 0.57 0.57 0.56 0.55 0.57 0.57 0.57 0.57 0.57 0.56 0.60 0.62 0.58 0.87 1.00 GU345042 Rat HEV 0.57 0.56 0.58 0.56 0.56 0.57 0.56 0.56 0.57 0.58 0.56 0.57 0.60 0.65 0.59 0.76 0.76 1.00 KM516906 Rat HEV 0.57 0.57 0.58 0.57 0.57 0.57 0.57 0.57 0.57 0.59 0.56 0.57 0.60 0.64 0.59 0.77 0.77 0.86 1.00 JN998606 Ferret HEV 0.57 0.56 0.58 0.58 0.57 0.57 0.58 0.57 0.57 0.57 0.57 0.57 0.61 0.62 0.58 0.68 0.68 0.68 0.68 1.00 Y535004 Chicken HEV 0.57 0.57 0.57 0.56 0.57 0.57 0.57 0.57 0.57 0.57 0.56 0.57 0.55 0.60 0.55 0.56 0.55 0.56 0.56 0.55 1.00 KX589065 Little egret HEV 0.56 0.55 0.56 0.56 0.56 0.56 0.56 0.56 0.56 0.55 0.55 0.56 0.54 0.55 0.55 0.56 0.56 0.55 0.56 0.54 0.59 1.00 Q001749 Bat HEV 0.56 0.56 0.56 0.56 0.56 0.56 0.56 0.56 0.56 0.56 0.56 0.55 0.56 0.56 0.55 0.53 0.54 0.54 0.55 0.55 0.57 0.57 1.00 NC_034008 Bat HEV 0.56 0.56 0.56 0.56 0.56 0.55 0.56 0.56 0.56 0.56 0.56 0.56 0.56 0.58 0.56 0.56 0.55 0.55 0.55 0.55 0.56 0.57 0.68 1.00 KJ562187 Bat HEV 0.56 0.56 0.57 0.57 0.57 0.56 0.56 0.56 0.56 0.57 0.56 0.56 0.56 0.56 0.58 0.56 0.57 0.56 0.56 0.56 0.57 0.58 0.61 0.60 1.00 HQ731075 Cutthroat trout virus 0.48 0.47 0.47 0.47 0.47 0.47 0.47 0.47 0.47 0.47 0.48 0.47 0.48 0.49 0.48 0.47 0.48 0.48 0.48 0.48 0.47 0.47 0.48 0.46 0.47 1.00 Necromys HEV Calomys HEV M73218 Human HEV M74506 Human HEV AB573435 Wild boar HEV AB602441 Wild boar HEV AJ272108 Human HEV KF736234 Yak HEV KU356182 Goat HEV KU356189 Cow HEV AF082843 Swine HEV FJ906895 Rabbit HEV KJ496143 Camelus HEV KX387865 Camelus HEV KU670940 Kestrel HEV AB847305 Rat HEV JX120573 Rat HEV GU345042 Rat HEV KM516906 Rat HEV JN998606 Ferret HEV Y535004 Chicken HEV KX589065 Little egret HEV Q001749 Bat HEV NC_034008 Bat HEV KJ562187 Bat HEV HQ731075 Cutthroat trout virus Figure 34. Análise de p-distance dos orthohepevírus descritos entre a família Hepeviridae.

5. DISCUSSÃO 5.1.GENOMAS DE VÍRUS ISOLADOS NAS AMÉRICAS 5.1.1. Gênero Orthobunyavirus (família Peribunyaviridae) Caracterizamos a genômica e a filogenia de 35 vírus do gênero Orthobunyavirus, família Peribunyaviridae. As análises filogenéticas destes vírus confirmaram que os mesmos representam cinco novos grupos dentro do gênero. Em linhas gerais, observamos que a proteína RdRP destes vírus contém os motifs altamente conservados das polimerases de vírus de RNA com polaridade negativa (Pre-Motif A e Motifs A a E) (154). Dentre os orthobunyavírus caracterizados, os do grupo Gamboa apresentam uma característica única, possuem proteína NSm de 317 aminoácidos, quase o dobro do tamanho das NSm típicas deste gênero, que têm de 102 a 186 aminoácidos. Embora a proteína NSm atue como um precursor da poliproteína, que é cotranslacionalmente clivada nas proteínas Gc e Gn, seu papel na replicação e virulência é pouco conhecido (155). Na infecção pelo vírus Bunyamwera, demonstrou-se que NSm é crítica para a montagem e morfogênese viral (156). Por outro lado, estudos com o vírus Maguari sugerem que NSm não 75

é essencial para o crescimento deste vírus em cultura de células (157). Um estudo recente sugere que a deleção de NSm no vírus Schmalemberg reduz a virulência em quadros de infecção experimental (158). Porém, o resgate de um clone infecioso do vírus Oropouche, com deleção completa da proteína NSm, não afetou a replicação viral em cultura de células (159). Portanto, futuros estudos usando genética reversa são necessários para elucidar a importância biológica de NSm, particularmente desta NSm de tamanho peculiar encontrada nos vírus do grupo Gamboa. Todos os orthobunyavírus possuem uma nucleoproteína, codificada pelo segmento S, que está envolvida na síntese e replicação do RNA viral (155, 160). Em sua ORF, o segmento S também pode codificar uma proteína NSs na mesma direção da N, porém em diferente frame. NSs é antagonista da resposta de interferon em diversos orthobunyavírus que infectam vertebrados (161), e nos vírus do grupo Gamboa ela está presente na sua forma típica, com cerca de 130 aminoácidos. No entanto, identificamos uma potencial nova estratégia de codificação da proteína NSs no vírus Enseada e nos vírus dos grupos Patois e Grupo C. Nestes vírus, seu start codon localiza-se antes do start codon de N. Estudos prévios mostraram que os vírus do Grupo C (Marituba, Oriboca, Caraparu, Madri e Itaya) codificam uma proteína NSs contendo de 83 a 101 aminoácidos, e também uma NSs truncada ou não funcional, com 62 aminoácidos (162, 163). Porém, sugerimos que o genoma dos vírus do Grupo C usado nestes estudos estava incompleto, visto que identificamos uma nova estratégia de codificação da proteína NSs onde todos os vírus do Grupo C apresentam uma ORF que codifica NSs do tamanho similar ao observado para outros orthobunyavírus. Corrobora nosso achado para o gênero Orthobunyavirus, o vírus Brazoran, que também apresenta a ORF para a proteína NSs antes do start codon da nucleoproteína (164). Considerando-se que a proteína NSs desempenha um papel crucial na virulência e patogênese de vários orthobunyavírus previamente caracterizados, estudos adicionais usando genética reversa poderiam elucidar sua importância biológica nos vírus Enseada e nos membros dos grupos Patois e C (158, 161, 165). Os vírus do Grupo C representariam o primeiro novo grupo identificado neste estudo. A filogenia do segmento M dos vírus deste grupo revela quatro grupos filogenéticos com alto suporte estatístico. Estes grupos coincidem com as classificações antigas baseadas nos testes de fixação do complemento, neutralização e inibição da hemaglutinação (166-169), que foram previamente nomeados como complexos de Marituba, Caraparu, Madrid e Oriboca (170). O complexo de Caraparu inclui os vírus Caraparu, Apeu e Bruconha; o complexo Madrid inclui os vírus Madrid e Itaya; o complexo Marituba inclui os vírus Martituba, Murucuri, Restan, 76

Nepuyo e Gumbo limbo, e o complexo Oriboca, os vírus Oriboca e Itaqui (162, 163, 170). Infelizmente, não existem sequências completas para vírus Vinces e Ossa, mas provavelmente, esses vírus serão agrupados no complexo Caraparu, como mostraram ensaios sorológicos (167). A concordância entre filogenia do segmento M e classificação sorológica ocorre porque o segmento M codifica as glicoproteínas, principais determinantes antigênicos reconhecidos pelos testes de neutralização e inibição da hemaglutinação (171). Os vírus do Grupo C são descritos em uma ampla área geográfica, que inclui áreas tropicais e subtropicais das Américas como Estados Unidos, México, Panamá, Honduras, Guatemala, Trinidade e Tobago, Brasil, , Equador, Venezuela e Guina Francesa (169, 170, 172). Clinicamente, as infecções humanas por vírus do Grupo C são assintomáticas ou produzem doença febril inespecífica (170). Pouco se sabe sobre a epidemiologia destes vírus, especialmente pela ausência de métodos diagnósticos, de modo que a caracterização genômica destes vírus poderá subsidiar o desenvolvimento de testes moleculares e sorológicos para sua detecção. O vírus Enseada foi isolado de mosquitos da espécie Culex epanastasis no estado de São Paulo em 1976, no entanto, permaneceu como um orthobunyavírus não classificado (167). Observamos que este vírus compartilha o mesmo ancestral comum que os vírus do Grupo C, mas permanece em clado único e provavelmente, é protótipo de um novo grupo no gênero Orthobunyavirus. Embora, o vírus Enseada não tenha sido associado com infecções humanas, sua estreita relação filogenética com os membros dos grupos Capim, Guama e Patois sugere que a associação deste vírus com doença humana ou veterinária não pode ser excluída. O segundo novo grupo identificado neste estudo é representado pelo vírus Capim, o protótipo do sorogrupo Capim. Posteriormente, outros vírus deste grupo foram sequenciados (173). Estes vírus parecem estar restritos a infecções em mosquitos e aparentemente, não são associados a doenças humanas ou veterinárias. Gamboa foi outro grupo caracterizado neste estudo, geneticamente relacionado ao grupo Koongol. O grupo Koongol é composto pelos vírus Koongol e Wongal, ambos atribuídos pelo ICTV como uma única espécie, porém, apenas o vírus Koongol tem seu genoma completo sequenciado (173). Estes vírus foram originalmente isolados de mosquitos do gênero Culex coletados em 1960 em Queensland, Austrália (174). Estudos soroepidemiológicos sugerem que o vírus Koongol infecta vários mamíferos incluindo marsupiais, e também pássaros, podendo ser encontrado por toda a Austrália (175, 176). Assim, acreditamos que a relação do grupo Koongol com pássaros poderia explicar o 77 relacionamento filogenético com vírus do grupo Gamboa, também descrito em aves. Além disso, a classificação genômica do grupo Gamboa coincide com a classificação baseada em testes sorológicos utilizando fixação do complemento, hemaglutinação e neutralização (177, 178). Até o momento não há evidências de infecção humana por vírus deste grupo, isolados apenas de aves e mosquitos na América Latina. Os genomas dos vírus do grupo Patois são inéditos. Estes são filogeneticamente relacionados aos vírus Enseada, Brazoran, bem como aos membros dos grupos Guama, Capim e C. Apesar dos vírus do grupo Patois não serem associados a doenças humanas ou veterinárias, a estrita relação filogenética com vírus causadores de doenças humanas e o achado de anticorpos neutralizantes em humanos, sugerem que estes vírus possam causar infecção humana e suas consequências clínicas precisariam ser elucidadas em estudos futuros (179-181). O último grupo do gênero Orthobunyavirus caracterizado neste estudo foi o do vírus Tacaíuma, sorologicamente classificado no grupo de Anopheles A (182). O vírus Tacaíuma causa doença humana caracterizada por febre, dor de cabeça, calafrios, mialgia, artralgia e fraqueza (183). O Tacaíuma é a única exceção no gênero, um vírus que infecta vertebrados e não possui ORF codificadora da proteína NSs. Interessantemente, apesar da falta de NSs, Tacaíuma suprime a resposta imune inata do hospedeiro, atuando especificamente no bloqueio de IFN-β (182). No entanto, o mecanismo ou produto viral responsável pelo bloqueio do sistema de defesa inata ainda não foi elucidado. O chamado reassortment é um mecanismo evolutivo importante em vírus de RNA segmentado. Este fenômeno, ocorre com a coinfecção de múltiplos vírus segmentados do mesmo grupo em uma célula hospedeira, podendo resultar na mistura de segmentos genômicos destes vírus (184). Tal ocorrência está envolvida na emergência de vírus como o Schmallenberg e variações do vírus Oropouche (54, 185-187). Combinando as discrepâncias nas árvores filogenéticas e as análises RDP4, identificamos seis reassortants com diferentes organizações no gênero Orthobunyavirus. Em membros do Grupo C, identificamos reassortments nos vírus Apeu, Itaqui e Oriboca, que já eram indicados como potenciais reassortants em estudos baseados em fixação do complemento e análises de genoma parcial, mesmo quando os genomas completos dos vírus Apeu e Itaqui ainda não haviam sido sequenciados (188). Observamos que o vírus Itaya identificado na Amazônia peruana em 1999, também é reassortant (189). Por outro lado, não encontramos nenhuma evidência neste sentido em relação aos vírus Murucuri e Restan, como previamente descrito (170). 78

Recentemente, foram caracterizados reassortants em quatro isolados virais do grupo Gamboa em mosquitos da espécie Aedeomyia squamipennis coletados no Panamá (190). Em nosso estudo, identificamos reassortment em outro membro deste grupo, o vírus Soberania cepa 118 e também identificamos que vírus Zegla do grupo Patois é um reassortment natural. O fato dos vírus Zegla e o Patois (vírus parental) terem sido isolados de roedores da espécie Sigmodon hispidus capturados perto da cidade de Almirante no Panamá em junho de 1961 (179, 180), reforça a hipótese de reassortment natural. Futuros estudos precisam ser direcionados para elucidar as implicações deste fenômeno nos grupos Gamboa, Patois e Grupo C.

5.1.2. Gênero Phlebovirus (família Phenuiviridae) O gênero Phlebovirus é bastante abundante e diversificado, o que, juntamente com fato de alguns phlebovírus não causarem doença em camundongos recém-nascidos, ou efeito citopático visível em cultura de células, dificulta a classificação das espécies que o compõe (191). Embora os phlebovírus tenham sido classificados principalmente por estudos sorológicos, esta diversidade torna a tarefa de testar phlebovírus recém-isolados por sorologia bastante laboriosa (191, 192). Na última década, portanto, as novas ferramentas moleculares disponíveis, incluindo o sequenciamento de alto desempenho, tem fornecido opção eficiente para caracterizar e classificar estes vírus (118). No presente estudo, sequenciamos os genomas de oito phlebovírus para determinar suas relações taxonômicas e evolutivas. Classificamos os vírus Bujaru, Munguba, Ambé, Anhangá, Joá, Uriurana, Urucuri e Tapará em três grupos no gênero Phlebovirus: Bujaru, Tapará e Frijoles. O grupo Bujaru inclui os vírus Bujaru e Munguba, corroborando a classificação baseada em testes sorológicos, que inclusive, foi utilizada pela ICTV para classificar esses vírus em uma espécie viral única, Bujaru. Curiosamente, o vírus Anhangá, que compartilha o mesmo ancestral comum com o phlebovírus Bujaru nos segmentos M e L, não produz reações cruzadas em testes sorológicos. Por isso, sugere-se que o vírus Anhangá não seja membro do grupo Bujaru. Os vírus do grupo Bujaru e o vírus Anhangá não são associados a doenças humanas ou veterinária tendo sido isolados de flebotomíneos como Lutzomyia umbratilis e mamíferos, como Proechimys guyannensis oris e Choloepus brasiliensis no Brasil. Não se pode afastar que estes vírus causem infecções humanas ou veterinárias (193). Os vírus Uriurana e o Tapará, phlebovírus não classificados em grupos antigênicos, no presente estudo mostraram-se em um grupo denominado Tapará, coincidindo com 79 classificação sorológica por fixação do complemento. Também, a relação filogenética entre o complexo Tapará e o vírus Chagres, sugere que os vírus Uriurana e Tapará possam estar envolvidos em infecções humanas (194, 195). Os vírus Ambé e Urucuri foram isolados no Brasil, mas não são associados a infecções humanas ou veterinárias. O vírus Ambé foi isolado em Phlebotominae sp. coletados em Altamira em 1982, estado do Pará, e o vírus Urucuri isolado de Proechimys guyannensis em 1966, na floresta de Utinga, estado do Pará. Neste estudo, observamos que estes vírus apresentam diferenças topológicas em todos os segmentos, portanto, assim como observado em testes sorológicos, permaneceram como phlebovírus desagrupados. Em suma, caracterizamos o genoma e a evolução de três grupos de phlebovírus: o Bujaru, o Tapará e o Frijoles. Os phlebovírus Ambé e Urucuri permaneceram desagrupados. Não observamos evidência de reassortment entre os phlebovírus sequenciados em nosso estudo, porém, identificamos um reassortment no vírus Medjerda Valley, que possui os segmentos S e L idênticos ao do vírus Arbia e provavelmente, um segmento M único. Além disso, ambos os vírus circulam na mesma região geográfica, reforçando a hipótese de reassortment natural (196). Acreditamos que nosso estudo forneça informações importantes sobre diversidade genética, classificação e evolução no gênero Phlebovirus.

5.1.3. Gênero Orthonairovirus (família Nairoviridae) O gênero Orthonairovirus (família Nairoviridae) inclui 38 vírus predominantemente transmitidos por carrapatos, e sete espécies reconhecidas pelo ICTV (197). O primeiro orthonairovírus identificado, foi o Nairobi sheep disease virus, isolado de ovinos com gastroenterite hemorrágica em 1910. Este vírus mata até 75% dos animais infectados na África e Índia (198). No entanto, o vírus melhor caracterizado neste gênero, é o da febre hemorrágica da Crimeia-Congo (CCHFV), causador de febre hemorrágica humana com letalidade de 5 a 30% na África, Ásia e Europa (199). Estudos recentes por sequenciamento de alto desempenho permitiram conhecer e classificar diversos orthonairovírus (150, 200, 201). No presente estudo, sequenciamos e caracterizamos o vírus Estero Real (ERV), determinando suas relações filogenéticas dentro da família Nairoviridae. Observamos que ERV compartilha o mesmo clado monofilético dos vírus da espécie Hughes em todos os segmentos, sugerindo uma mesma origem evolutiva. Os vírus da espécie Hughes foram originalmente isolados de carrapatos do gênero Ornithodoros, um ectoparasita comum das aves marinhas de várias ilhas oceânicas. Também já foram isolados de aves marinhas da espécie Sterna fuscata (202). Os vírus da espécie Hughes têm ampla distribuição 80 mundial. Entretanto, apenas os vírus Soldado e Zirqa são associados a doença humana que leva a prurido persistente e grave em pacientes com doença febril nas Ilhas Seychelles e nos Emirados Árabes Unidos. Além disso, estudo experimental mostrou que pintainhos infestados com carrapatos infectados experimentalmente com vírus Soldado morriam (203, 204). Considerando que ERV, assim como os vírus da espécie Hughes, possuem GPC com topologia similar, bem como a mesma origem evolutiva, é possível que ele cause infecções humanas ou veterinárias. Não observamos reassortment em ERV. A caracterização genômica e evolutiva de ERV na família Nairoviridae permite entender a evolução e a diversidade destes vírus e deverá ser útil no desenvolvimento de métodos de diagnóstico e sistemas de genética reversa para este vírus.

5.1.4. Vesiculovírus Piry (família Rhabdoviridae) O gênero Vesiculovirus (família Rhabdoviridae) inclui nove espécies de vírus isolados em artrópodes e mamíferos, com importância para saúde humana e veterinária (205). O vesiculovírus Piry (PIRYV) foi originalmente isolado dos tecidos do baço e fígado de um gambá da espécie Philander opossum, capturado em 1960, em Belém, estado do Pará. Estudos sorológicos descrevem uma alta prevalência (4 a 17,7%) de anticorpos neutralizantes específicos para PIRYV em populações de diferentes regiões do Brasil (206-208). A doença humana causada por este vírus foi descrita somente em cinco casos, todos relacionados a acidentes laboratoriais. Os pacientes apresentaram febre alta, dor de cabeça, prostração, mialgia e artralgia (206, 208). A infecção experimental com PIRYV em bovinos, ovinos, caprinos e suínos sugere que ele não esteja associado à estomatite vesicular clássica descrita para outros membros deste gênero (209). Recentemente, observou-se que PIRYV causa dano neuropatológico e alterações comportamentais em camundongos swiss (210). Para melhor caracterizar o vesiculovírus Piry, previamente analisado com sequências genômicas parciais (211, 212), analisamos seu genoma completo e sua relação filogenética no gênero Vesiculovirus. A árvore filogenética com 33 vesiculovírus indicou que PIRYV esteja possivelmente mais relacionado ao vírus Perinet, isolado de um lote de mosquitos Culex antennatus em Madagascar, em 1978 (213). Também, no mesmo clado, estão os vírus Jurona, Malpais Spring, Isfahan e Chandipura, isolados ou associados à transmissão por mosquitos, sugerindo que PIRYV, também possa ser um arbovírus (214-218). Além disso, PIRYV compartilha o mesmo ancestral comum com os vírus Isfahan e Chandipura, ambos causadores de doença febril aguda e encefalites humanas (214, 215, 217), sugerindo que as infeções pelo PIRYV possam causar encefalite. 81

A caracterização genômica e filogenética do PIRYV poderá ser útil no desenvolvimento do sistema de genética reversa para estudar aspectos da replicação viral in vivo e in vitro. Permitirá estudar o neurotropismo em camundongos, bem como seu uso como vetor de expressão, o que já ocorre com outros vesiculovírus (219). Também, poderá ser útil no desenvolvimento de testes diagnósticos e para estudar a epidemiologia do PIRYV.

5.2. PROSPEÇÃO DE NOVOS VÍRUS NO BRASIL 5.2.1. Chapparvovírus (família Parvoviridae) Os parvovírus são vírus pequenos, lineares, não envelopados, que possuem genoma de fita simples de DNA com 5 a 6 kb de comprimento (220). Os parvovírus possuem pelo menos dois genes, um que codifica proteína não estrutural (NS) e outro que codifica uma proteína do capsídeo (VP) (220). A família Parvoviridae divide-se em duas subfamílias, Parvovirinae e Densovirinae, restritas respectivamente a vertebrados e invertebrados (220). O primeiro chapparvovírus foi descrito em morcegos, em Gana, e depois em amostras fecais de aves, suínos e roedores. Tem sido proposto que os chapparvovírus são uma nova linhagem nos Parvovirinae (109, 221). Combinando abordagem de metagenômica viral e busca in silico por sequências homólogas de chapparvovírus em genomas de animais, identificamos 20 genomas de chapparvovírus. Estes vírus apresentam a típica organização genômica dos parvovírus, com dois genes e possuem motifs conservados como os “HVH” e “GPXNTGKS”, homólogos a motif de endonuclease “HIH” e de helicase “GPASTGKS”, próprios da família Parvovirinae (222, 223). Surpreendentemente, novas espécies de chapparvovírus de vertebrados, e de uma ampla gama de invertebrados marinhos, terrestres e em genomas de peixes, constituem um grupo monofilético estatisticamente bem suportado em relação aos chapparvovírus de vertebrados, sugerindo que os chapparvovírus teriam sua origem em animais invertebrados. Atualmente, todos os parvovírus descritos em invertebrados são classificados na subfamília Densovirinae (220) e muitos são descritos em invertebrados terrestres, incluindo mosquitos Aedes, Culex, Anopheles e Haemagogus, baratas dos gêneros Periplaneta e Blattella, grilos do gênero Acheta, borboletas do gênero Papilio e várias espécies de mariposas (Diatraea, Galleria, Helicoverpa, Junonia, Mythimna, Pseudoplusia, Bombyx, Dendrolimus e Helicoverpa) (220). Também, densovírus são descritos em invertebrados marinhos, causando perdas econômicas em fazendas de camarões e associados a implicações ecológicas por 82 produzirem extensos surtos de doença em estrelas marinhas na costa nordeste do Pacífico (224-226). Os resultados descritos neste estudo apresentam uma nova subfamília na família Parvoviridae, os Chapparvoviridae, com ampla gama de hospedeiros, incluindo novos invertebrados terrestres e marinhos, como diferentes espécies de aranhas, vermes, besouros, escorpião, estrela-do-mar, moluscos e centopeia, bem como peixes marinhos. Parvovírus são conhecidos por serem endogenizados em células de ampla gama de animais. Os vírus resultantes deste processo são chamados elementos virais endógenos (EVE) (227-229). Este fenômeno de integração ao genoma do hospedeiro, ocorre após infecções crônicas por estes vírus, como foi demonstrado para os vírus dos gêneros Dependoparvovirus e Protoparvovirus (228-230). Em alguns casos, a integração e persistência dos parvovírus pode ser benéfica para seus hospedeiros, protegendo contra infecções virais (231, 232). Apesar de muitos chapparvovírus identificados no presente estudo serem potenciais EVEs, somente os vírus identificados nos genomas de Patiria miniata, Strigamia maritima, Hippocampus comes, Catajapyx aquilonaris foram identificados em grandes contigs. Identificamos stop codons na sequência de chapparvovírus oriundos de Strigamia maritima, sugerindo que esses vírus sejam EVEs integrados na linha germinal destas espécies. Utilizando busca in silico identificamos vírus em sequências curtas de genomas completos (Whole genome sequencing). Por não identificarmos regiões gênicas conhecidas no hospedeiro, não foi possível determinar, se tais vírus são EVEs ou genomas de DNA viral exógeno presentes na amostra de DNA sequenciada. Em suma, nossos resultados mostram que os chapparvovírus representam uma nova subfamília dos Parvoviridae, com origem evolutiva própria, ampla distribuição geográfica e grande diversidade de hospedeiros. Estes vírus ainda não são associados a doença humana ou veterinária. Porém, estudos futuros devem ser direcionados para avaliar o impacto da infecção por estes vírus em hospedeiros animais e humanos, bem como seus aspectos biológicos.

5.2.2. Família Anelloviridae A família Anelloviridae possui 12 gêneros que incluem 68 espécies de vírus de DNA fita simples (ssDNA) com genomas de 2,1 a 3,9 kb (233). Estes vírus estão associados a infecção crônica sem doença aparente, com prevalência de 5% a 90% em seres humanos (234). No entanto, estudos associam anellovírus a um amplo espectro de doenças, incluindo hepatite, esclerose múltipla, carcinomas hepatocelulares, infecções respiratórias, distúrbios 83 sanguíneos e doenças autoimunes, embora não sejam comprovadamente a causa destas doenças, podendo ser inclusive, constituintes naturais do viroma humano (234-238). Anellovírus têm sido detectados em sangue de um amplo espectro de mamíferos, incluindo primatas, porcos, cavalos, gatos, cachorros, roedores e morcegos (151, 153, 239- 241). No presente estudo, identificamos onze novas espécies de anellovírus em hospedeiros previamente não reconhecidos, bem como identificamos dois novos gêneros, ressaltando assim a diversidade desta família viral. O genoma dos anellovírus pode variar segundo o hospedeiro (242). O tamanho dos genomas identificados neste estudo foi consistente com relatos anteriores, com exceção do OTTV, identificado em gambás da espécie Didelphis albiventris. Este genoma foi maior que os descritos anteriormente para anellovírus infectando animais não primatas, mostrando-se semelhante aos do gênero Alphatorquevirus descritos em primatas. As UTRs dos vírus identificados neste estudo mostraram-se conservadas e semelhantes às de anellovírus previamente caracterizados. Isto corrobora a ideia de que as UTRs devem desempenhar papéis regulatórios importantes durante a replicação viral (234). Na maioria dos anellovírus identificados neste estudo, foi possível identificar a região TATA-box e o sinal de poliadenilação, importantes reguladores na transcrição de genes virais (243). No entanto, futuros estudos in vitro são necessários para elucidar a função desses reguladores. Todas as novas espécies de anellovírus descritas neste estudo possuem ORF1 que, provavelmente, codifica uma proteína de capsídeo, mas com papel pouco conhecido na infecção viral (241, 244). A putativa proteína ORF2 foi identificada nos OTTV e TTDaV, identificados em gambás da espécie Didelphis albiventris. Estudo anterior sugere que ORF2 codifique uma proteína não estrutural envolvida na supressão da via canônica e não canônica de NF-κB, indicando que esta proteína esteja envolvida na regulação de respostas imunes inatas e adaptativas do hospedeiro (245). A ORF3 foi identificado nos TTCtV, TTCpV, TTDrV e TTDaV, encontrados em roedores, morcegos e gambás. Acredita-se que a ORF3 codifique duas formas de uma proteína em diferentes estados de fosforilação, com características semelhantes às da proteína NS5A (proteína não estrutural 5-A) do vírus da hepatite C (246). Portanto, a proteína codificada pela ORF3 estaria envolvida no ciclo replicativo viral e na regulação de proteínas do hospedeiro, desempenhando papel importante nas infecções persistentes pelos anellovírus. Também, encontramos outras ORFs putativas, mas que não mostraram-se homólogas a genes ou proteínas de anellovírus previamente descritos, bem como às de outros de qualquer família viral. Futuros estudos são necessários para elucidar a função dessas proteínas e seus papéis na infecção por anellovírus. 84

Combinando análises filogenéticas e de p-distance, e usando os critérios de classificação do ICTV para anellovírus, classificamos os anellovírus encontrados neste estudo, em onze novas espécies. Além disso, identificamos dois novos gêneros na família Anelloviridae, que denominamos Omegatorquevirus e Sigmatorquevirus. Esses dois gêneros formam clados divergentes e bem suportados, com distância de nucleotídeos superior a 50%, para com os outros doze gêneros previamente classificados. Também, ao identificarmos dois novos gêneros na família Anelloviridae, aumentamos a diversidade dos anellovírus. Além disso, apesar da árvore filogenética indicar como origem dos anellovírus hospedeiros não primatas, não observamos evidências para julgar se resultaram de coevolução com o hospedeiro a milhões de anos ou se tiveram a origem e obtiveram diversidade em escala de tempo muito menor que seus hospedeiros. Esta é uma questão interessante que deve ser respondida em estudos futuros (247). Os vírus do gênero Omegatorquevirus foram os mais frequentes neste estudo. As espécies mais comuns foram RoTTV-4 (onze cepas) e RoTTV-5 (seis cepas), detectadas em Akodon montesis, Akodon cursor, Calomys tener, Necromys lasiurus, Mus musculus e Oligoryzomys nigripes. Quase todos estes anellovírus foram identificados em roedores americanos Sigmodontinae (família Cricetidae), predominantes na América do Sul (248). Interessantemente, o gênero Omegatorquevirus forma um clado monofilético com outros vírus identificados em roedores Cricetidae (151). São exceções os vírus Mos VEM SDRB A e B descritos em mosquitos nos EUA, mas que provavelmente são oriundos da alimentação destes artrópodes (249), e a cepa 117 do RoTTV-4, identificada em Mus musculus (família Muridae) que possui ampla distribuição mundial e comportamento antropofílico (250). Morcegos (ordem Chiroptera) são reconhecidos como importantes fontes de vírus causadores de doenças humana e veterinária (251). No entanto, anelloviírus descritos em morcegos mostraram-se restritos a uma única espécie do sul do Brasil, Tadarida brasiliensis (153). No presente estudo, identificamos duas novas espécies de anellovírus em Carollia perspicillata e Desmodus rotundus. Estes vírus formam um clado monofilético único que propomos como gênero Sigmatorquevirus. Outro vírus pertencente ao gênero Sigmatorquevirus é o TTDaV, encontrado em gambá. Curiosamente, OTTV, classificado como Alphatorquevirus, também foi obtido de gambá, diferentemente de todos os membros do gênero, identificados em primatas (234). Este vírus poderia ser resultante de antropozoonose, como a proposta para os Torque teno vírus de humanos e suínos (6). Também, identificamos uma nova espécie de anellovírus do gênero Deltatorquervirus em roedor Calomys tener, este vírus agrupa-se a outros anellovírus de roedores, musaranhos e 85 mosquitos (151, 247, 249). Em suma, este é o primeiro estudo sobre epidemiologia molecular de anellovírus em pequenos mamíferos nas Américas e adiciona informações que incrementam a diversidade e a gama de hospedeiros de anellovírus na natureza.

5.2.3. Família Hepeviridae A hepatite E é uma zoonose viral que envolve ampla gama de espécies animais (9). Na última década, o número de hospedeiros infectados por Hepeviridae expandiu dramaticamente, bem como a diversidade de variantes destes vírus (252). Os Hepeviridae dividem-se em dois gêneros, o Piscihepevirus que inclui uma espécie única, a Piscihepevirus, infectando salmões (253). O gênero o Orthohepevirus com quatro espécies: Orthohepevirus A, incluindo todos os vírus conhecidos por infectarem humanos, suínos, camelos, javali, coelhos, sucirates e algumas cepas que infectam ratos; Orthohepevirus B incluindo os vírus de aves; Orthohepevirus C com a maioria dos vírus infectantes de ratos e furões; Orthohepevirus D contendo vírus de morcegos (253). Apesar dos orthohepevírus terem ampla gama de hospedeiros incluindo roedores, os estudos têm sido limitados a roedores Muridae (252, 254- 256). No presente estudo, investigamos orthohepevírus em roedores Cricetidae brasileiros, e encontramos duas variantes de um novo orthohepevírus em Necromys lasiurus e Calomys tener. Combinando análises filogenéticas com análises de p-distance e usando os critérios de classificação do ICTV para a família Hepeviridae, observamos que os vírus encontrados representam uma nova espécie no gênero Orthohepevirus, que denominamos Orthohepevirus E. Interessantemente, o orthohepevírus mais relacionado ao NeHEV foi um vírus identificado em falcões das espécies Falco tinnunculus e Falco vespertinus, ambos capturados na Hungria (257). Além disso, estudo anterior detectou orthohepevírus relacionado a mamíferos na ave de rapina Gyps himalayensis, no Zoológico de Pequim, China, este não relacionado aos orthohepevírus aviários (258). Além disso, a carga viral elevada de orthohepevírus foi mensurada na amostra fecal do Falco tinnunculus, indicadora de possível eliminação viral (257). No entanto, e provável que os orthohepevírus de Falco tinnunculus e Falco vespertinus sejam oriundos da dieta destas aves carnívoras e que incluem em sua dieta musaranhos e roedores. Os resultados do presente estudo mostram que os orthohepevírus estão presentes no sangue dos roedores, sugerindo replicação viral e um papel destes animais como reservatórios. Por outro lado, a infecção em aves com dieta carnívora pode participar na disseminação deste vírus em meio ambiente, o que precisa ser melhor elucidado. Ainda, observamos alta frequência orthohepevírus, 1.19% em Necromys lasiurus e 3.66% em 86

Calomys tener. Nossos resultados são distintos daqueles mostrados em trabalho anterior relatando tais vírus em 18% (2/11) e 14% (1/7) em amostras fecais de Falco tinnunculus e Falco vespertinus, respectivamente (257), acreditamos que possa estar relacionado ao discrepante número de amostras analisadas. Portanto, no presente estudo, identificamos uma nova espécie de Orthohepevirus em 1.08% de roedores oriundos de área rural em Ribeirão Preto, estado de São Paulo. As análises genômicas e filogenéticas demonstraram que NeHEV e CaHEV representam variaoes de uma nova espécie de orthohepevírus, tentativamente designada como "Orthohepevirus E". Também, expandimos a diversidade ecológica dos hospedeiros roedores de orthohepevírus incluindo os Cricetidae. No entanto, estudos adicionais são necessários para elucidar o papel deste vírus como patógenos humanos ou veterinários, especialmente porque roedores é uma importante conexão entre ambiente silvestre e urbano, expondo os seres humanos e animais domésticos a importantes doenças transmitidas por estes animais, como os orthohantavírus e os arenavírus.

6. CONCLUSÕES ü Identificamos cinco grupos geneticamente inéditos (Enseada, Capim, Tacaíuma, Patois, Gamboa) no gênero Orthobunyavirus, que incluem os 35 vírus estudados; ü Os orthobunyavírus Enseada, e os grupos Patois e C provavelmente, utilizam uma nova estratégia de codificação da proteína não estrutural no segmento pequeno de RNA; ü Os vírus Apeu, Itaqui, Oriboca, Zegla e Soberania são prováveis reassortants naturais; ü Bujaru, Tapará e Frijoles são três grupos geneticamente novos no gênero Phlebovirus, família Phenuiviridae; ü O vírus Estero Real representa uma nova espécie na família Nairoviridae; ü O vesiculovírus Piry é provavelmente um arbovírus com base em seu relacionamento filogenético; ü Os Chapparvovirinae descritos são representantes de uma provável nova subfamília dos Parvoviridae; ü Os anellovírus estudados ampliam a diversidade e gama de hospedeiros da família Anelloviridae; ü Orthohepevirus E, associado a roedores Sigmodontinae é uma provável nova espécie na família Hepeviridae. 87

7. REFERÊNCIAS BIBLIOGRÁFICAS 1. Blancou J, Chomel BB, Belotto A, Meslin FX. Emerging or re-emerging bacterial zoonoses: factors of emergence, surveillance and control. Veterinary research. 2005;36(3):507-22. 2. Hubalek Z. Emerging human infectious diseases: anthroponoses, zoonoses, and sapronoses. Emerging infectious diseases. 2003;9(3):403-4. 3. Adamson PB. The spread of rabies into Europe and the probable origin of this disease in antiquity. Journal of the Royal Asiatic Society of Great Britain & Ireland Royal Asiatic Society of Great Britain and Ireland. 1977;2:140-4. 4. Plowright RK, Parrish CR, McCallum H, Hudson PJ, Ko AI, Graham AL, et al. Pathways to zoonotic spillover. Nature reviews Microbiology. 2017. 5. Meltzer E. Arboviruses and viral hemorrhagic fevers (VHF). Infectious disease clinics of North America. 2012;26(2):479-96. 6. Ssemadaali MA, Effertz K, Singh P, Kolyvushko O, Ramamoorthy S. Identification of heterologous Torque Teno Viruses in humans and swine. Scientific reports. 2016;6:26655. 7. Taubenberger JK, Morens DM. 1918 Influenza: the mother of all pandemics. Emerging infectious diseases. 2006;12(1):15-22. 8. Bean AG, Baker ML, Stewart CR, Cowled C, Deffrasnes C, Wang LF, et al. Studying immunity to zoonotic diseases in the natural host - keeping it real. Nature reviews Immunology. 2013;13(12):851-61. 9. Kamar N, Dalton HR, Abravanel F, Izopet J. Hepatitis E virus infection. Clinical microbiology reviews. 2014;27(1):116-38. 10. Kourtis AP, Read JS, Jamieson DJ. Pregnancy and infection. The New England journal of medicine. 2014;370(23):2211-8. 11. Field HE. Hendra virus ecology and transmission. Current opinion in virology. 2016;16:120-5. 12. Herfst S, Bohringer M, Karo B, Lawrence P, Lewis NS, Mina MJ, et al. Drivers of airborne human-to-human pathogen transmission. Current opinion in virology. 2017;22:22-9. 13. Christou L. The global burden of bacterial and viral zoonotic infections. Clinical microbiology and infection : the official publication of the European Society of Clinical Microbiology and Infectious Diseases. 2011;17(3):326-30. 14. Okba NM, Raj VS, Haagmans BL. Middle East respiratory syndrome coronavirus vaccines: current status and novel approaches. Current opinion in virology. 2017;23:49-58. 88

15. Li W, Shi Z, Yu M, Ren W, Smith C, Epstein JH, et al. Bats are natural reservoirs of SARS-like coronaviruses. Science. 2005;310(5748):676-9. 16. Yu H. Universal health insurance coverage for 1.3 billion people: What accounts for China's success? Health policy. 2015;119(9):1145-52. 17. Trad MA, Naughton W, Yeung A, Mazlin L, O'Sullivan M, Gilroy N, et al. Ebola virus disease: An update on current prevention and management strategies. Journal of clinical virology : the official publication of the Pan American Society for Clinical Virology. 2017;86:5-13. 18. Centers-for-Disease-Control-and-Prevention. Cost of the Ebola Epidemic - 2014-2016 West Africa Outbreak. https://http://www.cdc.gov/vhf/ebola/outbreaks/2014-west-africa/cost- of-ebola.html2017. 19. Jones KE, Patel NG, Levy MA, Storeygard A, Balk D, Gittleman JL, et al. Global trends in emerging infectious diseases. Nature. 2008;451(7181):990-3. 20. Meslin FX. Global aspects of emerging and potential zoonoses: a WHO perspective. Emerging infectious diseases. 1997;3(2):223-8. 21. Gould EA, Higgs S. Impact of climate change and other factors on emerging arbovirus diseases. Transactions of the Royal Society of Tropical Medicine and Hygiene. 2009;103(2):109-21. 22. Brackney DE, Armstrong PM. Transmission and evolution of tick-borne viruses. Current opinion in virology. 2016;21:67-74. 23. Kuno G, Chang GJ. Biological transmission of arboviruses: reexamination of and new insights into components, mechanisms, and unique traits as well as their evolutionary trends. Clinical microbiology reviews. 2005;18(4):608-37. 24. Martina BE, Barzon L, Pijlman GP, de la Fuente J, Rizzoli A, Wammes LJ, et al. Human to human transmission of arthropod-borne pathogens. Current opinion in virology. 2017;22:13-21. 25. Haagmans BL, Andeweg AC, Osterhaus AD. The application of genomics to emerging zoonotic viral diseases. PLoS pathogens. 2009;5(10):e1000557. 26. Yu XJ, Liang MF, Zhang SY, Liu Y, Li JD, Sun YL, et al. Fever with thrombocytopenia associated with a novel bunyavirus in China. The New England journal of medicine. 2011;364(16):1523-32. 27. McMullan LK, Folk SM, Kelly AJ, MacNeil A, Goldsmith CS, Metcalfe MG, et al. A new phlebovirus associated with severe febrile illness in Missouri. The New England journal of medicine. 2012;367(9):834-41. 89

28. Chaves-Carballo E. Clara Maass, and human experimentation. Mil Med. 2013;178(5):557-62. 29. Chastel C. [Centenary of the discovery of yellow fever virus and its transmission by a mosquito (Cuba 1900-1901)]. Bull Soc Pathol Exot. 2003;96(3):250-6. 30. Staples JE, Monath TP. Yellow fever: 100 years of discovery. Jama. 2008;300(8):960- 2. 31. Monath TP, Vasconcelos PF. Yellow fever. Journal of clinical virology : the official publication of the Pan American Society for Clinical Virology. 2015;64:160-73. 32. Ortiz-Martinez Y, Patino-Barbosa AM, Rodriguez-Morales AJ. Yellow fever in the Americas: the growing concern about new epidemics. F1000Research. 2017;6:398. 33. Gubler DJ. Dengue and dengue hemorrhagic fever. Clinical microbiology reviews. 1998;11(3):480-96. 34. Gubler DJ. Dengue/dengue haemorrhagic fever: history and current status. Novartis Foundation symposium. 2006;277:3-16; discussion -22, 71-3, 251-3. 35. Bhatt S, Gething PW, Brady OJ, Messina JP, Farlow AW, Moyes CL, et al. The global distribution and burden of dengue. Nature. 2013;496(7446):504-7. 36. Villar L, Dayan GH, Arredondo-Garcia JL, Rivera DM, Cunha R, Deseda C, et al. Efficacy of a tetravalent dengue vaccine in children in Latin America. The New England journal of medicine. 2015;372(2):113-23. 37. Scott LJ. Tetravalent Dengue Vaccine: A Review in the Prevention of Dengue Disease. Drugs. 2016;76(13):1301-12. 38. Kraemer MU, Sinka ME, Duda KA, Mylne AQ, Shearer FM, Barker CM, et al. The global distribution of the arbovirus vectors Aedes aegypti and Ae. albopictus. eLife. 2015;4:e08347. 39. Dick GW, Kitchen SF, Haddow AJ. . I. Isolations and serological specificity. Transactions of the Royal Society of Tropical Medicine and Hygiene. 1952;46(5):509-20. 40. Wikan N, Smith DR. Zika virus: history of a newly emerging arbovirus. The Lancet Infectious diseases. 2016;16(7):e119-26. 41. Duffy MR, Chen TH, Hancock WT, Powers AM, Kool JL, Lanciotti RS, et al. Zika virus outbreak on Yap Island, Federated States of Micronesia. The New England journal of medicine. 2009;360(24):2536-43. 42. Musso D, Gubler DJ. Zika Virus. Clinical microbiology reviews. 2016;29(3):487-524. 90

43. Faria NR, Azevedo Rdo S, Kraemer MU, Souza R, Cunha MS, Hill SC, et al. Zika virus in the Americas: Early epidemiological and genetic findings. Science. 2016;352(6283):345-9. 44. Calvet G, Aguiar RS, Melo AS, Sampaio SA, de Filippis I, Fabri A, et al. Detection and sequencing of Zika virus from amniotic fluid of fetuses with microcephaly in Brazil: a case study. The Lancet Infectious diseases. 2016;16(6):653-60. 45. Metsky HC, Matranga CB, Wohl S, Schaffner SF, Freije CA, Winnicki SM, et al. Zika virus evolution and spread in the Americas. Nature. 2017;546(7658):411-5. 46. Faria NR, Quick J, Claro IM, Theze J, de Jesus JG, Giovanetti M, et al. Establishment and cryptic transmission of Zika virus in Brazil and the Americas. Nature. 2017;546(7658):406-10. 47. Liu Y, Liu J, Du S, Shan C, Nie K, Zhang R, et al. Evolutionary enhancement of Zika virus infectivity in Aedes aegypti mosquitoes. Nature. 2017;545(7655):482-6. 48. McArthur MA. Zika Virus: Recent Advances towards the Development of Vaccines and Therapeutics. Viruses. 2017;9(6). 49. Lo Presti A, Cella E, Angeletti S, Ciccozzi M. Molecular epidemiology, evolution and phylogeny of Chikungunya virus: An updating review. Infection, genetics and evolution : journal of molecular epidemiology and evolutionary genetics in infectious diseases. 2016;41:270-8. 50. Rougeron V, Sam IC, Caron M, Nkoghe D, Leroy E, Roques P. Chikungunya, a paradigm of neglected tropical disease that emerged to be a new health global risk. Journal of clinical virology : the official publication of the Pan American Society for Clinical Virology. 2015;64:144-52. 51. Nunes MR, Faria NR, de Vasconcelos JM, Golding N, Kraemer MU, de Oliveira LF, et al. Emergence and potential for spread of Chikungunya virus in Brazil. BMC medicine. 2015;13:102. 52. Abdelnabi R, Neyts J, Delang L. Chikungunya virus infections: time to act, time to treat. Current opinion in virology. 2017;24:25-30. 53. Vasconcelos PF, Travassos da Rosa AP, Rodrigues SG, Travassos da Rosa ES, Degallier N, Travassos da Rosa JF. Inadequate management of natural ecosystem in the Brazilian Amazon region results in the emergence and reemergence of arboviruses. Cadernos de saude publica. 2001;17 Suppl:155-64. 54. Travassos da Rosa JF, de Souza WM, Pinheiro FP, Figueiredo ML, Cardoso JF, Acrani GO, et al. Oropouche Virus: Clinical, Epidemiological, and Molecular Aspects of a 91

Neglected Orthobunyavirus. The American journal of tropical medicine and hygiene. 2017;96(5):1019-30. 55. Rodriguez-Morales AJ, Paniz-Mondolfi AE, Villamil-Gomez WE, Navarro JC. Mayaro, Oropouche and Venezuelan Equine Encephalitis viruses: Following in the footsteps of Zika? Travel medicine and infectious disease. 2017;15:72-3. 56. Mourao MP, Bastos Mde S, de Figueiredo RP, Gimaque JB, Galusso Edos S, Kramer VM, et al. Mayaro fever in the city of Manaus, Brazil, 2007-2008. Vector borne and zoonotic diseases. 2012;12(1):42-6. 57. Rosa APdATd. The history of Arbovirology at Instituto Evandro Chagas, Belém, Pará, Brazil, from 1954 to 1998. Revista Pan-Amazônica de Saúde. 2016;7:61-70. 58. van Kammen A. Beijerinck's contribution to the virus concept--an introduction. Arch Virol Suppl. 1999;15:1-8. 59. Bos L. Beijerinck's work on tobacco mosaic virus: historical context and legacy. Philos Trans R Soc Lond B Biol Sci. 1999;354(1383):675-85. 60. Lustig A, Levine AJ. One hundred years of virology. Journal of virology. 1992;66(8):4629-31. 61. Rott R, Siddell S. One hundred years of animal virology. The Journal of general virology. 1998;79 ( Pt 11):2871-4. 62. Rous P. A Sarcoma of the Fowl Transmissible by an Agent Separable from the Tumor Cells. The Journal of experimental medicine. 1911;13(4):397-411. 63. Weller TH, Enders JF. Production of hemagglutinin by mumps and influenza A viruses in suspended cell tissue cultures. Proceedings of the Society for Experimental Biology and Medicine Society for Experimental Biology and Medicine. 1948;69(1):124-8. 64. Bedson SaB, J. Complement-fixation with filterable viruses and their antisera. British Journal of Experimental Pathology. 1929;10:11. 65. Liu C. Rapid diagnosis of human influenza infection from nasal smears by means of fluorescein-labeled . Proceedings of the Society for Experimental Biology and Medicine Society for Experimental Biology and Medicine. 1956;92(4):883-7. 66. Brenner S, Horne RW. A negative staining method for high resolution electron microscopy of viruses. Biochim Biophys Acta. 1959;34:103-10. 67. Kohler G, Milstein C. Continuous cultures of fused cells secreting antibody of predefined specificity. Nature. 1975;256(5517):495-7. 68. Josko D. Updates in immunoassays: virology. Clin Lab Sci. 2012;25(3):179-84. 92

69. Davis BJ. Disc Electrophoresis. Ii. Method and Application to Human Serum Proteins. Ann N Y Acad Sci. 1964;121:404-27. 70. Ornstein L. Disc Electrophoresis. I. Background and Theory. Ann N Y Acad Sci. 1964;121:321-49. 71. Burke DS, Brandt BL, Redfield RR, Lee TH, Thorn RM, Beltz GA, et al. Diagnosis of human immunodeficiency virus infection by immunoassay using a molecularly cloned and expressed virus envelope polypeptide. Comparison to Western blot on 2707 consecutive serum samples. Ann Intern Med. 1987;106(5):671-6. 72. Southern EM. Detection of specific sequences among DNA fragments separated by gel electrophoresis. Journal of molecular biology. 1975;98(3):503-17. 73. Alwine JC, Kemp DJ, Stark GR. Method for detection of specific RNAs in agarose gels by transfer to diazobenzyloxymethyl-paper and hybridization with DNA probes. Proceedings of the National Academy of Sciences of the United States of America. 1977;74(12):5350-4. 74. Mullis KB. The unusual origin of the polymerase chain reaction. Scientific American. 1990;262(4):56-61, 4-5. 75. Shibata DK, Arnheim N, Martin WJ. Detection of human papilloma virus in paraffin- embedded tissue using the polymerase chain reaction. The Journal of experimental medicine. 1988;167(1):225-30. 76. Hart C, Schochetman G, Spira T, Lifson A, Moore J, Galphin J, et al. Direct detection of HIV RNA expression in seropositive subjects. Lancet. 1988;2(8611):596-9. 77. Abe A, Inoue K, Tanaka T, Kato J, Kajiyama N, Kawaguchi R, et al. Quantitation of hepatitis B virus genomic DNA by real-time detection PCR. Journal of clinical microbiology. 1999;37(9):2899-903. 78. Shi L, Ho J, Norling LA, Roy M, Xu Y. A real time quantitative PCR-based method for the detection and quantification of simian virus 40. Biologicals. 1999;27(3):241-52. 79. Dahm R. Friedrich Miescher and the discovery of DNA. Dev Biol. 2005;278(2):274- 88. 80. Avery OT, Macleod CM, McCarty M. Studies on the Chemical Nature of the Substance Inducing Transformation of Pneumococcal Types : Induction of Transformation by a Desoxyribonucleic Acid Fraction Isolated from Pneumococcus Type Iii. The Journal of experimental medicine. 1944;79(2):137-58. 81. Watson JD, Crick FH. Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid. Nature. 1953;171(4356):737-8. 93

82. Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors. Proceedings of the National Academy of Sciences of the United States of America. 1977;74(12):5463-7. 83. Sanger F, Coulson AR. A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase. Journal of molecular biology. 1975;94(3):441-8. 84. Shendure J, Ji H. Next-generation DNA sequencing. Nature biotechnology. 2008;26(10):1135-45. 85. Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, et al. Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene. Nature. 1976;260(5551):500-7. 86. Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, et al. Nucleotide sequence of bacteriophage phi X174 DNA. Nature. 1977;265(5596):687-95. 87. Baer R, Bankier AT, Biggin MD, Deininger PL, Farrell PJ, Gibson TJ, et al. DNA sequence and expression of the B95-8 Epstein-Barr virus genome. Nature. 1984;310(5974):207-11. 88. Ratner L, Haseltine W, Patarca R, Livak KJ, Starcich B, Josephs SF, et al. Complete nucleotide sequence of the AIDS virus, HTLV-III. Nature. 1985;313(6000):277-84. 89. Smith LM, Sanders JZ, Kaiser RJ, Hughes P, Dodd C, Connell CR, et al. Fluorescence detection in automated DNA sequence analysis. Nature. 1986;321(6071):674-9. 90. Pareek CS, Smoczynski R, Tretyn A. Sequencing technologies and genome sequencing. J Appl Genet. 2011;52(4):413-35. 91. Hutchison CA, 3rd. DNA sequencing: bench to bedside and beyond. Nucleic acids research. 2007;35(18):6227-37. 92. Adams MD, Celniker SE, Holt RA, Evans CA, Gocayne JD, Amanatides PG, et al. The genome sequence of Drosophila melanogaster. Science. 2000;287(5461):2185-95. 93. Consortium CeS. Genome sequence of the nematode C. elegans: a platform for investigating biology. Science. 1998;282(5396):2012-8. 94. Church DM, Goodstadt L, Hillier LW, Zody MC, Goldstein S, She X, et al. Lineage- specific biology revealed by a finished genome assembly of the mouse. PLoS Biol. 2009;7(5):e1000112. 95. Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, et al. The sequence of the human genome. Science. 2001;291(5507):1304-51. 96. Sims D, Sudbery I, Ilott NE, Heger A, Ponting CP. Sequencing depth and coverage: key considerations in genomic analyses. Nature reviews Genetics. 2014;15(2):121-32. 94

97. Rothberg JM, Leamon JH. The development and impact of 454 sequencing. Nature biotechnology. 2008;26(10):1117-24. 98. Goodwin S, McPherson JD, McCombie WR. Coming of age: ten years of next- generation sequencing technologies. Nature reviews Genetics. 2016;17(6):333-51. 99. Reuter JA, Spacek DV, Snyder MP. High-throughput sequencing technologies. Molecular cell. 2015;58(4):586-97. 100. Catanese MT, Dorner M. Advances in experimental systems to study hepatitis C virus in vitro and in vivo. Virology. 2015;479-480:221-33. 101. Bench SR, Hanson TE, Williamson KE, Ghosh D, Radosovich M, Wang K, et al. Metagenomic characterization of Chesapeake Bay virioplankton. Appl Environ Microbiol. 2007;73(23):7629-41. 102. Thurber RV, Haynes M, Breitbart M, Wegley L, Rohwer F. Laboratory procedures to generate viral metagenomes. Nature protocols. 2009;4(4):470-83. 103. Zhang T, Breitbart M, Lee WH, Run JQ, Wei CL, Soh SW, et al. RNA viral community in human feces: prevalence of plant pathogenic viruses. PLoS Biol. 2006;4(1):e3. 104. Edwards RA, Rohwer F. Viral metagenomics. Nature reviews Microbiology. 2005;3(6):504-10. 105. Delwart EL. Viral metagenomics. Reviews in medical virology. 2007;17(2):115-31. 106. Bibby K. Metagenomic identification of viral pathogens. Trends in biotechnology. 2013;31(5):275-9. 107. Qin XC, Shi M, Tian JH, Lin XD, Gao DY, He JR, et al. A tick-borne segmented RNA virus contains genome segments derived from unsegmented viral ancestors. Proceedings of the National Academy of Sciences of the United States of America. 2014;111(18):6744-9. 108. Shi M, Lin XD, Tian JH, Chen LJ, Chen X, Li CX, et al. Redefining the invertebrate RNA virosphere. Nature. 2016. 109. Baker KS, Leggett RM, Bexfield NH, Alston M, Daly G, Todd S, et al. Metagenomic study of the viruses of African straw-coloured fruit bats: detection of a chiropteran poxvirus and isolation of a novel adenovirus. Virology. 2013;441(2):95-106. 110. Smits SL, Osterhaus AD. Virus discovery: one step beyond. Current opinion in virology. 2013. 111. Marz M, Beerenwinkel N, Drosten C, Fricke M, Frishman D, Hofacker IL, et al. Challenges in RNA virus bioinformatics. Bioinformatics. 2014;30(13):1793-9. 112. Chiu CY. Viral pathogen discovery. Current opinion in microbiology. 2013. 95

113. Bexfield N, Kellam P. Metagenomics and the molecular identification of novel viruses. Veterinary journal. 2011;190(2):191-8. 114. Mokili JL, Rohwer F, Dutilh BE. Metagenomics and future perspectives in virus discovery. Current opinion in virology. 2012;2(1):63-77. 115. Berg MG, Lee D, Coller K, Frankel M, Aronsohn A, Cheng K, et al. Discovery of a Novel Human Pegivirus in Blood Associated with Hepatitis C Virus Co-Infection. PLoS pathogens. 2015;11(12):e1005325. 116. Li CX, Shi M, Tian JH, Lin XD, Kang YJ, Chen LJ, et al. Unprecedented genomic diversity of RNA viruses in arthropods reveals the ancestry of negative-sense RNA viruses. eLife. 2015;4. 117. Roossinck MJ. Move over, bacteria! Viruses make their mark as mutualistic microbial symbionts. Journal of virology. 2015;89(13):6532-5. 118. Simmonds P, Adams MJ, Benko M, Breitbart M, Brister JR, Carstens EB, et al. Consensus statement: Virus taxonomy in the age of metagenomics. Nature reviews Microbiology. 2017;15(3):161-8. 119. Suttle CA. Viruses: unlocking the greatest biodiversity on Earth. Genome. 2013;56(10):542-4. 120. Igarashi A. Isolation of a Singh's Aedes albopictus cell clone sensitive to Dengue and Chikungunya viruses. The Journal of general virology. 1978;40(3):531-44. 121. Ammerman NC, Beier-Sexton M, Azad AF. Growth and maintenance of Vero cell lines. Current protocols in microbiology. 2008;Appendix 4:Appendix 4E. 122. Bonvicino CR, Oliveira JA, D'Andrea PS. Guia dos roedores do Brasil, com chaves para gêneros baseadas em caracteres externos. 1st ed. Rio de Janeiro, Brazil: Centro Pan- Americano de Febre Aftosa-Pan-American Health Organization//World Health Organization; 2008. 120 p. 123. Sikes RS, Gannon WL. Guidelines of the American Society of Mammalogists for the use of wild mammals in research. Journal of Mammalogy 2011;92(1). 124. Chevreux B, Pfisterer T, Drescher B, Driesel AJ, Muller WE, Wetter T, et al. Using the miraEST assembler for reliable and automated mRNA transcript assembly and SNP detection in sequenced ESTs. Genome research. 2004;14(6):1147-59. 125. Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. Basic local alignment search tool. Journal of molecular biology. 1990;215(3):403-10. 126. Schmieder R, Edwards R. Quality control and preprocessing of metagenomic datasets. Bioinformatics. 2011;27(6):863-4. 96

127. Schmieder R, Lim YW, Edwards R. Identification and removal of ribosomal RNA sequences from metatranscriptomes. Bioinformatics. 2012;28(3):433-5. 128. Buchfink B, Xie C, Huson DH. Fast and sensitive protein alignment using DIAMOND. Nature methods. 2015;12(1):59-60. 129. Peng Y, Leung HC, Yiu SM, Chin FY. IDBA-UD: a de novo assembler for single-cell and metagenomic sequencing data with highly uneven depth. Bioinformatics. 2012;28(11):1420-8. 130. Bankevich A, Nurk S, Antipov D, Gurevich AA, Dvorkin M, Kulikov AS, et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of computational biology : a journal of computational molecular cell biology. 2012;19(5):455-77. 131. Soto-Jimenez LM, Estrada K, Sanchez-Flores A. GARM: genome assembly, reconciliation and merging pipeline. Current topics in medicinal chemistry. 2014;14(3):418- 24. 132. Ondov BD, Bergman NH, Phillippy AM. Interactive metagenomic visualization in a Web browser. BMC bioinformatics. 2011;12:385. 133. Marchler-Bauer A, Derbyshire MK, Gonzales NR, Lu S, Chitsaz F, Geer LY, et al. CDD: NCBI's conserved domain database. Nucleic acids research. 2015;43(Database issue):D222-6. 134. Tsirigos KD, Peters C, Shu N, Kall L, Elofsson A. The TOPCONS web server for consensus prediction of membrane protein topology and signal peptides. Nucleic acids research. 2015;43(W1):W401-7. 135. Xia X, Xie Z. DAMBE: software package for data analysis in molecular biology and evolution. The Journal of heredity. 2001;92(4):371-3. 136. Katoh K, Standley DM. MAFFT multiple sequence alignment software version 7: improvements in performance and usability. Molecular biology and evolution. 2013;30(4):772-80. 137. Edgar RC. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic acids research. 2004;32(5):1792-7. 138. Wernersson R, Pedersen AG. RevTrans: Multiple alignment of coding DNA from aligned amino acid sequences. Nucleic acids research. 2003;31(13):3537-9. 139. Posada D. jModelTest: phylogenetic model averaging. Molecular biology and evolution. 2008;25(7):1253-6. 97

140. Darriba D, Taboada GL, Doallo R, Posada D. ProtTest 3: fast selection of best-fit models of protein evolution. Bioinformatics. 2011;27(8):1164-5. 141. Anisimova M, Gascuel O. Approximate likelihood-ratio test for branches: A fast, accurate, and powerful alternative. Systematic biology. 2006;55(4):539-52. 142. Nguyen LT, Schmidt HA, von Haeseler A, Minh BQ. IQ-TREE: a fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies. Molecular biology and evolution. 2015;32(1):268-74. 143. Guindon S, Dufayard JF, Lefort V, Anisimova M, Hordijk W, Gascuel O. New algorithms and methods to estimate maximum-likelihood phylogenies: assessing the performance of PhyML 3.0. Systematic biology. 2010;59(3):307-21. 144. Stamatakis A. RAxML-VI-HPC: maximum likelihood-based phylogenetic analyses with thousands of taxa and mixed models. Bioinformatics. 2006;22(21):2688-90. 145. Tamura K, Stecher G, Peterson D, Filipski A, Kumar S. MEGA6: Molecular Evolutionary Genetics Analysis version 6.0. Molecular biology and evolution. 2013;30(12):2725-9. 146. Muhire BM, Varsani A, Martin DP. SDT: a virus classification tool based on pairwise sequence alignment and identity calculation. PloS one. 2014;9(9):e108277. 147. Martin DP, Murrell B, Golden M, Khoosal A, Muhire B. RDP4: Detection and analysis of recombination patterns in virus genomes. Virus Evolution. 2015;1:5. 148. Gifford RJ, Blanco-Melo D, Zhu H, Dennis T, Singer J, Hughes J, et al. The DIGS Tool: Genomic beachcombing using BLAST and a relational database. http://giffordlabcvr.github.io/DIGS-tool/2016 [cited 2016 26 Sep 2016]. 149. Matsuno K, Weisend C, Travassos da Rosa AP, Anzick SL, Dahlstrom E, Porcella SF, et al. Characterization of the Bhanja serogroup viruses (Bunyaviridae): a novel species of the genus Phlebovirus and its relationship with other emerging tick-borne phleboviruses. Journal of virology. 2013;87(7):3719-28. 150. Kuhn JH, Wiley MR, Rodriguez SE, Bao Y, Prieto K, Travassos da Rosa AP, et al. Genomic Characterization of the Genus Nairovirus (Family Bunyaviridae). Viruses. 2016;8(6). 151. Nishiyama S, Dutia BM, Stewart JP, Meredith AL, Shaw DJ, Simmonds P, et al. Identification of novel anelloviruses with broad diversity in UK rodents. The Journal of general virology. 2014;95(Pt 7):1544-53. 152. Shi C, Liu Y, Hu X, Xiong J, Zhang B, Yuan Z. A metagenomic survey of viral abundance and diversity in mosquitoes from Hubei province. PloS one. 2015;10(6):e0129845. 98

153. Cibulski SP, Teixeira TF, de Sales Lima FE, do Santos HF, Franco AC, Roehe PM. A Novel Anelloviridae Species Detected in Tadarida brasiliensis Bats: First Sequence of a Chiropteran Anellovirus. Genome announcements. 2014;2(5). 154. Reguera J, Weber F, Cusack S. Bunyaviridae RNA polymerases (L-protein) have an N-terminal, influenza-like endonuclease domain, essential for viral cap-dependent transcription. PLoS pathogens. 2010;6(9):e1001101. 155. Elliott RM. Orthobunyaviruses: recent genetic and structural insights. Nature reviews Microbiology. 2014;12(10):673-85. 156. Shi X, Kohl A, Leonard VH, Li P, McLees A, Elliott RM. Requirement of the N- terminal region of orthobunyavirus nonstructural protein NSm for virus assembly and morphogenesis. Journal of virology. 2006;80(16):8089-99. 157. Pollitt E, Zhao J, Muscat P, Elliott RM. Characterization of Maguari orthobunyavirus mutants suggests the nonstructural protein NSm is not essential for growth in tissue culture. Virology. 2006;348(1):224-32. 158. Kraatz F, Wernike K, Hechinger S, Konig P, Granzow H, Reimann I, et al. Deletion mutants of Schmallenberg virus are avirulent and protect from virus challenge. Journal of virology. 2015;89(3):1825-37. 159. Tilston-Lunel NL, Acrani GO, Randall RE, Elliott RM. Generation of Recombinant Oropouche Viruses Lacking the Nonstructural Protein NSm or NSs. Journal of virology. 2015;90(5):2616-27. 160. Dong H, Li P, Elliott RM, Dong C. Structure of Schmallenberg orthobunyavirus nucleoprotein suggests a novel mechanism of genome encapsidation. Journal of virology. 2013;87(10):5593-601. 161. Leonard VH, Kohl A, Hart TJ, Elliott RM. Interaction of Bunyamwera Orthobunyavirus NSs protein with mediator protein MED8: a mechanism for inhibiting the interferon response. Journal of virology. 2006;80(19):9667-75. 162. Forshey BM, Castillo RM, Hang J. Group C orthobunyavirus genomic sequences require validation. Journal of virology. 2014;88(5):3052-3. 163. Hang J, Forshey BM, Yang Y, Solorzano VF, Kuschner RA, Halsey ES, et al. Genomic characterization of group C Orthobunyavirus reference strains and recent South American clinical isolates. PloS one. 2014;9(3):e92114. 164. Lanciotti RS, Kosoy OI, Bosco-Lauth AM, Pohl J, Stuchlik O, Reed M, et al. Isolation of a novel orthobunyavirus (Brazoran virus) with a 1.7 kb S segment that encodes a unique 99 nucleocapsid protein possessing two putative functional domains. Virology. 2013;444(1- 2):55-63. 165. Gouzil J, Fablet A, Lara E, Caignard G, Cochet M, Kundlacz C, et al. The nonstructural protein NSs of Schmallenberg virus is targeted to the nucleolus and induces nucleolar disorganization. Journal of virology. 2016. 166. Causey OR, Causey CE, Maroja OM, Macedo DG. The isolation of arthropod-borne viruses, including members of two hitherto undescribed serological groups, in the Amazon region of Brazil. The American journal of tropical medicine and hygiene. 1961;10:227-49. 167. Calisher CH, Coimbra TL, Lopez Ode S, Muth DJ, Sacchetta Lde A, Francy DB, et al. Identification of new Guama and Group C serogroup bunyaviruses and an ungrouped virus from Southern Brazil. The American journal of tropical medicine and hygiene. 1983;32(2):424-31. 168. Calisher CH, Gutierrez E, Francy DB, Alava A, Muth DJ, Lazuick JS. Identification of hitherto unrecognized arboviruses from Ecuador: members of serogroups B, C, Bunyamwera, Patois, and Minatitlan. The American journal of tropical medicine and hygiene. 1983;32(4):877-85. 169. Casals J, Whitman L. Group C, a new serological group of hitherto undescribed arthropod-borne viruses. Immunological studies. The American journal of tropical medicine and hygiene. 1961;10:250-8. 170. Nunes MR, Travassos da Rosa AP, Weaver SC, Tesh RB, Vasconcelos PF. Molecular epidemiology of group C viruses (Bunyaviridae, Orthobunyavirus) isolated in the Americas. Journal of virology. 2005;79(16):10561-70. 171. Palacios G, Tesh R, Travassos da Rosa A, Savji N, Sze W, Jain K, et al. Characterization of the Candiru antigenic complex (Bunyaviridae: Phlebovirus), a highly diverse and reassorting group of viruses affecting humans in tropical America. Journal of virology. 2011;85(8):3811-20. 172. Scherer WF, Madalengoitia J, Flores W, Acosta M. The first isolations of eastern encephalitis, group C, and Guama group arboviruses from the Peruvian Amazon region of western South America. Bulletin of the Pan American Health Organization. 1975;9(1):19-26. 173. Shchetinin AM, Lvov DK, Deriabin PG, Botikov AG, Gitelman AK, Kuhn JH, et al. Genetic and Phylogenetic Characterization of Tataguine and Witwatersrand Viruses and Other Orthobunyaviruses of the Anopheles A, Capim, Guama, Koongol, Mapputta, Tete, and Turlock Serogroups. Viruses. 2015;7(11):5987-6008. 100

174. Doherty RL, Carley JG, Mackerras MJ, Marks EN. Studies of arthropod-borne virus infections in Queensland. III. Isolation and characterization of virus strains from wild-caught mosquitoes in North Queensland. The Australian journal of experimental biology and medical science. 1963;41:17-39. 175. Doherty RL, Wetters EJ, Gorman BM, Whitehead RH. Arbovirus infection in Western Queensland: serological studies, 1963-1969. Transactions of the Royal Society of Tropical Medicine and Hygiene. 1970;64(5):740-7. 176. Sanderson CJ. A serologic survey of Queensland cattle for evidence of arbovirus infections. The American journal of tropical medicine and hygiene. 1969;18(3):433-9. 177. Beaty BJ, Bishop DH. Bunyavirus-vector interactions. Virus research. 1988;10(4):289-301. 178. Calisher CH. History, Classification, and Taxonomy of viruses in the Family Bunyaviridae. In: Elliott RM, editor. The Bunyaviridae. New York: Plenum Press; 1996. p. 1- 18. 179. Scherer WF, Anderson K, Dickerman RW, Ordonez JV. Studies of Patois group arboviruses in Mexico, Guatemala, Honduras, and British Honduras. The American journal of tropical medicine and hygiene. 1972;21(2):194-200. 180. Srihongse S, Shope RE. The Patois group of arboviruses. Acta virologica. 1968;12(5):453-6. 181. Zarate ML, Geiger RH, Shope RE, Scherer WF. Intergroup antigenic relationships among Arboviruses manifested by a Mexican strain of Patois virus and viruses of the Bunyamwera, C, California, Capim and Guama groups. American journal of epidemiology. 1968;88(2):273-86. 182. Mohamed M, McLees A, Elliott RM. Viruses in the Anopheles A, Anopheles B, and Tete serogroups in the Orthobunyavirus genus (family Bunyaviridae) do not encode an NSs protein. Journal of virology. 2009;83(15):7612-8. 183. Vasconcelos PFC, Travassos Da Rosa APA, DeGallieŕ N, Travassos Da Rosa JFS, Pinheiro FP. Clinical and epidemiological situation of human arboviruses in Brazilian Amazonia. Cienciâ e Cultura. 1992;44(2):117-24. 184. Briese T, Calisher CH, Higgs S. Viruses of the family Bunyaviridae: are all available isolates reassortants? Virology. 2013;446(1-2):207-16. 185. Goller KV, Hoper D, Schirrmeier H, Mettenleiter TC, Beer M. Schmallenberg virus as possible ancestor of Shamonda virus. Emerging infectious diseases. 2012;18(10):1644-6. 101

186. Yanase T, Kato T, Aizawa M, Shuto Y, Shirafuji H, Yamakawa M, et al. Genetic reassortment between Sathuperi and Shamonda viruses of the genus Orthobunyavirus in nature: implications for their genetic relationship to Schmallenberg virus. Archives of virology. 2012;157(8):1611-6. 187. Aguilar PV, Barrett AD, Saeed MF, Watts DM, Russell K, Guevara C, et al. Iquitos virus: a novel reassortant Orthobunyavirus associated with human illness in Peru. PLoS neglected tropical diseases. 2011;5(9):e1315. 188. de Brito Magalhaes CL, Drumond BP, Novaes RF, Quinan BR, de Magalhaes JC, dos Santos JR, et al. Identification of a phylogenetically distinct orthobunyavirus from group C. Archives of virology. 2011;156(7):1173-84. 189. Hontz RD, Guevara C, Halsey ES, Silvas J, Santiago FW, Widen SG, et al. Itaya virus, a Novel Orthobunyavirus Associated with Human Febrile Illness, Peru. Emerging infectious diseases. 2015;21(5):781-8. 190. Eastwood G, Loaiza JR, Pongsiri MJ, Sanjur OI, Pecor JE, Auguste AJ, et al. Enzootic Arbovirus Surveillance in Forest Habitat and Phylogenetic Characterization of Novel Isolates of Gamboa Virus in Panama. The American journal of tropical medicine and hygiene. 2016;94(4):786-93. 191. Palacios G, Savji N, Travassos da Rosa A, Guzman H, Yu X, Desai A, et al. Characterization of the Uukuniemi virus group (Phlebovirus: Bunyaviridae): evidence for seven distinct species. Journal of virology. 2013;87(6):3187-95. 192. Palacios G, da Rosa AT, Savji N, Sze W, Wick I, Guzman H, et al. Aguacate virus, a new antigenic complex of the genus Phlebovirus (family Bunyaviridae). The Journal of general virology. 2011;92(Pt 6):1445-53. 193. Tesh RB. The genus Phlebovirus and its vectors. Annual review of entomology. 1988;33:169-81. 194. Srihongse S, Johnson CM. Human infections with Chagres virus in Panama. The American journal of tropical medicine and hygiene. 1974;23(4):690-3. 195. Peralta PH, Shelokov A, Brody JA. Chagres Virus: A New Human Isolate from Panama. The American journal of tropical medicine and hygiene. 1965;14:146-51. 196. Bichaud L, Dachraoui K, Alwassouf S, Alkan C, Mensi M, Piorkowski G, et al. Isolation, full genomic characterization and neutralization-based human seroprevalence of Medjerda Valley virus, a novel sandfly-borne phlebovirus belonging to the Salehabad virus complex in northern Tunisia. The Journal of general virology. 2016;97(3):602-10. 102

197. Briese T, Alkhovsky S, Beer M, Calisher CH, Charrel R, Ebihara H, et al. Implementation of non-Latinized binomial species names in the family Bunyaviridae. International Committee on Taxonomy of Viruses 2015 Contract No.: 2015.003aM. 198. Honig JE, Osborne JC, Nichol ST. The high genetic variation of viruses of the genus Nairovirus reflects the diversity of their predominant tick hosts. Virology. 2004;318(1):10-6. 199. Bente DA, Forrester NL, Watts DM, McAuley AJ, Whitehouse CA, Bray M. Crimean- Congo hemorrhagic fever: history, epidemiology, pathogenesis, clinical syndrome and genetic diversity. Antiviral research. 2013;100(1):159-89. 200. Walker PJ, Widen SG, Firth C, Blasdell KR, Wood TG, Travassos da Rosa AP, et al. Genomic Characterization of Yogue, Kasokero, Issyk-Kul, Keterah, Gossas, and Thiafora Viruses: Nairoviruses Naturally Infecting Bats, Shrews, and Ticks. The American journal of tropical medicine and hygiene. 2015;93(5):1041-51. 201. Walker PJ, Widen SG, Wood TG, Guzman H, Tesh RB, Vasilakis N. A Global Genomic Characterization of Nairoviruses Identifies Nine Discrete Genogroups with Distinctive Structural Characteristics and Host-Vector Associations. The American journal of tropical medicine and hygiene. 2016;94(5):1107-22. 202. Kohls GM, Sonenshine DE, Clifford CM. The systematics of the subfamily Ornithodorinae (Acarina: Argasidae). II. Identification of the larvae of the Western Hemisphere and descriptions of three new species. Annals of the Entomological Society of America. 1965;58(3):331-64. 203. Converse JD, Hoogstraal H, Moussa MI, Feare CJ, Kaiser MN. Soldado virus (Hughes group) from Ornithodoros (Alectorobius) capensis (Ixodoidea: Argasidae) infesting Sooty Tern colonies in the Seychelles, Indian Ocean. The American journal of tropical medicine and hygiene. 1975;24(6 Pt 1):1010-8. 204. Varma MG, Bowen ET, Simpson DI, Casals J. Zirga virus, a new arbovirus isolated from bird-infesting ticks. Nature. 1973;244(5416):452. 205. Lichty BD, Power AT, Stojdl DF, Bell JC. Vesicular stomatitis virus: re-inventing the bullet. Trends in molecular medicine. 2004;10(5):210-6. 206. Figueiredo LT, da Rosa AP, Fiorillo AM. [Prevalence of neutralizing to Piry arbovirus in subjects of the region of Ribeirao Preto, State of Sao Paulo]. Revista do Instituto de Medicina Tropical de Sao Paulo. 1985;27(3):157-61. 207. Tavares-Neto J, Travassos da Rosa AP, Ataide M, Morais-Souza H, Vasconcelos P, Travassos da Rosa J. [Frequency of neutralizing antibodies to the vesiculovirus Piry, in blood 103 donors of Uberaba, Minas Gerais, Brazil]. Revista do Instituto de Medicina Tropical de Sao Paulo. 1990;32(3):211-4. 208. Pinheiro FP, Bensabath G, Andrade AH, Lins ZC, Fraiha H, Tang AT, et al. Infectious diseases along Brazil's trans-amazon highway: surveillance and research. Bulletin of the Pan American Health Organization. 1974;8(2):111-22. 209. Wilks CR, House JA. Susceptibility of various animals to the vesiculovirus Piry. The Journal of hygiene. 1984;93(1):147-55. 210. de Sousa AA, Reis R, Bento-Torres J, Trevia N, Lins NA, Passos A, et al. Influence of enriched environment on outcomes: behavioral and neuropathological changes in albino Swiss mice. PloS one. 2011;6(1):e15597. 211. Brun G, Bao X, Prevec L. The relationship of Piry virus to other vesiculoviruses: a re- evaluation based on the glycoprotein gene sequence. Intervirology. 1995;38(5):274-82. 212. Nichol ST, Holland JJ. Genome RNA terminus conservation and diversity among vesiculoviruses. J Virol. 1987;61(1):200-5. 213. Clerc Y, Rodhain F, Digoutte JP, Tesh R, Heme G, Coulanges P. [The Perinet virus, rhabdoviridae, of the vesiculovirus type isolated in Madagascar from Culicidae]. Archives de l'Institut Pasteur de Madagascar. 1982;49(1):119-29. 214. Marriott AC. Complete genome sequences of Chandipura and Isfahan vesiculoviruses. Archives of virology. 2005;150(4):671-80. 215. Cherian SS, Gunjikar RS, Banerjee A, Kumar S, Arankalle VA. Whole genomes of Chandipura virus isolates and comparative analysis with other rhabdoviruses. PloS one. 2012;7(1):e30315. 216. Vasilakis N, Widen S, Travassos da Rosa AP, Wood TG, Walker PJ, Holmes EC, et al. Malpais spring virus is a new species in the genus vesiculovirus. Virology journal. 2013;10:69. 217. Tesh R, Saidi S, Javadian E, Loh P, Nadim A. Isfahan virus, a new vesiculovirus infecting humans, gerbils, and sandflies in Iran. The American journal of tropical medicine and hygiene. 1977;26(2):299-306. 218. Walker PJ, Firth C, Widen SG, Blasdell KR, Guzman H, Wood TG, et al. Evolution of genome size and complexity in the rhabdoviridae. PLoS pathogens. 2015;11(2):e1004664. 219. Liniger M, Zuniga A, Naim HY. Use of viral vectors for the development of vaccines. Expert review of vaccines. 2007;6(2):255-66. 220. Cotmore SF, Agbandje-McKenna M, Chiorini JA, Mukha DV, Pintel DJ, Qiu J, et al. The family Parvoviridae. Archives of virology. 2014;159(5):1239-47. 104

221. Yang S, Liu Z, Wang Y, Li W, Fu X, Lin Y, et al. A novel rodent Chapparvovirus in feces of wild rats. Virology journal. 2016;13:133. 222. Kivovich V, Gilbert L, Vuento M, Naides SJ. The putative metal coordination motif in the endonuclease domain of human Parvovirus B19 NS1 is critical for NS1 induced S phase arrest and DNA damage. International journal of biological sciences. 2012;8(1):79-92. 223. Walker SL, Wonderling RS, Owens RA. Mutational analysis of the adeno-associated virus type 2 Rep68 protein helicase motifs. Journal of virology. 1997;71(9):6996-7004. 224. Bonami JR, Mari J, Poulos BT, Lightner DV. Characterization of hepatopancreatic parvo-like virus, a second unusual parvovirus pathogenic for penaeid shrimps. The Journal of general virology. 1995;76 ( Pt 4):813-7. 225. Hewson I, Button JB, Gudenkauf BM, Miner B, Newton AL, Gaydos JK, et al. Densovirus associated with sea-star wasting disease and mass mortality. Proceedings of the National Academy of Sciences of the United States of America. 2014;111(48):17278-83. 226. La Fauce KA, Elliman J, Owens L. Molecular characterisation of hepatopancreatic parvovirus (PmergDNV) from Australian Penaeus merguiensis. Virology. 2007;362(2):397- 403. 227. Arriagada G, Gifford RJ. Parvovirus-derived endogenous viral elements in two South American rodent genomes. Journal of virology. 2014;88(20):12158-62. 228. Katzourakis A, Gifford RJ. Endogenous viral elements in animal genomes. PLoS genetics. 2010;6(11):e1001191. 229. Liu H, Fu Y, Xie J, Cheng J, Ghabrial SA, Li G, et al. Widespread endogenization of densoviruses and parvoviruses in animal and human genomes. Journal of virology. 2011;85(19):9863-76. 230. Kailasan S, Agbandje-McKenna M, Parrish CR. Parvovirus Family Conundrum: What Makes a Killer? Annual review of virology. 2015;2(1):425-50. 231. Flegel TW. Hypothesis for heritable, anti-viral immunity in crustaceans and insects. Biology direct. 2009;4:32. 232. Clavijo G, van Munster M, Monsion B, Bochet N, Brault V. Transcription of densovirus endogenous sequences in the Myzus persicae genome. The Journal of general virology. 2016;97(4):1000-9. 233. Biagini P, Study-Group A-C. Anelloviridae family: International Committee on Taxonomy of Viruses; 2017 [cited 2017 20 Apr 2017]. 105

234. Spandole S, Cimponeriu D, Berca LM, Mihaescu G. Human anelloviruses: an update of molecular, epidemiological and clinical aspects. Archives of virology. 2015;160(4):893- 908. 235. Garcia-Alvarez M, Berenguer J, Alvarez E, Guzman-Fulgencio M, Cosin J, Miralles P, et al. Association of torque teno virus (TTV) and torque teno mini virus (TTMV) with liver disease among patients coinfected with human immunodeficiency virus and hepatitis C virus. European journal of clinical microbiology & infectious diseases : official publication of the European Society of Clinical Microbiology. 2013;32(2):289-97. 236. Mancuso R, Saresella M, Hernis A, Agostini S, Piancone F, Caputo D, et al. Torque teno virus (TTV) in multiple sclerosis patients with different patterns of disease. Journal of medical virology. 2013;85(12):2176-83. 237. Masouridi-Levrat S, Pradier A, Simonetta F, Kaiser L, Chalandon Y, Roosnek E. Torque teno virus in patients undergoing allogeneic hematopoietic stem cell transplantation for hematological malignancies. Bone marrow transplantation. 2016;51(3):440-2. 238. Tyschik EA, Shcherbakova SM, Ibragimov RR, Rebrikov DV. Transplacental transmission of torque teno virus. Virology journal. 2017;14(1):92. 239. Hrazdilova K, Slaninkova E, Brozova K, Modry D, Vodicka R, Celer V. New species of Torque Teno miniviruses infecting gorillas and chimpanzees. Virology. 2016;487:207-14. 240. Okamoto H. TT viruses in animals. Current topics in microbiology and immunology. 2009;331:35-52. 241. Okamoto H, Takahashi M, Nishizawa T, Tawara A, Fukai K, Muramatsu U, et al. Genomic characterization of TT viruses (TTVs) in pigs, cats and dogs and their relatedness with species-specific TTVs in primates and tupaias. The Journal of general virology. 2002;83(Pt 6):1291-7. 242. Manzin A, Mallus F, Macera L, Maggi F, Blois S. Global impact of Torque teno virus infection in wild and domesticated animals. Journal of infection in developing countries. 2015;9(6):562-70. 243. Paran N, Ori A, Haviv I, Shaul Y. A composite polyadenylation signal with TATA box function. Molecular and cellular biology. 2000;20(3):834-41. 244. Martinez-Guino L, Ballester M, Segales J, Kekarainen T. Expression profile and subcellular localization of Torque teno sus virus proteins. The Journal of general virology. 2011;92(Pt 10):2446-57. 106

245. Zheng H, Ye L, Fang X, Li B, Wang Y, Xiang X, et al. Torque teno virus (SANBAN isolate) ORF2 protein suppresses NF-kappaB pathways via interaction with IkappaB kinases. Journal of virology. 2007;81(21):11917-24. 246. Asabe S, Nishizawa T, Iwanari H, Okamoto H. Phosphorylation of serine-rich protein encoded by open reading frame 3 of the TT virus genome. Biochemical and biophysical research communications. 2001;286(2):298-304. 247. Okamoto H, Nishizawa T, Takahashi M, Tawara A, Peng Y, Kishimoto J, et al. Genomic and evolutionary characterization of TT virus (TTV) in tupaias and comparison with species-specific TTVs in humans and non-human primates. The Journal of general virology. 2001;82(Pt 9):2041-50. 248. Parada A, D'Elia G, Palma RE. The influence of ecological and geographical context in the radiation of Neotropical sigmodontine rodents. BMC evolutionary biology. 2015;15:172. 249. Ng TF, Wheeler E, Greig D, Waltzek TB, Gulland F, Breitbart M. Metagenomic identification of a novel anellovirus in Pacific harbor seal (Phoca vitulina richardsii) lung samples and its detection in samples from multiple years. The Journal of general virology. 2011;92(Pt 6):1318-23. 250. Pocock MJO, Searle JB, White PCL. Adaptations of animals to commensal habitats: population dynamics of house mice Mus musculus domesticus on farms. Journal of Animal Ecology. 2004;73:878-88. 251. Brook CE, Dobson AP. Bats as 'special' reservoirs for emerging zoonotic pathogens. Trends in microbiology. 2015;23(3):172-80. 252. Doceul V, Bagdassarian E, Demange A, Pavio N. Zoonotic Hepatitis E Virus: Classi fi cation, Animal Reservoirs and Transmission Routes. Viruses. 2016;8(10). 253. Smith DB, Simmonds P, International Committee on Taxonomy of Viruses Hepeviridae Study G, Jameel S, Emerson SU, Harrison TJ, et al. Consensus proposals for classification of the family Hepeviridae. The Journal of general virology. 2014;95(Pt 10):2223-32. 254. Lack JB, Volk K, Van Den Bussche RA. Hepatitis E virus genotype 3 in wild rats, United States. Emerging infectious diseases. 2012;18(8):1268-73. 255. Li TC, Ami Y, Suzaki Y, Yasuda SP, Yoshimatsu K, Arikawa J, et al. Characterization of full genome of rat hepatitis E virus strain from Vietnam. Emerging infectious diseases. 2013;19(1):115-8. 107

256. Purcell RH, Engle RE, Rood MP, Kabrane-Lazizi Y, Nguyen HT, Govindarajan S, et al. Hepatitis E virus in rats, Los Angeles, California, USA. Emerging infectious diseases. 2011;17(12):2216-22. 257. Reuter G, Boros A, Matics R, Kapusinszky B, Delwart E, Pankovics P. Divergent hepatitis E virus in birds of prey, common kestrel (Falco tinnunculus) and red-footed falcon (F. vespertinus), Hungary. Infection, genetics and evolution : journal of molecular epidemiology and evolutionary genetics in infectious diseases. 2016;43:343-6. 258. Li H, Zhu R, She R, Zhang C, Shi R, Li W, et al. Case Report Associated with Aspergillosis and Hepatitis E Virus Coinfection in Himalayan Griffons. BioMed research international. 2015;2015:287315.