Desenvolvimento De Um Protótipo De Sistema Web Para Elaboração De Laudos Médicos Utilizando Sistemas De Reconhecimento Automático De Fala

UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ CAMPUS DE FOZ DO IGUAÇU PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E COMPUTAÇÃO DISSERTAÇÃO DE MESTRADO DESENVOLVIMENTO DE UM PROTÓTIPO DE SISTEMA WEB PARA ELABORAÇÃO DE LAUDOS MÉDICOS UTILIZANDO SISTEMAS DE RECONHECIMENTO AUTOMÁTICO DE FALA THIAGO FERREIRA DE TOLEDO FOZ DO IGUAÇU 2017 Thiago Ferreira de Toledo Desenvolvimento de um Protótipo de Sistema Web para Elaboração de Laudos Médicos Utilizando Sistemas de Reconhecimento Automático de Fala Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Engenharia Elétrica e Computação como parte dos requisitos para obtenção do título de Mestre em Engenharia Elétrica e Computação. Área de concentração: Sistemas Dinâmicos e Energéticos. Orientadora: Drª. Huei Diana Lee Co-orientador: Dr. Wu Feng Chung Co-orientador: Dr. Cláudio Saddy Rodrigues Coy Foz do Iguaçu 2017 ii Desenvolvimento de um Protótipo de Sistema Web para Elaboração de Laudos Médicos Utilizando Sistemas de Reconhecimento Automático de Fala Thiago Ferreira de Toledo Esta Dissertação de Mestrado foi apresentada ao Programa de Pós-Graduação em Engenharia Elétrica e Computação e aprovada pela Banca Examinadora: Data da defesa pública: 18/08/2017. ___________________________________________________________ Profª. Drª. Huei Diana Lee – (Orientadora) Universidade Estadual do Oeste do Paraná – UNIOESTE _______________________________________________ Prof. Dr. Wu Feng Chung – (Co-orientador) Universidade Estadual do Oeste do Paraná – UNIOESTE _______________________________________________ Prof. Dr. Orlando Petrucci Junior Universidade Estadual de Campinas – UNICAMP _______________________________________________ Prof. Dr. Newton Spolaôr Universidade Estadual do Oeste do Paraná – UNIOESTE iv Resumo O propósito geral de sistemas de reconhecimento automático de fala é o de permitir a interação de seres humanos com dispositivos eletrônicos por meio da fala, por exemplo, a partir da fala do usuário, captada por um microfone, o seu conteúdo pode ser convertido em transcrição textual. Em geral, tais sistemas devem ser capazes de enfrentar adversidades como influência de ruídos, variabilidade do canal de comunicação, idade, sotaque e velocidade da fala, fala concorrente de outros oradores e fala espontânea. Mesmo diante desse cenário desafiador, este trabalho possui como propósito investigar essa tecnologia para ser empregada no âmbito médico. A investigação foi realizada por meio de uma revisão sistemática para o embasamento científico de conceitos e identificação de pesquisas relevantes. Para validar a viabilidade do uso desses sistemas na área médica, foi desenvolvido um Protótipo de Sistema Web com finalidade de gerar laudos médicos por meio do reconhecimento automático de fala para a Língua Portuguesa do Brasil. O protótipo foi desenvolvido com a técnica Entrega em Estágio, presente em Engenharia de Software. A seleção da tecnologia de reconhecimento automático de fala para ser integrada ao protótipo, foi baseada em uma avaliação da taxa de precisão de sete sistemas para a Língua Portuguesa do Brasil. O desenvolvimento desse trabalho permitiu concluir que esses sistemas de reconhecimento automático de fala podem ser empregados no ambiente médico, provendo suporte, não somente à confecção de laudos médicos, mas também atuando como um registro de monitoria durante um procedimento médico. Palavras-chave: RAF, Laudo Médico, Transcrição Médica, Protótipo de Sistema Web, UML. v Abstract The overall purpose of automatic speech recognition systems is to allow the interaction between humans and electronic devices through speech, for example, the content captured from user's speech using a microphone, can be converted into textual transcription. In general, such systems should be able to overcome adversities such as noise influence, communication channel variability, age, accent and speed of speech, concurrent speech from other speakers and spontaneous speech. Even with this challenging scenario, this work aims to investigate this technology to be employed in the medical field. The research was carried out through a systematic review for the scientific basis of concepts and identification of relevant research studies. To validate the feasibility of using these systems in the medical field, a Web System Prototype was developed to generate medical reports through automatic speech recognition for the Brazilian Portuguese Language. The prototype was developed with the application of Delivery in Stage technique, from Software Engineering. The selection of the automatic speech recognition technology to be integrated to the prototype was based on an evaluation of the accuracy rate of seven systems for the Brazilian Portuguese Language. The development of this work allowed to conclude that these systems of automatic speech recognition can be used in the medical environment, providing support not only for making medical reports, but also acting as a monitoring record during a medical procedure. Keywords: ASR, Medical Report, Medical Transcription, Web System Prototype, UML. vi vii Dedico este trabalho aos meus pais. viii Agradecimentos Agradeço especialmente aos meus pais, Carlos e Flávia, e aos meus irmãos, Vinícius e Fernanda, por todo o apoio, carinho, compreensão, paciência e amor. Sem vocês certamente o caminho que escolhi trilhar seria ainda mais difícil. Obrigado por tudo, por jamais medirem esforços em aconselhar-me, animar e encorajar a seguir em frente. A vocês, a minha eterna gratidão. Aos meus amigos, Leonardo Pereira, Jonatan Liecheski, Pedro Coutinho e Rayan Chemin pela amizade sincera e sólida. Aos condiscípulos da Fundação Logosófica de Foz do Iguaçu, Adriana, Audrey, Bruna, Elizabeth, Gustavo, João, Juliano, Jussara, Neri, Rafaela P., Rafaela Z., Simone, Tânia e Zélia, por me proporcionarem grandes momentos de evolução e valiosos ensinamento. Aos meus dois grandes mestres e orientadores, professores Huei e Wu, pela paciência, no ensinamento do caminho da ciência e da docência. Ao professor Newton por toda a sua dedicação, orientação e ajuda em diversos momentos. Aos grandes Labianos, Fonteque, Leandro, Paulo, Narco, Samia, Silvani e Weber. Aos meus professores de mestrado, Carlos Farias, Carlos Rocha e Roberto Lotero, que me apoiaram e ensinaram ao longo dessa trajetória. Também aos colegas de mestrado, Felipe Crestani e Itamar Nieradka, pelos momentos de estudo e de descontração. À UNIOESTE e todos os seus funcionários. Em especial, agradeço à Fabiana Santos por todo o auxílio, profissionalismo e dedicação. À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) pelo apoio financeiro. Por fim, agradeço a Deus, a razão de tudo. ix x "Para triunfar é necessário vencer, para vencer é necessário lutar, para lutar é necessário estar preparado, para estar preparado é necessário prover-se de uma grande inteireza de ânimo e de uma paciência a toda a prova. Isto requer, por sua vez, levar constantemente ao íntimo da vida o incentivo da suprema esperança de alcançar aquilo que se anela como culminação feliz da existência." Carlos B. G. Pecotche Sumário Resumo v Abstract vi Agradecimentos ix Lista de Figuras xv Lista de Quadros xix Lista de Siglas xxi Lista de Tabelas xxiii 1 Introdução 1 1.1 Objetivos .................................................................................................................... 3 1.2 Assertiva .................................................................................................................... 3 1.3 Hipótese ..................................................................................................................... 3 1.4 Organização do Trabalho ........................................................................................... 3 2 A Fala Humana e a sua Compreensão 5 2.1 Características dos Sons ............................................................................................. 5 2.2 A Fala Humana .......................................................................................................... 6 2.3 Compreensão da Fala Humana .................................................................................. 8 2.4 Considerações Finais ................................................................................................. 9 3 Sistemas de Reconhecimento Automático de Fala 11 3.1 Limitações de Sistemas de Reconhecimento Automático de Fala ........................... 11 3.2 Breve Evolução Histórica dos Sistemas de Reconhecimento Automático de Fala . 12 3.3 Trabalhos Relacionados ........................................................................................... 14 3.4 Arquitetura Geral de Sistemas de Reconhecimento Automático de Fala ................ 18 3.4.1 Extração de Características .......................................................................... 19 3.4.2 Modelo de Linguagem ................................................................................. 22 xi xii 3.4.3 Modelo Acústico .......................................................................................... 24 3.4.4 Decodificador .............................................................................................. 24 3.5 Fontes de Variabilidade Acústica ............................................................................ 25 3.6 Métricas de Avaliação de Desempenho para Sistemas de Reconhecimento Automático de Fala ........................................................................................................... 26 3.7 Considerações Finais ..............................................................................................

Load more