Capítulo 1 Análise De Sentimentos Utilizando Técnicas De Classificação Multiclasse

Capítulo 1 Análise De Sentimentos Utilizando Técnicas De Classificação Multiclasse

XII Simpósio Brasileiro de Sistemas de Informação De 17 a 20 de maio de 2016 Florianópolis – SC Tópicos em Sistemas de Informação: Minicursos SBSI 2016 Sociedade Brasileira de Computação – SBC Organizadores Clodis Boscarioli Ronaldo dos Santos Mello Frank Augusto Siqueira Patrícia Vilain Realização INE/UFSC – Departamento de Informática e Estatística/ Universidade Federal de Santa Catarina Promoção Sociedade Brasileira de Computação – SBC Patrocínio Institucional CAPES – Coordenação de Aperfeiçoamento de Pessoal de Nível Superior CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico FAPESC - Fundação de Amparo à Pesquisa e Inovação do Estado de Santa Catarina Catalogação na fonte pela Biblioteca Universitária da Universidade Federal de Santa Catarina S612a Simpósio Brasileiro de Sistemas de Informação (12. : 2016 : Florianópolis, SC) Anais [do] XII Simpósio Brasileiro de Sistemas de Informação [recurso eletrônico] / Tópicos em Sistemas de Informação: Minicursos SBSI 2016 ; organizadores Clodis Boscarioli ; realização Departamento de Informática e Estatística/ Universidade Federal de Santa Catarina ; promoção Sociedade Brasileira de Computação (SBC). Florianópolis : UFSC/Departamento de Informática e Estatística, 2016. 1 e-book Minicursos SBSI 2016: Tópicos em Sistemas de Informação Disponível em: http://sbsi2016.ufsc.br/anais/ Evento realizado em Florianópolis de 17 a 20 de maio de 2016. ISBN 978-85-7669-317-8 1. Sistemas de recuperação da informação Congressos. 2. Tecnologia Serviços de informação Congressos. 3. Internet na administração pública Congressos. I. Boscarioli, Clodis. II. Universidade Federal de Santa Catarina. Departamento de Informática e Estatística. III. Sociedade Brasileira de Computação. IV. Título. CDU: 004.65 Prefácio Dentre as atividades de Simpósio Brasileiro de Sistemas de Informação (SBSI) a discussão de temas atuais sobre pesquisa e ensino, e também sua relação com a indústria, é sempre oportunizada. Neste âmbito, os minicursos constituem-se para a comunidade em oportunidades de formação e atualização em determinados tópicos de pesquisa. Na edição 2016 foram selecionados quatro minicursos dentre dezessete propostas submetidas por meio de uma chamada pública amplamente divulgada por meio de listas eletrônicas da SBC (Sociedade Brasileira de Computação). Todas as propostas receberam, no mínimo, três avaliações realizadas por um Comitê composto por quarenta e cinco professores doutores, que consideraram critérios como relevância para o evento, expectativa do público, atualidade e conteúdo. O SBSI 2016 inova também por lançar, pela primeira vez, o conteúdo dos minicursos no formato de livro, cujas quatro propostas selecionadas constituem os seus capítulos. O Capítulo 1 apresenta o texto do minicurso intitulado Análise de sentimentos utilizando técnicas de classificação multiclasse, que visa introduzir o processo de análise de sentimentos utilizando técnicas de extração de características, executando as fases de pré-processamento textual, seleção de características, vetorização e, por fim, o aprendizado de máquina, a fim de inferir se uma opinião é positiva ou negativa (classificação binária) ou inferir um rating (classificação multiclasse). O Capítulo 2 apresenta o texto do minicurso intitulado Keep calm and visualize your data: minicurso de Visualização de Dados, que apresenta uma abordagem prática que concilia a literatura em visualização de informação, e seus diversos recursos disponíveis, na construção de representações gráficas de dados que sejam facilitadoras para o processo decisório e a disseminação do conhecimento. O Capítulo 3 apresenta o texto do minicurso intitulado Modelos de Negócios Inovadores na Era da Computação em Nuvem, no qual os autores apresentam modelos de negócios baseados em nuvem a fim de prover meios e conhecimento para a produção de um modelo de negócio inovador. Ainda, apresentam como e onde incubar e acelerar seu negócio, onde encontrar investidores, além de casos reais de modelos de negócio de sucesso e de fracassos, bem como o papel da computação em nuvem nesse processo. O Capítulo 4 apresenta o texto do minicurso intitulado Sistemas LBS, Internet das Coisas e Computação Vestível: Usando a Computação Sensível ao Contexto para Desenvolver as Aplicações do Séc. XXI, que propicia uma visão geral sobre a Computação Móvel, Computação Sensível ao Contexto e Computação Ubíqua/Pervasiva, especialmente dos Sistemas Baseados em Localização (LBS), ilustrando suas potencialidades, problemas e desafios para que se tornem populares e atinjam, de fato, o usuário final de forma mais eficiente. Acreditamos que este material poderá ser amplamente utilizado por professores de Sistemas de Informação, como base para suas aulas; por pesquisadores, para discussão de novas abordagens e como insumos para suas pesquisas atuais e futuras; e por profissionais, como auxílio em sua prática cotidiana. Esperamos que todos que tenham acesso ao conteúdo desses minicursos e façam dele um ótimo proveito! Clodis Boscarioli (UNIOESTE) e Ronaldo dos Santos Mello (UFSC) Organizadores da Trilha de Minicursos do SBSI 2016 Comitê de Programa Adolfo Duran UFBA Avanilde Kemczinski UDESC Carla Merkle Westphall UFSC Carlos Alberto Vieira Campos UNIRIO Carlos Eduardo Santos Pires UFCG Claudia Cappelli UNIRIO Clodis Boscarioli UNIOESTE Clodoaldo Lima USP Cristiano Maciel UFMT Daniela Barreiro Claro UFBA Debora Paiva UFMS Denis Silveira UFPE Edmundo Spoto UFG Elvis Fusco UNIVEM Fatima Nunes USP Fernando Braz IFC Flavia Santoro UNIRIO Flavio Oquendo IRISA/UBS Flávio Soares Corrêa da Silva USP Geiza M. Hamazaki da Silva UNIRIO Geraldo Xexéo UFRJ Glauco Carneiro UNIFACS Guilherme Galante UNIOESTE Isabela Gasparini UDESC João Porto de Albuquerque USP José Maria David UFJF Juliano Lopes de Oliveira UFG Lais Salvador UFBA Leonardo Azevedo IBM/UNIRIO Leticia Mara Peres UFPR Luciana Zaina UFSCar Luciano Digiampietri USP Lucineia Heloisa Thom UFRGS Marcos Chaim USP Maria Istela Cagnin UFMS Márcio Barros UNIRIO Morganna Diniz UNIRIO Patricia Vilain UFSC Regina Braga UFJF Ricardo Choren IME Rita Suzana Pitangueira Maciel UFBA Roberto Pereira UFPR Rodolfo Resende UFMG Ronaldo Mello UFSC Tania Tait UEM Sumário Análise de Sentimentos Utilizando Técnicas de Classificação Multiclasse ...................... 1 Alexandre de Castro Lunardi, José Viterbo, Flávia Cristina Bernardini (Universidade Federal Fluminense - UFF) Keep Calm and Visualize Your Data .............................................................................. 31 Fernanda C. Ribeiro, Bárbara P. Caetano (Universidade Federal do Rio de Janeiro - UFRJ), Melise M. V. de Paula, Guilherme X. Ferreira, Rafael S. de Oliveira (Universidade Federal de Itajubá - UNIFEI) Modelos de Negócios Inovadores na Era da Computação em Nuvem ........................... 53 Ricardo Batista Rodrigues, Carlo M. R. Silva, Vinicius C. Garcia, Silvio R. L. Meira (Universidade Federal de Pernambuco - UFPE) Sistemas LBS, Internet das Coisas e Computação Vestível: Usando a Computação Sensível ao Contexto para Desenvolver as Aplicações do Séc. XXI ............................. 72 Marcio Pereira de Sá (Faculdade Sul-Americana - FASAM) Capítulo 1 Análise de Sentimentos Utilizando Técnicas de Classificação Multiclasse Alexandre de Castro Lunardi, José Viterbo, Flávia Cristina Bernardini Abstract After the advent of Web 2.0, finding reviews on products, businesses, services, organizations and many other areas on the web became really easy. These opinions can be found on social networks, blogs and specialized e-commerce sites that provide tools so that a user can evaluate an item. These reviews can be useful in recommender systems, stating whether a product is suitable or not via the existing web assessments. This type of analysis is known as binary classification. Beyond binary classification, other forms may include scales evaluation, problem known as multiclass classification. An example of this type of classification is ratings inference (multiclass classification). This work intends to introduce the feelings analysis process, using feature extraction techniques by performing the steps of textual preprocessing, feature selection, vectorization, and finally, machine learning, in order to infer whether an opinion is positive or negative (binary classification) or to infer a rating. Resumo Com o advento da Web 2.0, encontrar opiniões sobre produtos, negócios, serviços, organizações e sobre tantos outros domínios é algo comum na web. Essas opiniões podem ser encontradas em redes sociais, blogs especializados e em sites e-commerce que disponibilizam ferramentas para que um usuário possa avaliar um item. Essas opiniões podem ser de grande utilidade em sistemas de recomendação, informando se um produto é recomendado ou não por meio das avaliações existentes na web. Este tipo de análise é baseada em técnicas de classificação binária. Além da classificação binária, outras formas podem incluir a avaliação de escalas, problema conhecido como classificação multiclasse. Um exemplo deste tipo de classificação é a inferência de ratings (classificação multiclasse). Esse estudo tem o intuito de introduzir o processo de análise de sentimentos utilizando técnicas de extração de características, executando as fases de pré-processamento textual, seleção de características, 1 vetorização e, por fim, o aprendizado de máquina, a fim de inferir se uma opinião é positiva ou negativa (classificação binária) ou inferir um rating. 1.1 Introdução Opiniões sempre foram úteis no que diz respeito à tomada de decisões

View Full Text

Details

  • File Type
    pdf
  • Upload Time
    -
  • Content Languages
    English
  • Upload User
    Anonymous/Not logged-in
  • File Pages
    99 Page
  • File Size
    -

Download

Channel Download Status
Express Download Enable

Copyright

We respect the copyrights and intellectual property rights of all users. All uploaded documents are either original works of the uploader or authorized works of the rightful owners.

  • Not to be reproduced or distributed without explicit permission.
  • Not used for commercial purposes outside of approved use cases.
  • Not used to infringe on the rights of the original creators.
  • If you believe any content infringes your copyright, please contact us immediately.

Support

For help with questions, suggestions, or problems, please contact us