Using Sentiment from Twitter Optimized by Genetic Algorithms to Predict the Stock Market Electical and Computer Engineering
Using Sentiment from Twitter optimized by Genetic Algorithms to Predict the Stock Market Carlos Vieira Simões Thesis to obtain the Master of Science Degree in Electical and Computer Engineering Supervisors: Prof. Rui Fuentecilla Maria Ferreira Neves Prof. Nuno Cavaco Gomes Horta Examination Committee Chairperson: Prof. António Manuel Raminhos Cordeiro Grilo Supervisor: Prof. Rui Fuentecilla Maria Ferreira Neves Member of the Committee: Prof. João Miguel Duarte Ascenso April 2017 Resumo Actualmente, na rede social Twitter, são criados, em media, cerca de 6000 tweets por segundo. Isto corresponde a cerca de 500 milhões de tweets por dia. Com toda esta informação torna-se interessante saber que partido se pode tirar dela. Neste trabalho propomos usar o Twiter para encontrar empresas que tenham um grande potencial de crescimento e que, por isso, sejam boas oportunidades de investimento. Para chegar a esse fim nós construímos um modelo de sentimento usando o texto contido em tweets. Para garantir que o nosso modelo de sentimento contém tweets que foram criados em contextos emocionais diferentes utilizámos hashtags do Twitter. Por exemplo, usámos as hashtags #sad e #happy para obter tweets que foram criados em ambientes emocionais distintos, ou seja, triste e feliz. Para nos certificarmos de que obtivemos tweets de um vasto leque de sentimentos usámos com permissão as emoções apresentadas pelo Circumplex Model of Affect e os seus sinónimos. São essas palavras que foram utilizadas como termos de pesquisa na API do Twitter. As emoções foram agrupadas em quatro classes. Por exemplo, emoções como feliz e orgulhoso foram incluídas na classe 1; calmo e sereno na classe 2; nervoso e ansioso na classe 3 e; triste e deprimido na classe 4.
[Show full text]