Análise de Sentimentos Aplicada à Política

Aluno: Lucas Romão Silva
Orientador: Roberto Hirata Jr.

Resumo

Com a grande expansão da internet, o uso das redes sociais tem se tornado cada vez mais ativo e, com o passar do tempo, tornou-se um lugar onde os usuários relatam não só informações acerca do cotidiano, mas também para opinar sobre temas como política, esportes, etc. O uso das redes sociais também causa maior mobilização dos usuários no cenário político através de petições online ou organização de manifestações.

Este trabalho tem como objetivo explorar a rede de usuários do Twitter para analisar os sentimentos dos seus usuários acerca do cenário político brasileiro atual utilizando técnicas de processamento de linguagem natural em conjunto com técnicas de aprendizado de máquina.

Para isso coletou-se tuítes sobre grandes decisões atuais como: (1) a Reforma da Previdência (PEC287); (2) a proposta de Lei da Terceirização; (3) a proposta de emenda constitucional sobre o Teto dos Gastos Públicos (PEC55); além de tuítes sobre políticos em grande visibilidade no cenário político atual.

Os tuítes coletados foram classificados manualmente através de uma ferramenta desenvolvida neste TCC (um site na Internet) onde era possível realizar a tarefa de classsificação de forma menos árdua e permitir a ajuda de outras pessoas.

A preparação dos dados foi feita através de técnicas de processamento de linguagem natural para extrair informações subjetivas dos tuítes e classificou-se as opiniões associadas a eles utilizando técnicas de aprendizado de máquina.

Induzidos os classificadores, analisou-se métricas de desempenho de cada um como Acurácia, Precisão e Revocação para diferentes abordagens de extrair as informações subjetivas do texto. Como resultado, obteve-se uma acurácia média de 71%.

Avaliação Subjetiva

Em 2015 quando participei do programa ciências sem fronteiras para a Alemanha, havia decidido que aproveitaria aquela oportunidade para definir uma área da computação com a qual iria trabalhar no meu trabalho de conclusão de curso.

À época já tinha em mente algumas áreas e, dentre elas, estava a área de aprendizado de máquina, afinal era uma área de Ciência da Computação que utiliza como principal base teórica duas das matérias de fora do departamento de computação que mais me agradaram ao longo da faculdade que seriam Probabilidade (juntando as introdutórias e a disciplina de processos estocásticos) e Álgebra Linear.

De volta ao Brasil e tendo decidido a área conversei com meu orientador Roberto Hirata para obter um tema para o TCC e, com sua ajuda, definimos o tema deste trabalho.

Ao longo do ano fiz uso do conteúdo que aprendi não só na disciplina de aprendizado de máquina, mas também utilizei conceitos desenvolvidos na disciplina MAC0300 para entender os problemas de ponto flutuante, Cálculo II para entender os problemas de otimização resolvidos e o porquê de os algoritmos funcionarem. Os conhecimentos em elaboração de relatório aprendidos nas disciplinas Programação Linear e Programação Paralela e Concorrente foram fundamentais para aprender como fundamentar as observações sobre os resultados dos experimentos.

Fora das disciplinas também contribuiu muito para a conclusão deste trabalho toda a orientação e norteamento fornecidos pelo meu orientador e o apoio constante que recebi de meus amigos e família ao longo do ano. Sem isso definitivamente este trabalho não seria possível.