Análise de sentimentos em comentários da plataforma Colab


Aluno: Cesar Cano de Oliveira

Orientador: Marco Dimas Gubitoso

Resumo

O presente trabalho de conclusão de curso teve como objetivo o desenvolvimento de um classificador da emoção predominante em comentários da plataforma Colab.

Para obter um classificador de alto desempenho, foram estudados e implementados dois modelos baseados em aprendizado de máquina, o naive Bayes e a regressão logística. Também foram estudados vários métodos de pré-processamento, com destaque para a implementação do método de seleção baseado em informação mútua.

A biblioteca scikit-learn, em Python, foi utilizada para fins de comparação e possível aplicação final. Diversos experimentos foram feitos para decidir os melhores métodos e classificadores, utilizando validação de Monte Carlo e métricas como acurácia e F1 score.

Por fim, obteve-se um classificador de ótimo desempenho, com 81% de acurácia nos testes, que será utilizado em futuras aplicações reais na plataforma Colab, automatizando análises qualitativas, por exemplo.