Resumo
O presente trabalho de conclusão de curso teve como objetivo o desenvolvimento de um classificador da emoção predominante em comentários da plataforma Colab.
Para obter um classificador de alto desempenho, foram estudados e implementados dois modelos baseados em aprendizado de máquina, o naive Bayes e a regressão logística. Também foram estudados vários métodos de pré-processamento, com destaque para a implementação do método de seleção baseado em informação mútua.
A biblioteca scikit-learn, em Python, foi utilizada para fins de comparação e possível aplicação final. Diversos experimentos foram feitos para decidir os melhores métodos e classificadores, utilizando validação de Monte Carlo e métricas como acurácia e F1 score.
Por fim, obteve-se um classificador de ótimo desempenho, com 81% de acurácia nos testes, que será utilizado em futuras aplicações reais na plataforma Colab, automatizando análises qualitativas, por exemplo.