Análise de sentimentos em comentários da plataforma Colab


Aluno: Cesar Cano de Oliveira

Orientador: Marco Dimas Gubitoso

Apreciação pessoal e crítica



Experiência e desafios

Desenvolver esse TCC foi uma aventura muito divertida e enriquecedora. Apesar do medo e insegurança em alguns momentos, tudo ocorreu perto do planejado.

A princípio, meu tema era outro, em um projeto fora do Colab, apesar de também envolver conceitos de um ramo de inteligência artificial. O plano era cancelar o contrato do estágio para ter o tempo livre necessário para me dedicar ao projeto, mas, felizmente, o pessoal do Colab me ofereceu a possibilidade de desenvolver um projeto de TCC dentro da empresa, unindo o útil ao agradável.

Tive uma segunda mudança de tema, ainda dentro da empresa, onde o trabalho passou de uma aplicação de aprendizado de máquina em imagens para uma em textos, que acabou sendo o trabalho final. Como deu pra perceber, acabei começando o trabalho mais tarde e isso acabou sendo uma preocupação inicial, afinal, eu tinha perdido um tempo de desenvolvimento do trabalho.

O fato desse novo trabalho, agora dentro da empresa, ter como objetivo um uso real, fez com que minha insegurança quanto a minha própria capacidade de fazer um trabalho de qualidade ficasse mais em evidência. Dito isso, não me intimidei, e preparei, junto ao meu chefe na época, um cronograma de atividades na plataforma de tarefas que usamos dentro do Colab. Foi assim que fui me organizando, trabalhando integralmente no período do estágio (30 horas semanais) no projeto do TCC.

Um desafio que vale a pena ser documentado aqui foi a discussão em torno da polaridade de sentimento dentro do contexto da aplicação. A fronteira entre o que deveria ser neutro e o que deveria ser positivo foi algo que foi discutido com a maioria dos funcionários do Colab e como dava muita confusão, me motivou a criar o guia/dicionário de polaridades que está presente na monografia. Essas confusões fizeram com que, em um determinado momento, eu tivesse que reclassificar a maior parte dos dados já classificados (devia ter em torno de 2500), já que os critérios dos dados classificados têm que ser consistentes.

Ter me dedicado integralmente durante o estágio fez com que mesmo começando um pouco atrasado, eu conseguisse avançar bem rápido na parte de estudos, implementações e experimentos. Em todo o trabalho, fora a escrita, pra falar a verdade. Isso foi tirando meu medo e, ao ver o desempenho dos classificadores melhorar ao longo dos meses, fui me motivando para estudar métodos de pré-processamento cada vez mais.

Outro fato curioso e digno de ser mencionado é o fato de que, ao longo de desenvolvimento do trabalho, fui me "desiludindo" quanto à suposta magia e o hype atual em torno de algoritmos de aprendizado de máquina e inteligência artificial no geral. Porque apesar do classificador final ter batido a minha meta estabelecida como motivação (que era mesmo a casa dos 80% de acurácia), fui aprendendo, empiricamente e através dos estudos, que fora da aplicação, o classificador não tem nem de longe o mesmo poder. Então era meio chato quando eu comentava que estava desenvolvendo um classificador de sentimentos e as pessoas se animavam, me dando frases fora do contexto do Colab pra testar e, claramente, os modelos erravam.

No mais, eu aprendi muito sobre diversas áreas que me interessavam e pude sentir um pouco do que é trabalhar em aplicações reais, que envolvem extrair, tratar e classificar o conjunto de dados de treino, além de estudá-los para desenvolver uma pipeline de pré-processamento que aproveite ao máximo o algoritmo escolhido. Só assim eu pude chegar no resultado final, cumprir a meta de 80% de acurácia e sentir que o classificador desenvolvido pode ser usado numa aplicação real.



Agradecimentos

Gostaria de agradecer a minha família e todos meus amigos, por me apoiarem durante a graduação. Dos gestos mais singelos até a companhia em momentos onde nada parecia dar certo, eu só tenho a agradecer.

Também gostaria de agradecer os colegas de curso, os professores e os funcionários do IME pelo apoio, ensinamentos, compreensão e paciência.

Agradeço também a todo mundo do Colab, pelo ótimo período de estágio que tive com todos de lá, os aprendizados, a oportunidade de poder desenvolver um trabalho desses para uma aplicação real, o dia a dia no escritório e a amizade.

"... I knew exactly what to do. But in a much more real sense, I had no idea what to do."