Ian Silva Galvão
Orientador: Prof. Alfredo Goldman vel Lejbman
Co-Orientador: Renato Cordeiro Ferreira
Resumo
Essa pesquisa realiza um estudo de avaliação de qualidade de imagens com aprendizado de máquina supervisionado. Para tanto, foi selecionado o banco de dados KonIQ-10k com imagens avaliadas por \textit{crowdsourcing}. Em seguida, foram extraídas características representativas dos seguintes aspectos estéticos das imagens: luminosidade, paleta de cores, desfoque, e distribuição de detalhes. A partir das características extraídas e das avaliações das imagens, foram treinados cinco modelos com técnicas distintas de aprendizado de máquina supervisionado: regressão linear, k-vizinhos, árvore de decisão, floresta aleatória, e rede neural. O treinamento contou com a otimização de hiperparâmetros e validação cruzada. Alternativamente, foi realizada uma extração de características usando \textit{deep learning} e transferência de aprendizado. A modelagem com base apresentou melhor desempenho que as demais. Os resultados foram analisados e comparados com um modelo da literatura treinado no mesmo banco de dados, que mostrou desempenho superior.
Abstract
This research performs a study of image quality assesment with supervised machine learning methods. For that goal, the KonIQ-10k database, with images qualities evaluated by crowdsourcing, was selected. Then, a set of characteristics were extracted that are representative of the following aesthetic aspects: luminosity, color palet, blur and details distribution. From the extracted features and image evaluations, five models were trained with different supervised machine learning techniques: linear regression, k-neighbors, decision tree, random forest, and neural network. The training included hyperparameter optimization and cross-validation. The training included hyperparameter optimization and cross-validation. Alternatively, a feature extraction using deep learning and transfer learning was performed. The model based on these features extracted performed better than the previous ones. The results were analyzed and compared with a model from the literature trained on the same database, that presented better pre