Estudo de comparação do descritor de imagens coloridas BIC empregando diferentes abordagens de classificação de detecção de bordas: Canny e Operador Laplaciano



Diego Martin Mancini

Orientador

Prof. Dr. Paulo A. V. de Miranda

PROPOSTA DE TRABALHO

O objetivo desse TCC é analisar o descritor BIC (Border/Interior pixel Classification) [1] com varições do mesmo usando algoritmos clásssicos da literatura em processamento de imagens. As variações utilizarão os seguintes algoritmos : detector de bordas Canny [2] e operador Laplaciano [3].

A análise consistirá em comparar o descritor BIC com suas variações já citadas em termos de acurácia. O termo acurácia usado nesse trabalho se refere em medir a eficiência de "acertos", que se refere a capacidade do descritor de recuperar imagens de uma mesma clase para dada uma imagem de consulta, utilizando um conjunto de imagens devidamente selecionado.

Para isso, serão necessárias 3 etapas. A primeira será estudar alguns papers e os algoritmos propriamente ditos. Já a segunda etapa consiste em implementar os algoritmos. Por fim, a terceira etapa será analisar os resultados obtidos através das implementações, utilizando um conjunto de imagens pública do ETH [4].

MOTIVAÇÃO

Em processamento de imagens, é comum utilizar técnicas computacionais para o reconhecimento de padrões. Uma das aplicações utilizadas atualmente é a recuperação de imagens baseada em conteúdo CBIR (Content-Based Image Retrieval). O descritor BIC é um método amplamente difundido, conhecido, a priori, pelo seu baixo custo computacional e que retém importantes informações das imagens para fins de descrição, conforme demonstrado no artigo desenvolvido por Stehling et. al. [1]. Esse artigo compara o BIC com outros descritores CBIR (Content Based Image Retrieval) baseados em distribuição de cores.

No entanto, o citado artigo não abrange alguns algoritmos clássicos da literatura que poderiam ser empregados nas diferentes etapas do BIC. A motivação deste artigo é analisar a eficiência e eficácia em termos de acurácia dos algoritmos descritos através da tabela de Precison x Recall. Esta tabela é bem conhecida e amplamente utilizada para avaliar a eficácia de recuperação de informações relevantes das imagens.

JUSTIFICATIVA

Como já mencionado na Seção "MOTIVAÇÃO", o descritor de cores BIC é um método eficaz comparado aos principais descritores baseados em CBIR. Seguindo a proposta desse trabalho e, dependendo dos resultados obtidos no mesmo, poderá ser indicada melhorias no descritor BIC com suas variações baseadas no detector de bordas de Canny e o operador Laplaciano.

Em resumo, o TCC será dividido em 3 partes: leitura de artigos e algoritmos, implementações de algoritmos e análise das implementações.

CRONOGRAMA

A seguir é apresentado o cronograma das atividades, para que se possa ter uma ideia da densidade de trabalho durante as diversas fases do projeto.


REFERÊNCIAS

[1] R. O. Stehling, M. A. Nascimento, and A. X. Falcão. A compact and efficient image retrieval approach based on border/interior pixel classification. CIKM ’02 Proceedings of the eleventh international conference on Information and knowledge management, 2002.

[2] Wikipedia. https://en.wikipedia.org/wiki/Canny_edge_detector. Acessado em 08-2015.

[3] R. F. Gonzalez and R. E. Woods. Digital image processing. Pearson PrenticeHall, 2008.

[4] Max planck institut informatic. https://www.mpi-inf.mpg.de/departments/computer-vision-and-multimodal-computing/research/object-recognition-and-scene-understanding/analyzing-appearance-and-contour-based-methods-for-object-categorization/. Acessado em 08-2015.