Aluno: Augusto César Monteiro Silva
Orientadores: Roberto Hirata e Igor dos Santos Montagner
Tema: Aprendizado de operadores de imagens baseados em características locais
O processamento de imagens é uma área da Computação que estuda transformações de imagens a partir de determinados atributos.
O estudo do uso de operadores locais é de grande importância para esta área, pois auxilia no reconhecimento de estruturas que
podem ser usadas para segmentação ou para o reconhecimento de objetos.
Essas transformações são dependentes da aplicação e dos dados, sendo assim, esses operadores são geralmente escolhidos e combinados
heuristicamente, o que depende da experiência e habilidade do profissional. Uma alternativa a essa escolha manual é o uso de técnicas
de aprendizado computacional para que esses operadores locais possam ser determinados.
A TRIOSlib é uma biblioteca computacional que consiste em várias técnicas de aprendizado de máquina para operadores locais de imagens[1].
Nela estão implementados diversos métodos e funções que auxiliam na criação de um operador local, tendo como base um conjunto de
dados de treinamento, como nas figuras 1.a e 1.b.
Figura 1.a Imagem de entrada
Figura 1.b Imagem de saída
Objetivos
- Implementação de novos extratores de características na TRIOSlib.
- Comparação entre diferentes aplicações da TRIOS.
- Otimização da seleção de features para uma aplicação.
Atividade já realizadas e previstas
Já foi implementado um extrator de características baseadas na imagem criada pelo algoritmo do LBP (Local Binary Pattern) [2][3].
Essa feature foi testada com um conjunto de dados de documentos cujo objetivo era segmentar um determinado símbolo. O resultado
deste procedimento usando a característica do LBP foi melhor do que algumas features já implementadas.
As próximas características já planejadas para serem implementadas na TRIOSlib serão baseadas no LTP (Local Ternary Pattern) e
em descritores de forma[4][5].
Cronograma
- Levantamento Bibliográfico
- Estudo de características e técnicas de aprendizado computacional.
- Implementação na TRIOS
- Aplicação da TRIOS em diversos datasets
- Escrita da monografia
# |
Abril |
Maio |
Junho |
Julho |
Agosto |
Setembro |
Outubro |
Novembro |
1 |
X |
X |
X |
|
|
|
|
|
2 |
X |
X |
X |
X |
|
|
|
|
3 |
|
X |
X |
X |
X |
|
|
|
4 |
|
|
|
X |
X |
X |
|
|
5 |
|
|
|
|
X |
X |
X |
X |
Referências
[1] I. S. Montagner, Nina S. T. Hirata, and R. Hirata Jr. Image operator
learning and applications. In 29th Conference on Graphics, Patterns and
Images Tutorials (SIBGRAPI-T).
[2] DC. He and L. Wang (1990), "Texture Unit, Texture Spectrum, And Texture Analysis",
Geoscience and Remote Sensing, IEEE Transactions on, vol. 28, pp. 509 - 512 .
[3] L. Wang and DC. He (1990), "Texture Classification Using Texture Spectrum", Pattern Recognition, Vol. 23, No. 8, pp. 905 - 910.
[4] R. M. Cesar, L. F. Costa. Shape Analysis and Classification: Theory and Practice. 2th ed., CRC Press, 2010
[5] R. C. Gonzalez and R. E. Woods, Digital Image Processing (3rd Edition). Upper Saddle River, NJ, USA: Prentice-Hall, Inc., 2006