Treinamento e Síntese de FCNs com campo receptivo variável

Student: Pedro Sola Pimentel

Professor: Roberto Hirata Junior

Abstract

A Segmentação de Semântica de Imagens é uma área que vem crescendo exponencialmente nos últimos anos devivo aos incentivos gerados por competições online, a crescente demanda por sistemas automátizados de sumarização de informações e a necessidade de métodos de visualização e interpretação de imagens para tomada de decisão automática. Tarefas como detecção de tumores em imagens médicas, detecção de faces em streaming de vídeo, geração de mapas para GPS e carros autoguiados são apenas algumas das áreas em que esse tópico se faz presente. Portanto seu desenvolvimento é de alta relevância para o meio acadêmico.

Particularmente, o uso de redes neurais utilizando somente operações de convolução (FCNs) para realizar estas tarefas é uma área bem estudada, que se mostrou promissora em diversas tarefas, devido ao sua performance equiparada ao que se denomina estado da arte ao passo que mantém tempos de treinamento e inferência menores do que os sistemas típicos.

Neste trabalho, vamos explorar diferentes maneiras de combinar FCNs com campos receptivos variáveis e kernel compartilhado, avaliar sua performance e explorar formas de sintetizar essas redes em um único sistema de segmentação.

Objetivos

  1. Estudar diferentes metodologias e arquiteturas de FCNs.
  2. Explorar o impacto da escolha do campo receptivo na performance de modelos de segmentação de imagens.
  3. Utilizar a arquitetura de Redes Neurais Totalmente Convolucionais (FCNs) para segmentação imagens
  4. Propor uma Rede Neural de síntese para as imagens produzidas pelas redes FCN.

Planejamento

Atividade Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov
Estudo e levantamento de papers
Implementação de FCNs com campo receptivo variável
Implementaçao de mecanismos de síntese simples
Implementação de rede neural de síntese
Elaboração da monografia e pôster