Trabalho de Formatura Supervisionado

Em busca de Más notícias

Proposta


Em busca de más notícias


Aluno: Willian Gigliotti

Orientador: Alair Pereira do Lago


Monitoração de Mídias, www.monitoracaodemidias.com.br, é um sistema que desenvolvi no final de 2009, um banco de dados de informações sobre pessoas e entidades acusadas de envolvimento com atividades ilícitas, geradas a partir de notícias publicadas em território nacional.

Hoje, essas notícias são escolhidas através um filtro de palavras-chave e depois selecionadas e editadas manualmente.

O problema: são usadas mais de 2000 fontes de notícias no Brasil. Diariamente são selecionadas pelas palavras-chave cerca de 6000 notícias, dessas menos de 100 são selecionadas, 2000 são descartadas e mais de 4000 nem são olhadas.


Estudo de artigos, algoritmos e eventuais desenvolvimentos que tratem de como:

  • Conseguir selecionar as notícias relevantes automaticamente.
  • Identificar notícias repetidas.

  • Desenvolvimento do sistema que captura as notícias
  • Desenvolvimento da base de dados de notícias
  • Obtenção do conjunto de dados para treino
  • Leitura do artigo: Autonomous News Clustering and Classification for an Intelligent Web Portal

  • Estudo de algoritmos de classificação
  • Escolha do algoritmo para selecionar as notícias relevantes.
  • Criar conjunto de treino.
  • Implementação do algoritmo e testes com conjunto de treino
  • Estudo e implementação do algoritmo de identificação das pessoas nas notícias.
  • Versão preliminar da monografia (até 17/09)
  • Poster (até 12/11)
  • Preparar apresentação (até 12/11)
  • Entrega da monografia (até 03/12)
  • Versão final da monografia (até 12/02/2013)

  • 1. Introdução
  • 2. Conceitos e tecnologias estudadas
  • 3. AtividadesrRealizadas
  • 4. Resultados obtidos
  • 5. Conclusões
  • 6. Parte subjetiva
2012, Instituto de Matemática e Estatística - Universidade de São Paulo