Em busca de más notícias
Proposta
Aluno: Willian Gigliotti
Orientador: Alair Pereira do Lago
Monitoração de Mídias, www.monitoracaodemidias.com.br, é um sistema que desenvolvi no final de 2009, um banco de dados de informações sobre pessoas e entidades acusadas de envolvimento com atividades ilícitas, geradas a partir de notícias publicadas em território nacional.
Hoje, essas notícias são escolhidas através um filtro de palavras-chave e depois selecionadas e editadas manualmente.
O problema: são usadas mais de 2000 fontes de notícias no Brasil. Diariamente são selecionadas pelas palavras-chave cerca de 6000 notícias, dessas menos de 100 são selecionadas, 2000 são descartadas e mais de 4000 nem são olhadas.
Estudo de artigos, algoritmos e eventuais desenvolvimentos que tratem de como:
- Conseguir selecionar as notícias relevantes automaticamente.
- Identificar notícias repetidas.
- Desenvolvimento do sistema que captura as notícias
- Desenvolvimento da base de dados de notícias
- Obtenção do conjunto de dados para treino
- Leitura do artigo: Autonomous News Clustering and Classification for an Intelligent Web Portal
- Estudo de algoritmos de classificação
- Escolha do algoritmo para selecionar as notícias relevantes.
- Criar conjunto de treino.
- Implementação do algoritmo e testes com conjunto de treino
- Estudo e implementação do algoritmo de identificação das pessoas nas notícias.
- Versão preliminar da monografia (até 17/09)
- Poster (até 12/11)
- Preparar apresentação (até 12/11)
- Entrega da monografia (até 03/12)
- Versão final da monografia (até 12/02/2013)
- 1. Introdução
- 2. Conceitos e tecnologias estudadas
- 3. AtividadesrRealizadas
- 4. Resultados obtidos
- 5. Conclusões
- 6. Parte subjetiva