Neste trabalho, propõe-se um modelo de banco de dados orientado a grafos para os dados contidos no banco de dados relacional do Portal de Revistas da USP. Esse novo modelo visa atender dois objetivos principais:
Para atingir esses objetivos, primeiramente, foi necessário estudar a estrutura do banco de dados relacional do Portal de Revistas da USP e os dados contidos neste banco.
Os dados extraídos do banco do Portal de Revistas da USP tiveram que ser limpos e padronizados pois muitos continham erros de ortografia, estavam incompletos e/ou não tinham padrão. Os dados extraídos e utilizados foram os seguintes:
Além disso, estudou-se e modelou-se um banco de dados orientado a grafos. Neste banco, foram criados sete tipos de nó: artigo, autor, revista, cidade, país, instituto e universidade.
Para as análises, foram estudados quatro métodos de detecção de comunidades: Girvan-Newman, Louvain, autovalores e autovetores da matriz de modularidade e passeios aleatórios. Além disso, foram construídos quatro grafos a partir do banco modelado para cada um dos experimentos elaborados.
Em todos os grafos construídos, os nós representavam os autores e as arestas representavam a publicação de um artigo entre dois autores, ou seja, foram utilizados, do banco de dados orientado a grafos, os nós do tipo autor e a relação entre os autores que publicaram algum artigo junto.
Com este trabalho, foi possível verificar que o método de Louvain é o que tem melhor desempenho e que o tempo de execução do método de Girvan-Newman é afetado pela quantidade de arestas no grafo (quanto mais denso o grafo, mais demorado este método é).
Além disso, também observou-se que todos os métodos tem um resultado similar quando o grafo tem uma estrutura que facilita a detecção de comunidades. E, verificou-se que os gráficos dos acessos a um artigo facilitam a visualização da difusão e do impacto de artigos nos níveis regional, nacional e internacional.
As etapas realizadas neste trabalho estão descritas no fluxograma abaixo.
Foram utilizados os dados do Portal de Revistas da USP. Para isso, houve a colaboração dos desenvolvedores do Sistema Integrado de Bibliotecas (SiBi) da USP.