As informações sobre os artigos publicados em revistas científicas da Universidade de São Paulo (USP) são mantidas em um sistema web chamado Portal de Revistas, gerenciado pelo Sistema Integrado de Bibliotecas (SIBi) da USP. O Portal de Revistas é implementado sobre o sistema eletrônico de editoração de revistas Open Journal System (OJS), um software livre que usa um banco de dados relacional para armazenar dados de artigos, revistas, autores, métricas sobre artigos, entre outras informações.
O modelo relacional do banco de dados do Portal de Revistas da USP é adequado para auxiliar as operações de manipulação de dados, como inclusão, alteração, remoção e consultas simples de dados. Entretanto, essa estrutura dificulta a realização de consultas mais elaboradas sobre os dados das publicações científicas. Uma evidência desta dificuldade é que o portal ainda não disponibiliza aos seus usuários análises sobre os dados contidos em seu banco.
Desde sua criação nos anos 70, o modelo de dados relacional é o mais utilizado no desenvolvimento de bancos de dados. Porém, ele não é o mais adequado para representar dados nas aplicação em que os relacionamentos entre as entidades são mais importantes que os atributos das mesmas. Diversas aplicações atuais tem essas características, como é o caso das redes sociais e das próprias publicações científicas, com suas relações de coautoria. Para esses tipos de aplicações, a representação e armazenamento de dados segundo o modelo de dados orientado a grafos geralmente é o mais indicado.
Em um banco de dados orientado a grafos, as entidades do domínio de aplicação são representadas como vértices (nós) do grafo, enquanto os relacionamentos entre elas são representados como arestas. Nesse modelo, consultas que buscam por entidades associadas por meio de relacionamentos (de qualquer grau) são executadas muito mais rapidamente do que em um bancos de dados relacional, onde as informações sobre essas entidades estariam espalhadas em diferentes tabelas interligadas por meio de chave estrangeiras.
Segundo Penteado et al.(2014), apesar dos bancos de dados orientado a grafos terem surgido nos anos 80, eles só ganharam força recentemente, sendo um dos motivos a expansão das redes sociais. Além disso, a grande quantidade de dados e o interesse nas análises sobre eles também impulsionaram o uso deste modelo de dados.
Em uma rede social, as pessoas são representadas por nós e a relação de amizade entre duas pessoas é representada por uma aresta entre dois nós. Uma das análises que pode ser realizada sobre o grafo de uma rede social é a busca de amigos de amigos, em diferentes níveis de profundidade, a partir de uma dada pessoa. Vukotic et al.(2014) realizaram experimentos que mostram que um banco de dados orientado a grafos tem um melhor desempenho que um banco de dados relacional quando se deseja realizar este tipo de análise.
Uma outra análise que pode ser realizada sobre bancos de dados orientados a grafos é a detecção de comunidades. Segundo Fortunato(2009), "comunidades, também chamadas de clusters ou módulos, são grupos de nós que provavelmente compartilham propriedades comuns e/ou desempenham funções similares no grafo".
O objetivo deste tipo de análise é identificar grupos de entidades a partir da topologia do grafo na qual estão inseridas. No caso dos dados do Portal de Revistas da USP, é possível obter os grupos de autores de uma dada área de pesquisa a partir do grafo de coautoria.
Como as técnicas de detecção de comunidades são definidas sobre grafos, armazenar estes dados em um banco de dados orientado a grafos facilita a realização de tais análises, visto que os algoritmos podem ser aplicados diretamente.