Um dos passos na recuperação de informação é a indexação, que consiste na caracterização de um determinado dado através de uma de suas propriedades. É através desta característica, o índice, que é possível inferir algum grau de relevância nas buscas realizadas de maneira otimizada, principalmente em bases onde o volume de dados é extenso e possui-se pouca ou nenhuma estrutura que viabilize a rápida recuperação da informação.
Podemos ilustrar a importância da indexação na internet, onde as páginas são nossos objetos de interesse e deseja-se buscar informações relevantes sem ter de percorrer todas elas; bases de dados textuais de grande porte, como bibliotecas virtuais; e no ambiente científico, por exemplo vinculadas a pesquisas na área de biologia computacional.
Quando nos referimos à indexação, também nos preocupamos com fatores que podem determinar se uma determinada técnica é ou não eficiente, como o quanto de memória é gasta para criar os índices, a complexidade de inserir, editar e remover, qual o domínio de aplicação mais adequado e o fator de aceleração e relevância nas buscas realizadas.
O objetivo deste trabalho é explicitar técnicas avançadas de indexação e determinar dados relevantes que permitam concluir quais os domínios de aplicação mais adequados para cada um. Planeja-se também implementar ou modificar ou utilizar (através de um framework) uma destas técnicas de modo a fazer uma estimativa dos dados verificados.