Materiais e métodos

O projeto foi desenvolvido no LEMB (Laboratório de Evolução Molecular e Bioinformática) do ICB-USP. O responsável pelo laboratório é o Prof. Dr. Paolo Zanotto.

O parque computacional disponível para a execução do programa é constituído por computadores IBM/PC, Macintosh, ALPHA/LINUX e Sun.

Os seguintes conjuntos de vírus (cujas filogenias são conhecidas) foram selecionados para comparar com os resultados do BlastPhen:

O BlastPhen foi escrito na linguagem Perl, o que facilitou o tratamento de arquivos e a interação com outros programas. O pacote BioPerl (disponível em http://bioperl.org) foi utilizado para lidar com os arquivos contendo os genomas.

Os genomas são passados ao BlastPhen no formato FASTA. Uma seqüência no formato FASTA começa com uma linha de descrição, seguida por linhas que contém a seqüência propriamente dita.

A linha de descrição começa com o símbolo ``>''. A palavra logo após este símbolo é considerada o ``ID'' (nome) da seqüência, e o resto da linha é a descrição. A seqüência acaba quando uma nova linha começando por ``>'' é encontrada ou o arquivo acaba.

Exemplo de um arquivo FASTA com duas seqüências:

>Example1 envelope protein
ELRLRYCAPAGFALLKCNDADYDGFKTNCSNVSVVHCTNLMNTTVTTGLLLNGSYSENRT
QIWQKHRTSNDSALILLNKHYNLTVTCKRPGNKTVLPVTIMAGLVFHSQKYNLRLRQAWC
HFPSNWKGAWKEVKEEIVNLPKERYRGTNDPKRIFFQRQWGDPETANLWFNCHGEFFYCK
MDWFLNYLNNLTVDADHNECKNTSGTKSGNKRAPGPCVQRTYVACHIRSVIIWLETISKK
TYAPPREGHLECTSTVTGMTVELNYIPKNRTNVTLSPQIESIWAAELDRYKLVEITPIGF
APTEVRRYTGGHERQKRVPFVXXXXXXXXXXXXXXXXXXXXXXVQSQHLLAGILQQQKNL
LAAVEAQQQMLKLTIWGVK 
>Example2 synthetic peptide
HITREPLKHIPKERYRGTNDTLSPQIESIWAAELDRYKLVKTNCSNVS



Subsections
Ricardo Nishikido Pereira 2004-12-06