A Biopal (v0.3) é um kit de ferramentas de bioinformática projetado para processar arquivos de sequência fasta. A ferramenta fornece várias funcionalidades, como dividir arquivos de fasta, calcular parâmetros de proteína, consultar informações taxonômicas do NCBI e muito mais. Ele usa a biblioteca tkinter para fornecer uma interface gráfica fácil de usar para fácil entrada de arquivo e seleção de funções.
Split FASTA FILE : divide um arquivo fasta em vários arquivos menores com um máximo de 99 seqüências por arquivo. Às vezes, é necessário para o pós -processamento.
Cabeçalho do cabeçalho : retoma os cabeçalhos longos para os mais curtos e padronizados (por exemplo, com base no nome do organismo do formato NCBI [organism=...] ) e produz um CSV que mapeia os cabeçalhos originais e novos. Ele fornece um novo arquivo FASTA com os novos cabeçalhos curtos e as seqüências e um arquivo CSV com os nomes "antigos" e "novos/curtos" para rastreamento adequado de sequências.
Calculadora do ProtParam : executa cálculos em massa de várias propriedades de proteínas (por exemplo, peso molecular, ponto isoelétrico, etc.) semelhante à ferramenta Protparam da Expasy e produz os resultados em um arquivo CSV. Nota: Este programa ignora os caracteres "X" em todas as seqüências para executar cálculos sem erros. Retorna um arquivo CSV com os resultados. Até agora, esse recurso ainda é codificado e o usuário não pode alterar a saída do programa.
Calculadora do índice de dobra : consulta a ferramenta Proteopedia Fold Index para cada sequência no arquivo fasta e produz o índice de dobra de cada sequência para um arquivo CSV.
Taxa Sage : consulta informações taxonômicas (divisão, ordem, classe, família) para organismos no arquivo fasta (requer a presença de [organism=...] no cabeçalho) e grava os resultados em um arquivo CSV.
Microsintenic Retriever : A partir de um arquivo fasta, conatinando genes baixados das coleções de dados do NCBI, ele analisa dados e encontra dados GFF3 dos 20 kbp em torno dos genes de interesse. Descreve os dados em um arquivo CSV legível, ótimo para análise evolutiva.
Menu de ajuda : fornece uma descrição das funcionalidades da ferramenta.
Sair : fecha com segurança o aplicativo. O programa não possui informações de caminho/arquivo.
Esta ferramenta exige que as seguintes bibliotecas Python sejam instaladas:
tkinter para a interface gráfica do usuário.biopython para analisar arquivos fasta e recuperar informações taxonômicas.requests e json por consultar bancos de dados on -line como Proteopedia e NCBI.Você pode instalar as dependências necessárias usando:
pip install biopython requestsgit clone https://github.com/SilicoGoBrr/BioPal.git
cd BioPalpip install -r requirements.txtpython biopal.pySelecione o arquivo de entrada : clique no botão "Selecione o arquivo de entrada" para escolher seu arquivo fasta.
Escolha uma operação :
Os resultados serão salvos no mesmo diretório que o arquivo de entrada, com nomes de arquivos apropriados com base na operação executada.
O recurso Taxa Sage usa a API Entrez da NCBI para recuperar dados taxonômicos. Para isso, você precisa especificar seu endereço de e -mail, conforme exigido pela API Entrez da NCBI.
No código, localize a seguinte linha:
Entrez . email = "" # Add your email hereSubstitua -o pelo seu endereço de e -mail válido:
Entrez . email = "[email protected]"Esta etapa é necessária para que as solicitações da API Entrez funcionem corretamente.
Limitação da taxa : a API do NCBI Entrez pode impor limites de taxa. Para evitar ser limitado a taxa, a ferramenta apresenta um breve atraso entre as solicitações da API ao usar o recurso Sage Taxa.
Requisitos de formato FASTA : O arquivo FASTA de entrada deve conter [organism=...] Tags para a função de táxons sálvia funcionar corretamente.
Este programa é fornecido "como está" sem garantias ou garantias. Use -o por sua conta e risco. Alguns recursos podem exigir uma conexão ativa à Internet.