Biopal (V0.3) est une boîte à outils bioinformatique conçue pour traiter les fichiers de séquence Fasta. L'outil fournit plusieurs fonctionnalités telles que la division des fichiers FastA, le calcul des paramètres des protéines, l'interrogation des informations taxonomiques de NCBI et bien plus encore. Il utilise la bibliothèque tkinter pour fournir une interface graphique conviviale pour une entrée de fichiers et une sélection de fonctions faciles.
Split Fasta File : divise un fichier FastA en plusieurs fichiers plus petits avec un maximum de 99 séquences par fichier. Parfois requis pour le problème de la possibilité.
En-tête REMUmer : reprend les en-têtes longs en plus courts et standardisés (par exemple, basés sur le nom d'organisme du format NCBI [organism=...] ) et publie un CSV cartographier les en-têtes originaux et nouveaux. Il fournit à la fois un nouveau fichier fasta avec les nouveaux en-têtes courts et les séquences, et un fichier CSV avec les noms d'en-tête "ancien" et "New / Short" pour un suivi adéquat des séquences.
Calculatrice de Protparam : effectue des calculs en vrac de diverses propriétés protéiques (par exemple, poids moléculaire, point isoélectrique, etc.) similaire à l'outil Protparam d'Expasy et produit les résultats dans un fichier CSV. Remarque: Ce programme ignore les caractères "x" dans toutes les séquences pour effectuer des calculs sans erreurs. Renvoie un fichier CSV avec les résultats. Jusqu'à présent, cette fonctionnalité est toujours codée en dur et l'utilisateur ne peut pas modifier la sortie du programme.
Calculateur d'index de pli : interroge l'outil d'index de pli Proteopedia pour chaque séquence dans le fichier FASTA et publie l'index de pli de chaque séquence vers un fichier CSV.
Taxons Sage : Requête des informations taxonomiques (division, ordre, classe, famille) pour les organismes dans le fichier FASTA (nécessite la présence de [organism=...] dans l'en-tête) et écrit les résultats à un fichier CSV.
Microsintenic Retriever : à partir d'un fichier FastA conatinant des gènes téléchargés à partir des collections de données de NCBI, il analyse les données et trouve les données GFF3 des 20 kbp entourant les gènes d'intérêt. Illustre les données dans un fichier CSV lisible, idéal pour l'analyse évolutive.
Menu d'aide : fournit une description des fonctionnalités de l'outil.
Exit : ferme en toute sécurité l'application. Le programme ne contient pas d'informations de chemin / fichier.
Cet outil nécessite l'installation des bibliothèques Python suivantes:
tkinter pour l'interface utilisateur graphique.biopython pour analyser les fichiers Fasta et récupérer des informations taxonomiques.requests et json pour interroger des bases de données en ligne comme Proteopedia et NCBI.Vous pouvez installer les dépendances nécessaires en utilisant:
pip install biopython requestsgit clone https://github.com/SilicoGoBrr/BioPal.git
cd BioPalpip install -r requirements.txtpython biopal.pySélectionnez le fichier d'entrée : cliquez sur le bouton "Sélectionnez le fichier d'entrée" pour choisir votre fichier FastA.
Choisissez une opération :
Les résultats seront enregistrés dans le même répertoire que le fichier d'entrée, avec des noms de fichiers appropriés en fonction de l'opération effectuée.
La fonctionnalité Taxa Sage utilise l'API Entrez de NCBI pour récupérer les données taxonomiques. Pour cela, vous devez spécifier votre adresse e-mail, comme l'exige l'API Entrez de NCBI.
Dans le code, localisez la ligne suivante:
Entrez . email = "" # Add your email hereRemplacez-le par votre adresse e-mail valide:
Entrez . email = "[email protected]"Cette étape est nécessaire pour que l'API Entrez demande correctement.
Limiter les taux : L'API NCBI Entrez peut imposer des limites de taux. Pour éviter d'être limité par taux, l'outil introduit un court délai entre les demandes d'API lors de l'utilisation de la fonction de sage des taxons.
Exigences de format FastA : le fichier FastA d'entrée doit contenir [organism=...] des balises pour que la fonction des taxons sage fonctionne correctement.
Ce programme est fourni "tel quel" sans aucune garantie ni garantie. Utilisez-le à vos propres risques. Certaines fonctionnalités peuvent nécessiter une connexion Internet active.