Biopal (V0.3) ist ein Bioinformatik -Toolkit, mit dem Fasta -Sequenzdateien verarbeitet werden. Das Tool bietet mehrere Funktionen wie das Aufteilen von Fasta -Dateien, die Berechnung von Proteinparametern, das Abfragen taxonomischer Informationen von NCBI und vieles mehr. Es verwendet die tkinter Bibliothek, um eine benutzerfreundliche grafische Schnittstelle für die einfache Dateieingabe und Funktionsauswahl bereitzustellen.
Fasta -Datei teilen : teilt eine Fasta -Datei in mehrere kleinere Dateien mit maximal 99 Sequenzen pro Datei auf. Manchmal für die Nachverarbeitung erforderlich.
Header Resumer : Nebt lange Header in kürzere, standardisierte (z. B. auf der Grundlage des Organismusnamens aus dem NCBI -Format [organism=...] ) und gibt eine CSV -Kartierung der ursprünglichen und neuen Header aus. Es bietet sowohl eine neue Fasta -Datei mit den neuen kurzen Headern als auch mit den Sequenzen als auch eine CSV -Datei mit den "alten" und "neuen/kurzen" Header -Namen für die angemessene Verfolgung von Sequenzen.
Protparam -Rechner : Führen Sie Massenberechnungen verschiedener Proteineigenschaften (z. B. Molekulargewicht, isoelektrischer Punkt usw.) ähnlich wie das Protparam -Tool von Expasy und geben die Ergebnisse in eine CSV -Datei aus. Hinweis: Dieses Programm ignoriert "X" -Pere in allen Sequenzen, um Berechnungen ohne Fehler durchzuführen. Gibt eine CSV -Datei mit den Ergebnissen zurück. Bisher ist diese Funktion noch hartcodiert und der Benutzer kann die Ausgabe des Programms nicht ändern.
FALT -INDEX -Rechner : Fragen Sie das Proteopedia -Fold -Index -Tool für jede Sequenz in der Fasta -Datei ab und geben den Faltindex jeder Sequenz in eine CSV -Datei aus.
Taxa Sage : Taxonomische Informationen (Abteilung, Ordnung, Klasse, Familie) für Organismen in der Fasta -Datei (erfordert das Vorhandensein von [organism=...] im Kopf) und schreibt die Ergebnisse in eine CSV -Datei.
Microsintenic Retriever : Ausgehend von einer Fasta -Datei -Conatining -Gene, die von den Datensatzsammlungen von NCBI heruntergeladen wurden, analysiert sie Daten und findet GFF3 -Daten der 20 kBP, die die interessierenden Gene umgeben. Zeigt die Daten in einer lesbaren CSV -Datei, die sich hervorragend für die evolutionäre Analyse eignet.
Hilfemenü : Bietet eine Beschreibung der Funktionen des Werkzeugs.
Beenden : Schließt die Anwendung sicher. Das Programm enthält keine Pfad-/Dateiinformationen.
Für dieses Tool müssen die folgenden Python -Bibliotheken installiert werden:
tkinter für die grafische Benutzeroberfläche.biopython zum Parsen von Fasta -Dateien und zum Abrufen von taxonomischen Informationen.requests und json zur Abfrage von Online -Datenbanken wie Proteopedia und NCBI.Sie können die erforderlichen Abhängigkeiten mithilfe von:
pip install biopython requestsgit clone https://github.com/SilicoGoBrr/BioPal.git
cd BioPalpip install -r requirements.txtpython biopal.pyWählen Sie Eingabedatei : Klicken Sie auf die Schaltfläche "Eingabedatei auswählen", um Ihre Fasta -Datei auszuwählen.
Wählen Sie eine Operation :
Die Ergebnisse werden im selben Verzeichnis wie die Eingabedatei gespeichert, wobei entsprechende Dateinamen basierend auf der ausgeführten Operation basieren.
Die Taxa Sage -Funktion verwendet die Entrez -API von NCBI, um taxonomische Daten abzurufen. Hierzu müssen Sie Ihre E -Mail -Adresse angeben, wie dies von der Entrez API von NCBI erforderlich ist.
Suchen Sie im Code die folgende Zeile:
Entrez . email = "" # Add your email hereErsetzen Sie es durch Ihre gültige E -Mail -Adresse:
Entrez . email = "[email protected]"Dieser Schritt ist erforderlich, damit die API -Anfragen von Entrez ordnungsgemäß arbeiten.
Ratenlimitierende : Die NCBI-Entrez-API kann Ratengrenzen auferlegen. Um zu vermeiden, dass bewertet wird, führt das Tool bei Verwendung der Taxa Sage-Funktion eine kurze Verzögerung zwischen API-Anfragen vor.
Anforderungen an das FASTA -Format : Die Eingabe -Fasta -Datei muss [organism=...] Tags für die Taxa Sage -Funktion enthalten, um korrekt zu funktionieren.
Dieses Programm wird "wie ist" ohne Garantien oder Garantien bereitgestellt. Verwenden Sie es auf eigenes Risiko. Einige Funktionen erfordern möglicherweise eine aktive Internetverbindung.