Biopal(V0.3)是一種生物信息學工具包,旨在處理FastA序列文件。該工具提供了多種功能,例如分解FASTA文件,計算蛋白質參數,從NCBI查詢分類信息等等。它使用tkinter庫提供一個用戶友好的圖形接口,以簡化文件輸入和功能選擇。
Split FastA文件:將FASTA文件分為多個較小的文件,每個文件最多99個序列。有時需要郵政郵政。
標題簡歷:將長標頭恢復到較短的標準化(例如,基於NCBI格式的有機體名稱[organism=...] ),並輸出CSV映射原始和新標頭。它提供了一個新的FASTA文件,上面有新的短標頭和序列,以及一個帶有“舊”和“新/短”標題名稱的CSV文件,用於足夠的序列跟踪。
Protparam計算器:類似於Expasy的Protparam工具,執行各種蛋白質特性(例如,分子量,等電點等)的大量計算,並將結果輸出到CSV文件中。注意:此程序忽略所有序列中的“ X”字符以執行無錯誤的計算。返回帶有結果的CSV文件。到目前為止,此功能仍然是硬編碼的,並且用戶無法更改程序的輸出。
折疊索引計算器:查詢FASTA文件中每個序列的proteopedia折疊索引工具,並將每個序列的折疊索引輸出到CSV文件中。
分類群:查詢分類信息(分類,命令,班級,家庭)中的生物中的生物(需要在標題中存在[organism=...] ),並將結果寫入CSV文件。
Microsintenic Retriever :從從NCBI的數據集集合下載的FASTA文件共同基因開始,它解析數據並找到圍繞感興趣基因的20 kbp的GFF3數據。在可讀的CSV文件中描述數據,非常適合進化分析。
幫助菜單:提供工具功能的描述。
出口:安全關閉應用程序。程序不容納路徑/文件信息。
此工具需要安裝以下Python庫:
tkinter 。biopython 。requests和json查詢諸如Proteopedia和NCBI之類的在線數據庫。您可以使用以下方式安裝必要的依賴項
pip install biopython requestsgit clone https://github.com/SilicoGoBrr/BioPal.git
cd BioPalpip install -r requirements.txtpython biopal.py選擇輸入文件:單擊“選擇輸入文件”按鈕以選擇您的fasta文件。
選擇一個操作:
結果將與輸入文件相同的目錄保存,並根據執行的操作提供適當的文件名。
Taxa Sage功能使用NCBI的Entrez API檢索分類數據。為此,您需要按照NCBI的Entrez API指定您的電子郵件地址。
在代碼中,找到以下行:
Entrez . email = "" # Add your email here用您的有效電子郵件地址替換:
Entrez . email = "[email protected]"對於Entrez API請求正常工作是必要的。
限制速率:NCBI Entrez API可能會施加速率限制。為了避免使用速率限制,該工具在使用Taxa Sage功能時會引入API請求之間的短延遲。
FASTA格式要求:輸入FASTA文件必須包含[organism=...]的分類鼠鼠標函數的標籤,才能正常工作。
該計劃的“原樣”提供了任何保證或擔保。使用它自己的風險。某些功能可能需要有效的Internet連接。