Biopal(V0.3)は、FASTAシーケンスファイルを処理するために設計されたバイオインフォマティクスツールキットです。このツールは、FASTAファイルの分割、タンパク質パラメーターの計算、NCBIからの分類情報のクエリなど、いくつかの機能を提供します。 tkinterライブラリを使用して、ユーザーフレンドリーなグラフィカルインターフェイスを提供して、ファイル入力と機能を簡単に選択できます。
FASTAファイルの分割:FASTAファイルをファイルごとに最大99のシーケンスを持つ複数の小さなファイルに分割します。ポストプロセシングに必要な場合があります。
ヘッダー履歴書:長いヘッダーを短く、標準化されたヘッダー(たとえば、NCBI形式[organism=...]の生物名に基づいて)に再開し、元のヘッダーと新しいヘッダーをマッピングするCSVを出力します。新しいショートヘッダーとシーケンスを備えた新しいFASTAファイルと、シーケンスの適切な追跡のために「古い」および「新しい/ショート」ヘッダー名の両方を備えたCSVファイルの両方を提供します。
Potparam Calculator :ExpasyのProtparamツールと同様に、さまざまなタンパク質特性(例、分子量、等電点など)のバルク計算を実行し、結果をCSVファイルに出力します。注:このプログラムは、すべてのシーケンスの「x」文字を無視して、エラーなしで計算を実行します。結果を伴うCSVファイルを返します。これまでのところ、この機能はまだハードコーディングされており、ユーザーはプログラムの出力を変更できません。
折り畳みインデックス計算機:FASTAファイルの各シーケンスのプロテオペディアフォールドインデックスツールをクエリし、各シーケンスの折り畳みインデックスをCSVファイルに出力します。
分類群:FASTAファイル内の生物の分類情報(部門、順序、クラス、家族)の分類情報(ヘッダーに[organism=...]の存在が必要です)のクエリは、結果をCSVファイルに書き込みます。
Microsinic Retriever :NCBIのデータセットコレクションからダウンロードされたFASTAファイルコナチング遺伝子から始まると、データを解析し、関心のある遺伝子を取り巻く20 kbpのGFF3データを見つけます。読みやすいCSVファイルにデータを描写し、進化分析に最適です。
ヘルプメニュー:ツールの機能の説明を提供します。
終了:アプリケーションを安全に閉じます。プログラムはパス/ファイル情報を保持しません。
このツールでは、次のPythonライブラリをインストールする必要があります。
tkinter 。biopython 。requestsとjson 。以下を使用して、必要な依存関係をインストールできます。
pip install biopython requestsgit clone https://github.com/SilicoGoBrr/BioPal.git
cd BioPalpip install -r requirements.txtpython biopal.py[入力ファイル]を選択します。[入力ファイルを選択]ボタンをクリックして、FASTAファイルを選択します。
操作を選択してください:
結果は、入力ファイルと同じディレクトリに保存され、実行された操作に基づいて適切なファイル名があります。
Taxa Sage特徴は、NCBIのEntrez APIを使用して分類データを取得します。このためには、NCBIのEntrez APIで要求されているように、メールアドレスを指定する必要があります。
コードで、次の行を見つけます。
Entrez . email = "" # Add your email here有効なメールアドレスに置き換えます:
Entrez . email = "[email protected]"このステップは、Entrez APIリクエストが適切に機能するために必要です。
レート制限:NCBI Entrez APIは、レートの制限を課す可能性があります。レート制限されないように、このツールは、分類群のセージ機能を使用する場合、APIリクエスト間に短い遅延を導入します。
FASTA形式の要件:入力FASTAファイルには、分類群のセージ機能が正しく機能するための[organism=...]タグを含める必要があります。
このプログラムは、保証や保証なしで「現状のまま」提供されます。あなた自身の責任でそれを使用してください。一部の機能には、アクティブなインターネット接続が必要になる場合があります。