CIMS Cyanobacterial ITS motif slicerダウンロード-CIMS CIMS Cyanobacterial ITS motif slicerソースコードダウンロード

CIMS Cyanobacterial ITS motif slicer

その他のソースコード

v0.5-alpha

ダウンロード

CIMS：シアノバクテリアそのモチーフスライサー

CIMS 、16S-23S RRNAシーケンスから一般的に使用される折りたたみモチーフを抽出するツールです。 FASTAまたは少なくとも1つのGenBankアクセッション番号が必要であり、提供された各シーケンスのそれぞれのラベルを含むモチーフのリストを返します。 MS Wordのモチーフを強調するために何時間も費やしているシアノバクテリア研究に捧げられています。

コンテンツの表

=========

なぜCIMSを作ったのですか？
また何をしますか？
インストール
使用法
可能なエラー

なぜこのツールを作ったのですか？

16S-23S rRNA内部転写スペーサー（ITS）は、シアノバクテリア系統で一般的に採用されている系統系マーカーです。その地域を調べることで、研究者はシアノバクテリアの種間の一致とアポモーフィーを発見することができます。これにより、新しい謎めいた分類群を建設したり、以前に解決されていなかった分類関係を分析したりする際に、研究者がより多くの証拠を得ることができます。ただし、課題は、歴史的に研究者がシーケンスデータを手動で掘り下げて、そのシーケンスモチーフを視覚的に見つけて特定する必要があることです。この骨の折れるプロセスは、研究者がそのモチーフを使用することを思いとどまらせ、エラーにつながり、言うまでもなく頭痛を引き起こします。

これを行うためのより良い方法があることはわかっていたので、手動プロセスを分析した後、 CIMSを作成しました。

CIMS 、D1-D1 '、Box B、TRNA-ILE、TRNA-ALAなどの折りたたみモチーフを一般的に使用して、分類群間の二次構造を比較する際に研究者が相同オペロンを使用していることを確認します。

また何をしますか？

CIMSは、Pythonで書かれたターミナルアプリケーションです
1つ以上のGenBankアクセッション番号または1つ以上のシーケンスを備えたFASTAファイルを処理できます。
GenBankと自動的に話し合うので、FASTAファイルを自分でダウンロードする必要はありません。
識別されたモチーフと、あなたが好きなように使用できるように、それらの高さでテキスト出力を返します。

ソフトウェアの現在のバージョンでは、標準出力に含まれるモチーフは次のとおりです。

リーダー
d1-d1`
スペーサー - D2 - スペーサー
trna-ala
スペーサー - V2-スペーサー
trna-lile
ボックスb
D4
ボクサ
V3

インストール

前提条件

私たちはそれを手に入れ、あなたは生物学者です、私たちはあなたを手に入れました。必要なのは、ターミナルの初心者レベルだけです...多分それほどではありません。ディレクトリ（ cd ）に閲覧する方法を知っていて、実行可能ファイル（ ./cims ）を実行する場合は、行ってもいいです。

シンプルな方法：リリースから事前にパッケージ化されたファイルをダウンロードします。

物事をシンプルに保つために、 CIMSすべての依存関係で単一のファイルに事前にパッケージ化し、Windows、Linux、およびMacOS用にコンパイルしました。これらのファイルはリリースで利用できます。

システムに対応するzipファイルをダウンロードします。
どちらのディレクトリで希望するかを解凍します。
あなたは終わった！？
実行するには、お気に入りの端末、 cdそのディレクトリに開き、通常は./cimsを入力して実行可能ファイルとしてCIMSを実行します。

物事をシンプルに保つために、処理するFASTAファイルを持っているディレクトリにCIMSを保存することをお勧めします。 GenBankからシーケンスを直接引っ張っている場合、それは実際には問題ではありません。

高度な方法：Pythonスクリプトをダウンロードします。

おそらく、隣接する地域に独自の変更を加えたり、コードを変更したい場合は、cims.pyからpythonでCIMS.pyをダウンロードして実行できます。（しかし、あなたはおそらくそれがあなたが望んでいたものであるかどうかをすでに知っていたでしょう）。

CIMSを実行するには、必要です。

Python 3
Biopython： $ pip install Biopython
colorama $ pip install colorama

Biopythonを使用すると、 CIMS GenBankと通信してシーケンスをダウンロードできます。 Coloramaを使用すると、モチーフをかなり色で簡単に出力できます。

これらの依存関係を（グローバルまたは仮想環境のいずれか）にインストールしたら、 cims.pyを実行するだけです。

使用法

CIMS端末で実行されます。 FASTAファイルを介して、またはアクセッション番号に基づいてGenBankからそれらを取得することにより、シーケンスが提供されます。このツールの入力は、1つ以上の適切にフォーマットされた16S-23Sのシーケンスを備えたFASTAファイルまたは16S-23SのシーケンスへのGenBankアクセッション番号のいずれかでなければなりません。

CIMSが保存された場所に移動します。

たとえば、Windowsでは、 cdを使用してディレクトリに移動します。

cd C:/Users/{your-username}/Desktop/PathtoFile

またはLinux/Macで：

cd /home/{your username}/{where you downloaded cims}

CIMSを実行するには、保存されたディレクトリから./cimsまたはpython cims.pyを実行して実行するだけで実行します。

これを端末で実行すると、出力にはプログラムに与えられたシーケンスにあるすべてのモチーフが含まれます。実行の出力を保存したい場合は、「>>」を使用して出力をテキストファイルに保存することを忘れないでください。

cims -f myfasta.fasta >> motifs.txt

フラグ、引数、およびその説明のリストは以下にあります。

Usage: cims [-f or -g ] [file or accession number] [OPTIONS]

Options:
-f, --fasta PATH-TO-FASTA-FILE                                             Provide FASTA to be processed.
-g, --genbank ACCESSION1 [ACCESSION2 ...]                                  Provide one or more Genbank Accession Numbers to fetch and process.
-s, --select {leader,d1d1,sp_v2_sp,trna_ile,trna_ala,boxa,boxb,d4,v3,all}  Select which motifs to print out. By default it prints all.
-e, --email                                                                Provide an email to be used when querying Genbank. An NCBI requirement.
-j, --json                                                                 Create a json file in the working directory with the output.
-t, --trna                                                                 Returns ONLY how many tRNAs were found per sequence.

例：

cims =f allmycyanos.fasta

結果： CIMS 、提供されたFASTAファイルを処理し、見つけたすべてのモチーフを返します。

cims -f ~/home/me/fasta/limnothrix_16-23_ITS.fasta -s d1d1, trna_ile, trna_ala, boxb

結果：/home/me/fastaにあるディレクトリに保存されているlimnothrix_16-23_its.fastaファイルを処理し、 CIMS d1d1、trnas、boxbモチーフのみを出力するように依頼します。

cims -g KU574618.1 -e [email protected]

結果：GenBankからKU574618.1のシーケンスを取得し（NCBIが必要とする電子メールを提供）、シーケンスを処理し、モチーフを返します。

cims -f allmycyanos.fasta -t

結果：GenBankからシーケンスを取得し、各生物で見つかったTRNAの数を返します。これにより、FASTAの生物が相同オペロンであるかどうかを簡単に確認できます。

迷子になった場合は、いつでもcims -hまたはpython cims.py -hを実行できます。利用可能なオプションをすばやく参照できます。

可能なエラー：

1。 `“Could not find the end of 16S to determine the ITS region boundaries”`

このエラーは、ソフトウェアに与えられたシーケンスに、16S領域（CCTCCTT）の終わりを表すシーケンスを含まなかったことを意味します。プログラムにその領域のみを提供し、すべてが通常どおりに実行される場合、実行を進めることができます。これにより、プログラムがFASTAファイルの次のシーケンスに移動するか、別のファイル/アクセッション＃で再試行できるようになります。

3。 `“Region length too short. Skipped.”`

これは、16S遺伝子の終了後のその領域が20bps未満の場合に印刷されます。この機能は、モチーフを見つけるには小さすぎる領域でシーケンスを削除するようにコーディングされています。

4。 `“Not found in this sequence.”`

この出力は、そのシーケンスに特定のモチーフが見つからなかったときに印刷されます。これは、隣接する地域がユニークであるか、そうでなければレアであるため、ソフトウェアがこれらを見つけられなかったためかもしれません。これがデータセットで頻繁に発生する場合は、このエラーに対処してコードを改善できるように、GitHubの「問題」ページでこれを報告してください。

5。 `“Not present in this operon”`

これは、シーケンス内のTRNAに関してのみ印刷されます。プログラムがtRNA-ALAまたはtRNA-ILEを見つけられない場合、このオペロンには一方または両方のTRNAが含まれていないと仮定します。分類群（つまり、同じ数のTRNAを含むオペロン）間でモチーフを比較するときに、相同オペロンを使用することをお勧めします。

拡大する

追加情報

バージョン v0.5-alpha
タイプその他のソースコード
更新時間 2025-04-30
サイズ 21.64KB
から Github

CIMS Cyanobacterial ITS motif slicer

CIMS：シアノバクテリアそのモチーフスライサー

コンテンツの表

なぜこのツールを作ったのですか？

また何をしますか？

インストール

前提条件

シンプルな方法：リリースから事前にパッケージ化されたファイルをダウンロードします。

高度な方法：Pythonスクリプトをダウンロードします。

使用法

例：

可能なエラー：

1。 `“Could not find the end of 16S to determine the ITS region boundaries”`

3。 `“Region length too short. Skipped.”`

4。 `“Not found in this sequence.”`

5。 `“Not present in this operon”`

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

フルーツダイヤモンドカッター(アーケードスライサー)

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express

CIMS Cyanobacterial ITS motif slicer

CIMS：シアノバクテリアそのモチーフスライサー

コンテンツの表

なぜこのツールを作ったのですか？

また何をしますか？

インストール

前提条件

シンプルな方法：リリースから事前にパッケージ化されたファイルをダウンロードします。

高度な方法：Pythonスクリプトをダウンロードします。

使用法

例：

可能なエラー：

1。 “Could not find the end of 16S to determine the ITS region boundaries”

3。 “Region length too short. Skipped.”

4。 “Not found in this sequence.”

5。 “Not present in this operon”

1。 `“Could not find the end of 16S to determine the ITS region boundaries”`

3。 `“Region length too short. Skipped.”`

4。 `“Not found in this sequence.”`

5。 `“Not present in this operon”`