Varusはもともと、Mario Stankeが監督した学士号としてWilly Bruhnによって書かれていました。このリポジトリは、2018年11月に作成されたhttps://github.com/willybruhn/varusのコピーであり、多くのバグフィックス、インクリメンタルなイントロンデータベース機能、およびHisat al Alternativeアライメントプログラムを使用するための拡張機能を含んでいます。
Varusは、遺伝子フィンダートレーニングとゲノム注釈を目的として、多くの遺伝子の十分に高いカバーをターゲットにする、NCBIのシーケンス読み取りアーカイブ(SRA)から限られた数のRNA-SEQ読み取りの選択とダウンロードを自動化します。オンラインアルゴリズムの各反復
リポジトリをクローンするために、コマンドラインから次のコマンドを呼び出します。
git clone https://github.com/MarioStanke/VARUS.gitvarusは依存します
sudo apt-get install bamtools libbamtools-devでインストールVarusを手動でコンパイルします
cd Implementation
make
デフォルトでは、NCBIツールfastq-dumpデータがダウンロードされている実行ファイルと同じサイズの~/ncbiの下に一時ファイルを作成します。おそらくほとんどのユーザーにとってハードドライブスペースが多すぎるこのキャッシュ動作を無効にします
mkdir -p ~/.ncbi
echo '/repository/user/cache-disabled = "true"' >> ~/.ncbi/user-settings.mkfg
ディレクトリのexampleに変更し、例/readmeの指示に従ってください。
ファイルVARUSparameters.txtサンプルフォルダーからワーキングディレクトリにコピーし、必要に応じて調整します。
最も重要なパラメーター:
- バッチサイズ各反復でダウンロードする読み取りの数を指定します(例:50000または200000)
-MaxBatchesはせいぜい数のバッチをダウンロードする必要があるかを指定します
最終出力は、 varus.bamと呼ばれるソートされたスプライスされたアライメントファイル(すべてバッチを一緒にバッチ)です。
引用してください:varus:サンプリング補完的なRNA読み取りは、シーケンス読み取りアーカイブから読み取ります。 2019; BMC Bioinformatics 、20:558

/docs /論文のvarusに対応するウィリーブルーンの学士論文を見つけます。