deepaccess package
version 0.1.2
これは、マルチタスク分類のための畳み込みニューラルネットワークのアンサンブルのトレーニングと解釈のためのコードです。現在のリリースをダウンロードして開始するための手順は、https://cgs.csail.mit.edu/deepaccess-package/で入手できます。 DeepAccessは、PIPとBioCondaから入手できます。 10個のマウス細胞タイプのATAC-seqデータでトレーニングされたDeepAccessモデルは、Zenodoレコードとして入手できます。
領域(bedfile形式)でdeepaccessを実行するには、bedtoolsをインストールしてパスに追加する必要があります。 Bedtoolsバイナリはこちらから入手できます。
インストール後、端末を介してパスにベッドツールを追加したり、〜/.bashrcを変更したりできます。
export PATH="/path/to/bedtools:$PATH"
DeepAccessはPythonパッケージインデックス(PYPI)で入手でき、PIPでインストールできます。
pip install deepaccess
そしてBioconda経由:
conda install -c bioconda deepaccess
新しいタスクのためにディープアクセスモデルをトレーニングする
usage: deepaccess train [-h] -l LABELS [LABELS ...]
-out OUT [-ref REFFASTA]
[-g GENOME] [-beds BEDFILES [BEDFILES ...]]
[-fa FASTA] [-fasta_labels FASTA_LABELS]
[-f FRAC_RANDOM] [-nepochs NEPOCHS]
[-ho HOLDOUT] [-seed SEED] [-verbose]
optional arguments:
-h, --help show this help message and exit
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-out OUT, --out OUT
-ref REFFASTA, --refFasta REFFASTA
-g GENOME, --genome GENOME
genome chrom.sizes file
-beds BEDFILES [BEDFILES ...], --bedfiles BEDFILES [BEDFILES ...]
-fa FASTA, --fasta FASTA
-fasta_labels FASTA_LABELS, --fasta_labels FASTA_LABELS
-f FRAC_RANDOM, --frac_random FRAC_RANDOM
-nepochs NEPOCHS, --nepochs NEPOCHS
-ho HOLDOUT, --holdout HOLDOUT
chromosome to holdout
-seed SEED, --seed SEED
-verbose, --verbose Print training progress
| 口論 | 説明 | 例 |
|---|---|---|
| -H、 - ヘルプ | このヘルプメッセージと出口を表示します | Na |
| -l - ラベル | 各ベッドファイルのラベルのリスト | C1 C2 C3 |
| -out-out | 出力フォルダー名 | myoutput |
| -ref -Ref | 参照Fasta;ベッド入力で必要です | mm10.fa |
| -g -genome | ゲノム染色体サイズ;ベッド入力で必要です | デフォルト/mm10.chrom.sizes |
| - ベッド - ベッドファイル | ベッドファイルのリスト。ベッドまたはFA入力の1つが必要です | C1.BED C2.BED C3.BED |
| -fa-ファスタ | FASTAファイル;ベッドまたはFA入力の1つが必要です | C1C2C3.FA |
| -fasta_labels - fasta_labels | 各クラスに1つの列がある各FASTAラインのタブ区切りラベル(0または1)を含むテキストファイル | C1C2C3.TXT |
| -f - frac_random | ベッドファイルの入力ランダムアウトグループ領域の入力分数トレーニングに追加する | 0.1 |
| -nepochs -nepochs | トレーニングの数 | 1 |
| -ho- holdout | ゆるむ染色体名(ベッド入力のみ) | CHR19 |
| -verbose- verbose | 印刷トレーニングと評価の進捗 | Na |
| -seed -seed | Tensorflowシードを設定します | 2021 |
DeepAccessモデルの解釈を実行します
usage: deepaccess interpret [-h] -trainDir TRAINDIR
[-fastas FASTAS [FASTAS ...]]
[-l LABELS [LABELS ...]] [
-c COMPARISONS [COMPARISONS ...]]
[-evalMotifs EVALMOTIFS]
[-evalPatterns EVALPATTERNS]
[-p POSITION] [-saliency]
[-subtract] [-bg BACKGROUND] [-vis]
optional arguments:
-h, --help show this help message and exit
-trainDir TRAINDIR, --trainDir TRAINDIR
-fastas FASTAS [FASTAS ...], --fastas FASTAS [FASTAS ...]
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-c COMPARISONS [COMPARISONS ...], --comparisons COMPARISONS [COMPARISONS ...]
-evalMotifs EVALMOTIFS, --evalMotifs EVALMOTIFS
-evalPatterns EVALPATTERNS, --evalPatterns EVALPATTERNS
-p POSITION, --position POSITION
-saliency, --saliency
-subtract, --subtract
-bg BACKGROUND, --background BACKGROUND
-vis, --makeVis
| 口論 | 説明 | 例 |
|---|---|---|
| -H、 - ヘルプ | このヘルプメッセージと出口を表示します | Na |
| -TRAINDIR -TRAINDIR | トレーニングされたディープアクセスモデルを含むディレクトリ | test/ascl1vsctcf |
| -fastas -fastas | EvaulateへのFastaファイルのリスト | test/ascl1vsctcf/test.fa |
| -l - ラベル | 各ベッドファイルのラベルのリスト | C1 C2 C3 |
| -C - コンパリソン | 異なるラベル間の比較のリスト | ASCL1VSCTCF ASCL1VSNONEは、ASCL1とASCL1でASCL1とCTCFとEPEの間で微分EPEを実行します。 C1、C2VSC3は(C1およびC2)対C3の差動EPEを実行します |
| -evalMotifs -EvalMotifs | DNA配列モチーフのPWMまたはPCMデータベース | デフォルト/hmv11_mouse.txt |
| -evalpatterns -evalpatterns | DNA配列パターンを含むFASTAファイル | data/ascl1_space.fa |
| -bg -bg | FASTAファイルには背景シーケンスが含まれています | default/backgrounds.fa |
| -Saliency -Saliency | 基本ヌクレオチドの重要性を計算します | Na |
| -Subtract - subtract | EPE / DEPEの比率ではなく減算を使用します | 間違い |
| -vis - makevis | 顕著性とともに使用して、プロットを視覚化する結果を出す | Na |