deepaccess package
version 0.1.2
這是培訓和解釋卷積神經網絡集合進行多任務分類的代碼。可在https://cgs.csail.mit.mit.edu/deepaccess-package/上找到下載和入門的說明。可通過PIP和Bioconda獲得DeepAccess。從10種鼠標細胞類型的ATAC-SEQ數據訓練的DeepAccess模型可作為Zenodo記錄獲得。
要使用區域(床單格式)進行深入安裝,您必須安裝床單並將其添加到路徑中。 Bedtools二進製文件可在這裡提供。
安裝後,您可以通過終端添加床單或修改〜/.bashrc
export PATH="/path/to/bedtools:$PATH"
DeepAccess在Python軟件包索引(PYPI)上可用,可以與PIP安裝:
pip install deepaccess
並通過Bioconda:
conda install -c bioconda deepaccess
培訓一個深入的模型來完成一項新任務
usage: deepaccess train [-h] -l LABELS [LABELS ...]
-out OUT [-ref REFFASTA]
[-g GENOME] [-beds BEDFILES [BEDFILES ...]]
[-fa FASTA] [-fasta_labels FASTA_LABELS]
[-f FRAC_RANDOM] [-nepochs NEPOCHS]
[-ho HOLDOUT] [-seed SEED] [-verbose]
optional arguments:
-h, --help show this help message and exit
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-out OUT, --out OUT
-ref REFFASTA, --refFasta REFFASTA
-g GENOME, --genome GENOME
genome chrom.sizes file
-beds BEDFILES [BEDFILES ...], --bedfiles BEDFILES [BEDFILES ...]
-fa FASTA, --fasta FASTA
-fasta_labels FASTA_LABELS, --fasta_labels FASTA_LABELS
-f FRAC_RANDOM, --frac_random FRAC_RANDOM
-nepochs NEPOCHS, --nepochs NEPOCHS
-ho HOLDOUT, --holdout HOLDOUT
chromosome to holdout
-seed SEED, --seed SEED
-verbose, --verbose Print training progress
| 爭論 | 描述 | 例子 |
|---|---|---|
| -h, - 螺旋 | 顯示此幫助消息和退出 | na |
| -L-標籤 | 每個床文件的標籤列表 | C1 C2 C3 |
| - out-出局 | 輸出文件夾名稱 | MyOutput |
| -ref -ref | 參考fasta;床輸入要求 | MM10.FA |
| -g-基因組 | 基因組染色體大小;床輸入要求 | 默認/mm10.chrom.sizes |
| - 床 - 床 | 床文件列表;所需的床或FA輸入之一 | c1.bed c2.bed c3.bed |
| -fa- -fasta | fasta文件;所需的床或FA輸入之一 | c1c2c3.fa |
| -fasta_labels -fasta_labels | 每個fasta行的文本文件包含標籤(0或1),每個類別都有一個列 | c1c2c3.txt |
| -f -frac_random | 對於隨機外群區域的床文件輸入分數,以添加到培訓中 | 0.1 |
| -Nepochs- nepochs | 訓練迭代次數 | 1 |
| - ho-養蜂 | 染色體名稱要保留(僅帶有床輸入) | CHR19 |
| -verbose- verbose | 打印培訓和評估進度 | na |
| - 種子 - 種子 | 設置張量子種子 | 2021 |
運行對DeepAccess模型的解釋
usage: deepaccess interpret [-h] -trainDir TRAINDIR
[-fastas FASTAS [FASTAS ...]]
[-l LABELS [LABELS ...]] [
-c COMPARISONS [COMPARISONS ...]]
[-evalMotifs EVALMOTIFS]
[-evalPatterns EVALPATTERNS]
[-p POSITION] [-saliency]
[-subtract] [-bg BACKGROUND] [-vis]
optional arguments:
-h, --help show this help message and exit
-trainDir TRAINDIR, --trainDir TRAINDIR
-fastas FASTAS [FASTAS ...], --fastas FASTAS [FASTAS ...]
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-c COMPARISONS [COMPARISONS ...], --comparisons COMPARISONS [COMPARISONS ...]
-evalMotifs EVALMOTIFS, --evalMotifs EVALMOTIFS
-evalPatterns EVALPATTERNS, --evalPatterns EVALPATTERNS
-p POSITION, --position POSITION
-saliency, --saliency
-subtract, --subtract
-bg BACKGROUND, --background BACKGROUND
-vis, --makeVis
| 爭論 | 描述 | 例子 |
|---|---|---|
| -h, - 螺旋 | 顯示此幫助消息和退出 | na |
| -traindir -traindir | 包含訓練有素的深度訪問模型的目錄 | 測試/ASCL1VSCTCF |
| -fastas- -fastas | fasta文件列表 | test/ascl1vsctcf/test.fa |
| -L-標籤 | 每個床文件的標籤列表 | C1 C2 C3 |
| -c -comparisons | 不同標籤之間的比較列表 | ASCL1VSCTCF ASCL1VSNONE在ASCL1上的ASCL1和CTCF和EPE之間運行差異EPE; C1,C2VSC3運行(C1和C2)與C3的差分EPE |
| -evalmotifs -evalmotifs | DNA序列基序的PWM或PCM數據庫 | 默認/hmv11_mouse.txt |
| -evalpatterns- evalpatterns | 包含DNA序列模式的FASTA文件 | 數據/ascl1_space.fa |
| -bg -bg | Fasta文件包裝背景序列 | 默認/背景 |
| - 達到效率 - 達到效率 | 計算每個核苷酸的重要性 | na |
| - 提取 - 提取 | 使用減法而不是epe / depe的比率 | 錯誤的 |
| -VIS - 媽媽 | 用顯著性用來使情節可視化結果 | na |