deepaccess package
version 0.1.2
这是培训和解释卷积神经网络集合进行多任务分类的代码。可在https://cgs.csail.mit.mit.edu/deepaccess-package/上找到下载和入门的说明。可通过PIP和Bioconda获得DeepAccess。从10种鼠标细胞类型的ATAC-SEQ数据训练的DeepAccess模型可作为Zenodo记录获得。
要使用区域(床单格式)进行深入安装,您必须安装床单并将其添加到路径中。 Bedtools二进制文件可在这里提供。
安装后,您可以通过终端添加床单或修改〜/.bashrc
export PATH="/path/to/bedtools:$PATH"
DeepAccess在Python软件包索引(PYPI)上可用,可以与PIP安装:
pip install deepaccess
并通过Bioconda:
conda install -c bioconda deepaccess
培训一个深入的模型来完成一项新任务
usage: deepaccess train [-h] -l LABELS [LABELS ...]
-out OUT [-ref REFFASTA]
[-g GENOME] [-beds BEDFILES [BEDFILES ...]]
[-fa FASTA] [-fasta_labels FASTA_LABELS]
[-f FRAC_RANDOM] [-nepochs NEPOCHS]
[-ho HOLDOUT] [-seed SEED] [-verbose]
optional arguments:
-h, --help show this help message and exit
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-out OUT, --out OUT
-ref REFFASTA, --refFasta REFFASTA
-g GENOME, --genome GENOME
genome chrom.sizes file
-beds BEDFILES [BEDFILES ...], --bedfiles BEDFILES [BEDFILES ...]
-fa FASTA, --fasta FASTA
-fasta_labels FASTA_LABELS, --fasta_labels FASTA_LABELS
-f FRAC_RANDOM, --frac_random FRAC_RANDOM
-nepochs NEPOCHS, --nepochs NEPOCHS
-ho HOLDOUT, --holdout HOLDOUT
chromosome to holdout
-seed SEED, --seed SEED
-verbose, --verbose Print training progress
| 争论 | 描述 | 例子 |
|---|---|---|
| -h, - 螺旋 | 显示此帮助消息和退出 | na |
| -L-标签 | 每个床文件的标签列表 | C1 C2 C3 |
| - out-出局 | 输出文件夹名称 | MyOutput |
| -ref -ref | 参考fasta;床输入要求 | MM10.FA |
| -g-基因组 | 基因组染色体大小;床输入要求 | 默认/mm10.chrom.sizes |
| - 床 - 床 | 床文件列表;所需的床或FA输入之一 | c1.bed c2.bed c3.bed |
| -fa- -fasta | fasta文件;所需的床或FA输入之一 | c1c2c3.fa |
| -fasta_labels -fasta_labels | 每个fasta行的文本文件包含标签(0或1),每个类别都有一个列 | c1c2c3.txt |
| -f -frac_random | 对于随机外群区域的床文件输入分数,以添加到培训中 | 0.1 |
| -Nepochs- nepochs | 训练迭代次数 | 1 |
| - ho-养蜂 | 染色体名称要保留(仅带有床输入) | CHR19 |
| -verbose- verbose | 打印培训和评估进度 | na |
| - 种子 - 种子 | 设置张量子种子 | 2021 |
运行对DeepAccess模型的解释
usage: deepaccess interpret [-h] -trainDir TRAINDIR
[-fastas FASTAS [FASTAS ...]]
[-l LABELS [LABELS ...]] [
-c COMPARISONS [COMPARISONS ...]]
[-evalMotifs EVALMOTIFS]
[-evalPatterns EVALPATTERNS]
[-p POSITION] [-saliency]
[-subtract] [-bg BACKGROUND] [-vis]
optional arguments:
-h, --help show this help message and exit
-trainDir TRAINDIR, --trainDir TRAINDIR
-fastas FASTAS [FASTAS ...], --fastas FASTAS [FASTAS ...]
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-c COMPARISONS [COMPARISONS ...], --comparisons COMPARISONS [COMPARISONS ...]
-evalMotifs EVALMOTIFS, --evalMotifs EVALMOTIFS
-evalPatterns EVALPATTERNS, --evalPatterns EVALPATTERNS
-p POSITION, --position POSITION
-saliency, --saliency
-subtract, --subtract
-bg BACKGROUND, --background BACKGROUND
-vis, --makeVis
| 争论 | 描述 | 例子 |
|---|---|---|
| -h, - 螺旋 | 显示此帮助消息和退出 | na |
| -traindir -traindir | 包含训练有素的深度访问模型的目录 | 测试/ASCL1VSCTCF |
| -fastas- -fastas | fasta文件列表 | test/ascl1vsctcf/test.fa |
| -L-标签 | 每个床文件的标签列表 | C1 C2 C3 |
| -c -comparisons | 不同标签之间的比较列表 | ASCL1VSCTCF ASCL1VSNONE在ASCL1上的ASCL1和CTCF和EPE之间运行差异EPE; C1,C2VSC3运行(C1和C2)与C3的差分EPE |
| -evalmotifs -evalmotifs | DNA序列基序的PWM或PCM数据库 | 默认/hmv11_mouse.txt |
| -evalpatterns- evalpatterns | 包含DNA序列模式的FASTA文件 | 数据/ascl1_space.fa |
| -bg -bg | Fasta文件包装背景序列 | 默认/背景 |
| - 达到效率 - 达到效率 | 计算每个核苷酸的重要性 | na |
| - 提取 - 提取 | 使用减法而不是epe / depe的比率 | 错误的 |
| -VIS - 妈妈 | 用显着性用来使情节可视化结果 | na |