Это кодекс для обучения и интерпретации ансамбля сверточных нейронных сетей для классификации с несколькими задачами. Инструкции для загрузки и начала работы с текущим релизом доступны по адресу https://cgs.csail.mit.edu/deepaccess-package/. Deepaccess доступен через PIP и BioConda. Модель Deepaccess, обученная данным ATAC-Seq от 10 типов мышей мыши, доступна в виде записи Zenodo.
Чтобы запустить Deepaccess с регионами (формат кровати), вы должны установить Bedtools и добавить его на свой путь. Двоирные файлы Bedtools доступны здесь.
После установки вы можете добавить кровае в свой путь через терминал или изменить ~/.bashrc
export PATH="/path/to/bedtools:$PATH"
Deepaccess доступен в индексе пакетов Python (PYPI) и может быть установлен с помощью PIP:
pip install deepaccess
и через Bioconda:
conda install -c bioconda deepaccess
Для обучения модели Deepaccess для новой задачи
usage: deepaccess train [-h] -l LABELS [LABELS ...]
-out OUT [-ref REFFASTA]
[-g GENOME] [-beds BEDFILES [BEDFILES ...]]
[-fa FASTA] [-fasta_labels FASTA_LABELS]
[-f FRAC_RANDOM] [-nepochs NEPOCHS]
[-ho HOLDOUT] [-seed SEED] [-verbose]
optional arguments:
-h, --help show this help message and exit
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-out OUT, --out OUT
-ref REFFASTA, --refFasta REFFASTA
-g GENOME, --genome GENOME
genome chrom.sizes file
-beds BEDFILES [BEDFILES ...], --bedfiles BEDFILES [BEDFILES ...]
-fa FASTA, --fasta FASTA
-fasta_labels FASTA_LABELS, --fasta_labels FASTA_LABELS
-f FRAC_RANDOM, --frac_random FRAC_RANDOM
-nepochs NEPOCHS, --nepochs NEPOCHS
-ho HOLDOUT, --holdout HOLDOUT
chromosome to holdout
-seed SEED, --seed SEED
-verbose, --verbose Print training progress
| Аргумент | Описание | Пример |
|---|---|---|
| -h, -help | Показать это сообщение справки и выход | НА |
| -l -Лейки | Список меток для каждого файла кровати | C1 C2 C3 |
| -out -out | Имя вывода папки | Myoutput |
| -Ref -ref | ссылка Fasta; Требуется при вводе кровати | MM10.FA |
| -g -Геном | размеры генома хромосом; Требуется при вводе кровати | по умолчанию/mm10.chrom.sizes |
| -Веды -Клетильники | Список файлов кроватей; Требуется одна из кроватей или ввода FA | C1.bed c2.bed c3.bed |
| -fa -Фаста | Файл FASTA; Требуется одна из кроватей или ввода FA | C1C2C3.FA |
| -fasta_labels -fasta_labels | Текстовый файл, содержащий вкладку, делимированные этикетки (0 или 1) для каждой строки Fasta с одним столбцом для каждого класса | C1C2C3.txt |
| -f -frac_random | Для ввода файла кровать входной доли случайных регионов внешней группы для добавления к обучению | 0,1 |
| -nepochs -неэпоч | Количество итераций обучения | 1 |
| -ho -holdout | Название хромосомы для удержания (только при вводе кровати) | Chr19 |
| -Вербоз --вербоз | Печать обучения и прогресса оценки | НА |
| -Сед -семя | Установите семян тензора | 2021 |
Чтобы запустить интерпретацию модели Deepaccess
usage: deepaccess interpret [-h] -trainDir TRAINDIR
[-fastas FASTAS [FASTAS ...]]
[-l LABELS [LABELS ...]] [
-c COMPARISONS [COMPARISONS ...]]
[-evalMotifs EVALMOTIFS]
[-evalPatterns EVALPATTERNS]
[-p POSITION] [-saliency]
[-subtract] [-bg BACKGROUND] [-vis]
optional arguments:
-h, --help show this help message and exit
-trainDir TRAINDIR, --trainDir TRAINDIR
-fastas FASTAS [FASTAS ...], --fastas FASTAS [FASTAS ...]
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-c COMPARISONS [COMPARISONS ...], --comparisons COMPARISONS [COMPARISONS ...]
-evalMotifs EVALMOTIFS, --evalMotifs EVALMOTIFS
-evalPatterns EVALPATTERNS, --evalPatterns EVALPATTERNS
-p POSITION, --position POSITION
-saliency, --saliency
-subtract, --subtract
-bg BACKGROUND, --background BACKGROUND
-vis, --makeVis
| Аргумент | Описание | Пример |
|---|---|---|
| -h, -help | Показать это сообщение справки и выход | НА |
| -traindir -traindir | каталог, содержащий обученную модель Deepaccess | тест/ascl1vsctcf |
| -fastas - -Фастас | Список файлов FASTA в Evaulate | тест/ascl1vsctcf/test.fa |
| -l -Лейки | Список меток для каждого файла кровати | C1 C2 C3 |
| -c -Компаризоны | Список сравнений между разными этикетками | ASCL1VSCTCF ASCL1VSNONE запускает дифференциальный EPE между ASCL1 и CTCF и EPE на ASCL1; C1, C2VSC3 запускает дифференциальный EPE для (C1 и C2) против C3 |
| -Вальмотифы -Evalmotifs | База данных SWM или PCM мотивов последовательности ДНК | по умолчанию/hmv11_mouse.txt |
| -Валпаттернс -evalpatterns | Файл FASTA, содержащий шаблоны последовательности ДНК | data/ascl1_space.fa |
| -bg - -бг | Файл, содержащий фоновые последовательности FASTA | по умолчанию/founals.fa |
| -Саральности -высокая оценка | Рассчитать значение нуклеотида на основе | НА |
| -Subtract - -субтракт | Используйте вычитание вместо отношения для EPE / DEPE | ЛОЖЬ |
| -Вис -Макевис | использоваться с значительностью, чтобы сделать график визуализации результатов | НА |