Ini adalah kode untuk pelatihan dan interpretasi ansambel jaringan saraf konvolusional untuk klasifikasi multi-tugas. Instruksi untuk mengunduh dan memulai rilis saat ini tersedia di https://cgs.csail.mit.edu/deepaccess-package/. DeepAccess tersedia melalui PIP dan Bioconda. Model DeepAccess yang dilatih pada data ATAC-seq dari 10 jenis sel mouse tersedia sebagai catatan Zenodo.
Untuk menjalankan DeepAccess dengan daerah (format bedfile) Anda harus memasang bedtools dan menambahkannya ke jalur Anda. Binari Bedtools tersedia di sini.
Setelah instalasi, Anda dapat menambahkan bedtools ke jalur Anda melalui terminal atau memodifikasi ~/.bashrc Anda
export PATH="/path/to/bedtools:$PATH"
DeepAccess tersedia di Python Package Index (PYPI) dan dapat diinstal dengan PIP:
pip install deepaccess
dan melalui Bioconda:
conda install -c bioconda deepaccess
Untuk melatih model deepaccess untuk tugas baru
usage: deepaccess train [-h] -l LABELS [LABELS ...]
-out OUT [-ref REFFASTA]
[-g GENOME] [-beds BEDFILES [BEDFILES ...]]
[-fa FASTA] [-fasta_labels FASTA_LABELS]
[-f FRAC_RANDOM] [-nepochs NEPOCHS]
[-ho HOLDOUT] [-seed SEED] [-verbose]
optional arguments:
-h, --help show this help message and exit
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-out OUT, --out OUT
-ref REFFASTA, --refFasta REFFASTA
-g GENOME, --genome GENOME
genome chrom.sizes file
-beds BEDFILES [BEDFILES ...], --bedfiles BEDFILES [BEDFILES ...]
-fa FASTA, --fasta FASTA
-fasta_labels FASTA_LABELS, --fasta_labels FASTA_LABELS
-f FRAC_RANDOM, --frac_random FRAC_RANDOM
-nepochs NEPOCHS, --nepochs NEPOCHS
-ho HOLDOUT, --holdout HOLDOUT
chromosome to holdout
-seed SEED, --seed SEED
-verbose, --verbose Print training progress
| Argumen | Keterangan | Contoh |
|---|---|---|
| -H, --help | Tunjukkan pesan bantuan ini dan keluar | Na |
| -l -label | Daftar label untuk setiap file tempat tidur | C1 C2 C3 |
| -out - -out | nama folder output | MyOutput |
| -ref --ref | Referensi FASTA; Diperlukan dengan input tempat tidur | mm10.fa |
| -g --genome | Ukuran kromosom genom; Diperlukan dengan input tempat tidur | default/mm10.chrom.sizes |
| -beds --filfiles | daftar file tempat tidur; Salah satu input tempat tidur atau FA diperlukan | C1.bed c2.bed c3.bed |
| -fa ---fasta | file fasta; Salah satu input tempat tidur atau FA diperlukan | C1c2c3.fa |
| -fasta_labels ---fasta_labels | File Teks yang berisi tab Label Delimited (0 atau 1) untuk setiap baris FASTA dengan satu kolom untuk setiap kelas | C1c2c3.txt |
| -f --frac_random | Untuk fraksi input file bed dari daerah outgroup acak untuk ditambahkan ke pelatihan | 0.1 |
| -nepochs --nepochs | jumlah iterasi pelatihan | 1 |
| -ho --Holdout | Nama kromosom untuk ditahan (hanya dengan input bed) | Chr19 |
| -Verbose --verbose | Pelatihan Cetak dan Kemajuan Evaluasi | Na |
| -Sam -eted | Atur benih TensorFlow | 2021 |
Untuk menjalankan interpretasi model deepaccess
usage: deepaccess interpret [-h] -trainDir TRAINDIR
[-fastas FASTAS [FASTAS ...]]
[-l LABELS [LABELS ...]] [
-c COMPARISONS [COMPARISONS ...]]
[-evalMotifs EVALMOTIFS]
[-evalPatterns EVALPATTERNS]
[-p POSITION] [-saliency]
[-subtract] [-bg BACKGROUND] [-vis]
optional arguments:
-h, --help show this help message and exit
-trainDir TRAINDIR, --trainDir TRAINDIR
-fastas FASTAS [FASTAS ...], --fastas FASTAS [FASTAS ...]
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-c COMPARISONS [COMPARISONS ...], --comparisons COMPARISONS [COMPARISONS ...]
-evalMotifs EVALMOTIFS, --evalMotifs EVALMOTIFS
-evalPatterns EVALPATTERNS, --evalPatterns EVALPATTERNS
-p POSITION, --position POSITION
-saliency, --saliency
-subtract, --subtract
-bg BACKGROUND, --background BACKGROUND
-vis, --makeVis
| Argumen | Keterangan | Contoh |
|---|---|---|
| -H, --help | Tunjukkan pesan bantuan ini dan keluar | Na |
| -traindir --traindir | Direktori yang mengandung model DeepAccess terlatih | tes/ascl1vsctcf |
| -fastas -fastas | Daftar file FASTA untuk Evaulate | tes/ascl1vsctcf/test.fa |
| -l -label | Daftar label untuk setiap file tempat tidur | C1 C2 C3 |
| -c -Comparisons | daftar perbandingan antara label yang berbeda | ASCL1VSCTCF ASCL1VSNONE menjalankan EPE diferensial antara ASCL1 dan CTCF dan EPE pada ASCL1; C1, C2VSC3 menjalankan EPE diferensial untuk (C1 dan C2) vs C3 |
| -evalmotifs --evalmotifs | Basis data PWM atau PCM dari motif urutan DNA | default/hmv11_mouse.txt |
| -evalpatterns --evalpatterns | File FASTA yang berisi pola urutan DNA | data/ascl1_space.fa |
| -bg --bg | File fasta berisi urutan latar belakang | default/latar belakang.fa |
| -Saliensi --Saliensi | Hitung kepentingan nukleotida basa | Na |
| -subtract --subtract | Gunakan pengurangan alih -alih rasio untuk EPE / DEPE | PALSU |
| -vis --bakevis | untuk digunakan dengan arti -penting untuk membuat plot memvisualisasikan hasil | Na |