นี่คือรหัสสำหรับการฝึกอบรมและการตีความของเครือข่ายประสาทเทียมสำหรับการจำแนกแบบหลายงาน คำแนะนำสำหรับการดาวน์โหลดและเริ่มต้นใช้งานการเปิดตัวปัจจุบันมีอยู่ที่ https://cgs.csail.mit.edu/deepaccess-package/ Deepaccess มีให้บริการผ่าน PIP และ Bioconda โมเดล DeepAccess ที่ได้รับการฝึกฝนเกี่ยวกับข้อมูล ATAC-Seq จาก 10 ชนิดของเซลล์เมาส์มีให้บริการในรูปแบบ Zenodo
ในการเรียกใช้ DeepAccess ด้วยภูมิภาค (รูปแบบเตียง) คุณต้องติดตั้ง bedtools และเพิ่มลงในเส้นทางของคุณ Bedtools Binaries มีให้ที่นี่
หลังจากการติดตั้งคุณสามารถเพิ่ม bedtools ไปยังเส้นทางของคุณผ่านทางเทอร์มินัลหรือแก้ไข ~/.bashrc ของคุณ
export PATH="/path/to/bedtools:$PATH"
DeepAccess มีอยู่ในดัชนีแพ็คเกจ Python (PYPI) และสามารถติดตั้งได้ด้วย PIP:
pip install deepaccess
และผ่าน Bioconda:
conda install -c bioconda deepaccess
เพื่อฝึกอบรมแบบจำลอง Deepaccess สำหรับงานใหม่
usage: deepaccess train [-h] -l LABELS [LABELS ...]
-out OUT [-ref REFFASTA]
[-g GENOME] [-beds BEDFILES [BEDFILES ...]]
[-fa FASTA] [-fasta_labels FASTA_LABELS]
[-f FRAC_RANDOM] [-nepochs NEPOCHS]
[-ho HOLDOUT] [-seed SEED] [-verbose]
optional arguments:
-h, --help show this help message and exit
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-out OUT, --out OUT
-ref REFFASTA, --refFasta REFFASTA
-g GENOME, --genome GENOME
genome chrom.sizes file
-beds BEDFILES [BEDFILES ...], --bedfiles BEDFILES [BEDFILES ...]
-fa FASTA, --fasta FASTA
-fasta_labels FASTA_LABELS, --fasta_labels FASTA_LABELS
-f FRAC_RANDOM, --frac_random FRAC_RANDOM
-nepochs NEPOCHS, --nepochs NEPOCHS
-ho HOLDOUT, --holdout HOLDOUT
chromosome to holdout
-seed SEED, --seed SEED
-verbose, --verbose Print training progress
| การโต้แย้ง | คำอธิบาย | ตัวอย่าง |
|---|---|---|
| -h, -help | แสดงข้อความความช่วยเหลือนี้และออก | นา |
| -l -labels | รายการป้ายกำกับสำหรับแต่ละไฟล์เตียง | C1 C2 C3 |
| -OUT -OUT | ชื่อโฟลเดอร์เอาท์พุท | myOutput |
| -ref -รีด | อ้างอิง fasta; จำเป็นสำหรับการป้อนข้อมูลเตียง | mm10.fa |
| -g -genome | ขนาดโครโมโซมจีโนม จำเป็นสำหรับการป้อนข้อมูลเตียง | ค่าเริ่มต้น/mm10.chrom.sizes |
| -เตียง -เตียง | รายการไฟล์เตียง; จำเป็นต้องมีหนึ่งในเตียงหรือ FA อินพุต | C1.Bed C2.Bed C3.Bed |
| -fa - -fasta | ไฟล์ fasta; จำเป็นต้องมีหนึ่งในเตียงหรือ FA อินพุต | c1c2c3.fa |
| -fasta_labels -fasta_labels | ไฟล์ข้อความที่มีแท็บคั่นป้ายกำกับ (0 หรือ 1) สำหรับแต่ละบรรทัด FASTA ที่มีหนึ่งคอลัมน์สำหรับแต่ละคลาส | c1c2c3.txt |
| -f -frac_random | สำหรับการป้อนข้อมูลไฟล์เตียงของภูมิภาค outgroup แบบสุ่มเพื่อเพิ่มลงในการฝึกอบรม | 0.1 |
| -Nepochs -Nepochs | จำนวนการทำซ้ำการฝึกอบรม | 1 |
| -ho - -holdout | ชื่อโครโมโซมที่จะระงับ (เฉพาะกับเตียงนอน) | Chr19 |
| -Verbose -Verbose | ความคืบหน้าการฝึกอบรมและประเมินผล | นา |
| -เมล็ด -เมล็ด | ตั้งค่าเมล็ด tensorflow | 2021 |
เพื่อเรียกใช้การตีความโมเดล Deepaccess
usage: deepaccess interpret [-h] -trainDir TRAINDIR
[-fastas FASTAS [FASTAS ...]]
[-l LABELS [LABELS ...]] [
-c COMPARISONS [COMPARISONS ...]]
[-evalMotifs EVALMOTIFS]
[-evalPatterns EVALPATTERNS]
[-p POSITION] [-saliency]
[-subtract] [-bg BACKGROUND] [-vis]
optional arguments:
-h, --help show this help message and exit
-trainDir TRAINDIR, --trainDir TRAINDIR
-fastas FASTAS [FASTAS ...], --fastas FASTAS [FASTAS ...]
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-c COMPARISONS [COMPARISONS ...], --comparisons COMPARISONS [COMPARISONS ...]
-evalMotifs EVALMOTIFS, --evalMotifs EVALMOTIFS
-evalPatterns EVALPATTERNS, --evalPatterns EVALPATTERNS
-p POSITION, --position POSITION
-saliency, --saliency
-subtract, --subtract
-bg BACKGROUND, --background BACKGROUND
-vis, --makeVis
| การโต้แย้ง | คำอธิบาย | ตัวอย่าง |
|---|---|---|
| -h, -help | แสดงข้อความความช่วยเหลือนี้และออก | นา |
| -traindir -TRAINDIR | ไดเรกทอรีที่มีโมเดล Deepaccess ที่ผ่านการฝึกอบรม | ทดสอบ/ascl1vsctcf |
| -Fastas -Fastas | รายการไฟล์ fasta เพื่อ evaulate | ทดสอบ/ascl1vsctcf/test.fa |
| -l -labels | รายการป้ายกำกับสำหรับแต่ละไฟล์เตียง | C1 C2 C3 |
| -C -การเปรียบเทียบ | รายการการเปรียบเทียบระหว่างฉลากที่แตกต่างกัน | ASCL1VSCTCF ASCL1VSNONE เรียกใช้ EPE ที่แตกต่างระหว่าง ASCL1 และ CTCF และ EPE บน ASCL1; C1, C2VSC3 เรียกใช้ EPE ที่แตกต่างกันสำหรับ (C1 และ C2) กับ C3 |
| -evalmotifs -evalmotifs | ฐานข้อมูล PWM หรือ PCM ของลวดลายลำดับดีเอ็นเอ | ค่าเริ่มต้น/hmv11_mouse.txt |
| -evalpatterns -Evalpatterns | ไฟล์ fasta ที่มีรูปแบบลำดับดีเอ็นเอ | data/ascl1_space.fa |
| -bg - -bg | ไฟล์ fasta มีลำดับพื้นหลัง | ค่าเริ่มต้น/backgrounds.fa |
| -saliency -ความสุภาพ | คำนวณความสำคัญต่อนิวคลีโอไทด์ฐาน | นา |
| -subtract -Subtract | ใช้การลบแทนอัตราส่วนสำหรับ epe / depe | เท็จ |
| -vis -Makevis | ที่จะใช้กับความดีเพื่อให้ได้ผลลัพธ์การแสดงภาพพล็อต | นา |