Dies ist der Kodex für die Ausbildung und Interpretation eines Ensemble von Faltungsnetzwerken für die Klassifizierung von Multitasking. Anweisungen zum Herunterladen und Ersten von der aktuellen Version finden Sie unter https://cgs.csail.mit.edu/deepaccess-package/. Deepaccess ist über PIP und Bioconda erhältlich. Das auf ATAC-Seq-Daten aus 10 Mauszelltypen ausgebildete Deepaccess-Modell ist als Zenodo-Datensatz verfügbar.
Um Deep Access mit Regionen (Bettdatei -Format) zu betreiben, müssen Sie Bedtools installieren und Ihrem Weg hinzufügen. Binärdateien Bedtools sind hier erhältlich.
Nach der Installation können Sie über das Terminal Bedtools zu Ihrem Weg hinzufügen oder Ihre ~/.bashrc ändern
export PATH="/path/to/bedtools:$PATH"
Deepaccess ist im Python Package Index (PYPI) erhältlich und kann mit PIP installiert werden:
pip install deepaccess
und über Bioconda:
conda install -c bioconda deepaccess
Ein Deepaccess -Modell für eine neue Aufgabe zu trainieren
usage: deepaccess train [-h] -l LABELS [LABELS ...]
-out OUT [-ref REFFASTA]
[-g GENOME] [-beds BEDFILES [BEDFILES ...]]
[-fa FASTA] [-fasta_labels FASTA_LABELS]
[-f FRAC_RANDOM] [-nepochs NEPOCHS]
[-ho HOLDOUT] [-seed SEED] [-verbose]
optional arguments:
-h, --help show this help message and exit
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-out OUT, --out OUT
-ref REFFASTA, --refFasta REFFASTA
-g GENOME, --genome GENOME
genome chrom.sizes file
-beds BEDFILES [BEDFILES ...], --bedfiles BEDFILES [BEDFILES ...]
-fa FASTA, --fasta FASTA
-fasta_labels FASTA_LABELS, --fasta_labels FASTA_LABELS
-f FRAC_RANDOM, --frac_random FRAC_RANDOM
-nepochs NEPOCHS, --nepochs NEPOCHS
-ho HOLDOUT, --holdout HOLDOUT
chromosome to holdout
-seed SEED, --seed SEED
-verbose, --verbose Print training progress
| Argument | Beschreibung | Beispiel |
|---|---|---|
| -h, -Help | Zeigen Sie diese Hilfebotschaft an und beenden Sie | N / A |
| -l -Labels | Liste der Etiketten für jede Bettdatei | C1 C2 C3 |
| -Out -Out | Ausgabeordnername | Mein Ausgang |
| -REF -REF | Referenz Fasta; Bedarf mit Betteingang | mm10.fa |
| -g -genom | Genomchromosomengrößen; Bedarf mit Betteingang | Standard/mm10.chrom.gizes |
| -Beds -Bettdateien | Liste der Bettdateien; Eines von Betten oder FA -Eingaben erforderlich | C1.bed C2.bed C3.bed |
| -fa -fasta | Fasta -Datei; Eines von Betten oder FA -Eingaben erforderlich | C1C2C3.fa |
| -Fasta_Labels -fasta_labels | Textdatei mit der Registerkarte "Registerkarte | C1C2C3.txt |
| -f ---FRAC_RANDOM | Für die Eingabe der Bettdatei in zufälligen Outgroup -Regionen zum Training hinzufügen | 0,1 |
| -Nepochs --Nepochs | Anzahl der Trainings -Iterationen | 1 |
| -Ho -Halte | Chromosomenname, um auszuhalten (nur mit Betteingang) | CHR19 |
| -Verbose --verbose | Drucktraining und Bewertung Fortschritt | N / A |
| -seed -seed | Tensorflow -Samen einstellen | 2021 |
Interpretation eines Deepaccess -Modells durchführen
usage: deepaccess interpret [-h] -trainDir TRAINDIR
[-fastas FASTAS [FASTAS ...]]
[-l LABELS [LABELS ...]] [
-c COMPARISONS [COMPARISONS ...]]
[-evalMotifs EVALMOTIFS]
[-evalPatterns EVALPATTERNS]
[-p POSITION] [-saliency]
[-subtract] [-bg BACKGROUND] [-vis]
optional arguments:
-h, --help show this help message and exit
-trainDir TRAINDIR, --trainDir TRAINDIR
-fastas FASTAS [FASTAS ...], --fastas FASTAS [FASTAS ...]
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-c COMPARISONS [COMPARISONS ...], --comparisons COMPARISONS [COMPARISONS ...]
-evalMotifs EVALMOTIFS, --evalMotifs EVALMOTIFS
-evalPatterns EVALPATTERNS, --evalPatterns EVALPATTERNS
-p POSITION, --position POSITION
-saliency, --saliency
-subtract, --subtract
-bg BACKGROUND, --background BACKGROUND
-vis, --makeVis
| Argument | Beschreibung | Beispiel |
|---|---|---|
| -h, -Help | Zeigen Sie diese Hilfebotschaft an und beenden Sie | N / A |
| -Trainedir --TrainDir | Verzeichnis mit geschultes Deepaccess -Modell | Test/ASCL1VSCTCF |
| -Fastas -Fastas | Liste der Fasta -Dateien, um zu evaulieren | Test/ASCL1VSCTCF/Test.fa |
| -l -Labels | Liste der Etiketten für jede Bettdatei | C1 C2 C3 |
| -c -Vergleiche | Liste der Vergleiche zwischen verschiedenen Etiketten | ASCL1VSCTCF ASCL1VSNONE läuft differentielles EPE zwischen ASCL1 und CTCF und EPE auf ASCL1; C1, C2VSC3 läuft differentielles EPE für (C1 und C2) gegen C3 |
| -Evalmotifs -Evalmotifs | PWM- oder PCM -Datenbank von DNA -Sequenzmotiven | Standard/hmv11_mouse.txt |
| -Valpatterns -Evalpatterns | Fasta -Datei mit DNA -Sequenzmustern enthält | Data/Ascl1_space.fa |
| -bg - -bg | Fasta -Datei enthält Hintergrundsequenzen | Standard/Hintergrund.fa |
| -Salzenz -Salz | Berechnen Sie die Bedeutung der Nukleotid -Bedeutung der Basis | N / A |
| -Subract -Subtract | Verwenden Sie die Subtraktion anstelle des Verhältnisses für EPE / DEPE | FALSCH |
| -vis -Makevis | mit Ausmaß verwendet werden, um die Ergebnisse der Plot -Visualisierung zu erzielen | N / A |