Il s'agit du code de formation et d'interprétation d'un ensemble de réseaux de neurones convolutionnels pour la classification multi-tâches. Les instructions de téléchargement et de démarrage avec la version actuelle sont disponibles sur https://cgs.csail.mit.edu/deepaccess-package/. DeepAccess est disponible via PIP et Bioconda. Le modèle DeepAccess formé sur les données ATAC-SEQ à partir de 10 types de cellules de souris est disponible en tant que enregistrement Zenodo.
Pour exécuter DeepAccess avec les régions (format de débit de lit), vous devez installer BedTools et l'ajouter à votre chemin. Les binaires BedTools sont disponibles ici.
Après l'installation, vous pouvez ajouter BedTools à votre chemin via le terminal ou modifier votre ~ / .bashrc
export PATH="/path/to/bedtools:$PATH"
DeepAccess est disponible sur l'index Python Package (PYPI) et peut être installé avec PIP:
pip install deepaccess
Et via Bioconda:
conda install -c bioconda deepaccess
Pour former un modèle DeepAccess pour une nouvelle tâche
usage: deepaccess train [-h] -l LABELS [LABELS ...]
-out OUT [-ref REFFASTA]
[-g GENOME] [-beds BEDFILES [BEDFILES ...]]
[-fa FASTA] [-fasta_labels FASTA_LABELS]
[-f FRAC_RANDOM] [-nepochs NEPOCHS]
[-ho HOLDOUT] [-seed SEED] [-verbose]
optional arguments:
-h, --help show this help message and exit
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-out OUT, --out OUT
-ref REFFASTA, --refFasta REFFASTA
-g GENOME, --genome GENOME
genome chrom.sizes file
-beds BEDFILES [BEDFILES ...], --bedfiles BEDFILES [BEDFILES ...]
-fa FASTA, --fasta FASTA
-fasta_labels FASTA_LABELS, --fasta_labels FASTA_LABELS
-f FRAC_RANDOM, --frac_random FRAC_RANDOM
-nepochs NEPOCHS, --nepochs NEPOCHS
-ho HOLDOUT, --holdout HOLDOUT
chromosome to holdout
-seed SEED, --seed SEED
-verbose, --verbose Print training progress
| Argument | Description | Exemple |
|---|---|---|
| -H, - help | afficher ce message d'aide et quitter | N / A |
| -l - étiquettes | Liste des étiquettes pour chaque fichier de lit | C1 C2 C3 |
| -out --out | Nom du dossier de sortie | MyOutput |
| -ref --ref | référence fasta; requis avec entrée de lit | mm10.fa |
| -g - Genome | tailles de chromosome du génome; requis avec entrée de lit | par défaut / mm10.chrom.Size |
| -Bédages - | liste des fichiers de lit; L'un des lits ou l'entrée FA requis | C1.Bed C2.Bed C3.bed |
| -fa --fasta | fichier fasta; L'un des lits ou l'entrée FA requis | C1c2c3.fa |
| -fasta_labels --fasta_labels | Fichier texte contenant des étiquettes délimitées à l'onglet (0 ou 1) pour chaque ligne Fasta avec une colonne pour chaque classe | C1c2c3.txt |
| -f --frac_random | Pour la fraction d'entrée de fichier de lit des régions de groupe extérieur aléatoires à ajouter à la formation | 0.1 |
| -Népochs -nepochs | nombre d'itérations de formation | 1 |
| -Ho - Holdout | Nom du chromosome à tenir (uniquement avec entrée de lit) | CHR19 |
| -Verbose --verbose | Progrès de la formation et de l'évaluation imprimées | N / A |
| -seed --seed | Définir les semences de TensorFlow | 2021 |
Pour gérer l'interprétation d'un modèle de profondeur
usage: deepaccess interpret [-h] -trainDir TRAINDIR
[-fastas FASTAS [FASTAS ...]]
[-l LABELS [LABELS ...]] [
-c COMPARISONS [COMPARISONS ...]]
[-evalMotifs EVALMOTIFS]
[-evalPatterns EVALPATTERNS]
[-p POSITION] [-saliency]
[-subtract] [-bg BACKGROUND] [-vis]
optional arguments:
-h, --help show this help message and exit
-trainDir TRAINDIR, --trainDir TRAINDIR
-fastas FASTAS [FASTAS ...], --fastas FASTAS [FASTAS ...]
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-c COMPARISONS [COMPARISONS ...], --comparisons COMPARISONS [COMPARISONS ...]
-evalMotifs EVALMOTIFS, --evalMotifs EVALMOTIFS
-evalPatterns EVALPATTERNS, --evalPatterns EVALPATTERNS
-p POSITION, --position POSITION
-saliency, --saliency
-subtract, --subtract
-bg BACKGROUND, --background BACKGROUND
-vis, --makeVis
| Argument | Description | Exemple |
|---|---|---|
| -H, - help | afficher ce message d'aide et quitter | N / A |
| -Traindir --Traindir | Répertoire contenant un modèle de profondeur formé | test / ascl1vsctcf |
| -fastas - fastas | Liste des fichiers fasta pour évaurer | test / ascl1vsctcf / test.fa |
| -l - étiquettes | Liste des étiquettes pour chaque fichier de lit | C1 C2 C3 |
| -C - Comparisons | Liste des comparaisons entre les différentes étiquettes | ASCL1VSCTCF ASCL1VSnone exécute EPE différentielle entre ASCL1 et CTCF et EPE sur ASCL1; C1, C2VSC3 exécute EPE différentielle pour (C1 et C2) vs C3 |
| -evalmotifs --evalmotifs | PWM ou PCM Base de motifs de séquence d'ADN | par défaut / hmv11_mouse.txt |
| -EvalPatterns - EvalPatterns | Fasta File contenant des modèles de séquence d'ADN | data / ascl1_space.fa |
| -bg --bg | le fichier fasta contenant des séquences d'arrière-plan | par défaut / backgrounds.fa |
| -AssAMNICY - SAFFICITÉ | Calculer l'importance nucléotidique de base | N / A |
| -Sougraire - soustrait | Utiliser la soustraction au lieu du rapport pour EPE / DEP | FAUX |
| -vis - makevis | à utiliser avec la saillance pour faire en sorte que les résultats de visualisation de l'intrigue | N / A |