Este es el código para la capacitación e interpretación de un conjunto de redes neuronales convolucionales para la clasificación de varias tareas. Las instrucciones para descargar y comenzar con la versión actual están disponibles en https://cgs.csail.mit.edu/deepaccess-package/. DeepAccess está disponible a través de Pip y BioConda. El modelo DeepAccess entrenado en datos ATAC-Seq de 10 tipos de celdas de mouse está disponible como un registro de Zenodo.
Para ejecutar DeepAccess con regiones (formato de archivo de cama) debe instalar Bedtools y agregarlo a su camino. Los binarios de Bedtools están disponibles aquí.
Después de la instalación, puede agregar bedtools a su ruta a través del terminal o modificar su ~/.bashrc
export PATH="/path/to/bedtools:$PATH"
DeepAccess está disponible en el Índice de paquetes de Python (PYPI) y se puede instalar con PIP:
pip install deepaccess
y a través de BioConda:
conda install -c bioconda deepaccess
Para entrenar un modelo de DeepAccess para una nueva tarea
usage: deepaccess train [-h] -l LABELS [LABELS ...]
-out OUT [-ref REFFASTA]
[-g GENOME] [-beds BEDFILES [BEDFILES ...]]
[-fa FASTA] [-fasta_labels FASTA_LABELS]
[-f FRAC_RANDOM] [-nepochs NEPOCHS]
[-ho HOLDOUT] [-seed SEED] [-verbose]
optional arguments:
-h, --help show this help message and exit
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-out OUT, --out OUT
-ref REFFASTA, --refFasta REFFASTA
-g GENOME, --genome GENOME
genome chrom.sizes file
-beds BEDFILES [BEDFILES ...], --bedfiles BEDFILES [BEDFILES ...]
-fa FASTA, --fasta FASTA
-fasta_labels FASTA_LABELS, --fasta_labels FASTA_LABELS
-f FRAC_RANDOM, --frac_random FRAC_RANDOM
-nepochs NEPOCHS, --nepochs NEPOCHS
-ho HOLDOUT, --holdout HOLDOUT
chromosome to holdout
-seed SEED, --seed SEED
-verbose, --verbose Print training progress
| Argumento | Descripción | Ejemplo |
|---|---|---|
| -h, --help | Muestre este mensaje de ayuda y salida | N / A |
| -l -Abels | Lista de etiquetas para cada archivo de cama | C1 C2 C3 |
| -out --out | Nombre de la carpeta de salida | mioutput |
| -Ref -Ref | referencia FASTA; Requerido con entrada de cama | mm10.fa |
| -g - -Genome | Tamaños cromosómicos del genoma; Requerido con entrada de cama | predeterminado/mm10.chrom.sizes |
| -beds --files | lista de archivos de cama; Se requiere una de las camas o la entrada FA | C1.bed c2.bed c3.bed |
| -fa -fasta | archivo FASTA; Se requiere una de las camas o la entrada FA | C1C2C3.FA |
| -Fasta_Labels --Fasta_Labels | Archivo de texto que contiene etiquetas delimitadas de pestaña (0 o 1) para cada línea de FASTA con una columna para cada clase | C1c2c3.txt |
| -F -FRAC_RANDOM | Para la fracción de entrada de archivo de cama de regiones de grupos externos aleatorios para agregar a la capacitación | 0.1 |
| -Nepochs -Nepoches | número de iteraciones de entrenamiento | 1 |
| -ho -HoldOut | Nombre del cromosoma para mantenerse (solo con entrada de cama) | CHR19 |
| -verboso -verboso | Imprimir capacitación y progreso de la evaluación | N / A |
| -SEED -SEED | establecer semillas de flujo de tensor | 2021 |
Para ejecutar la interpretación de un modelo profundo
usage: deepaccess interpret [-h] -trainDir TRAINDIR
[-fastas FASTAS [FASTAS ...]]
[-l LABELS [LABELS ...]] [
-c COMPARISONS [COMPARISONS ...]]
[-evalMotifs EVALMOTIFS]
[-evalPatterns EVALPATTERNS]
[-p POSITION] [-saliency]
[-subtract] [-bg BACKGROUND] [-vis]
optional arguments:
-h, --help show this help message and exit
-trainDir TRAINDIR, --trainDir TRAINDIR
-fastas FASTAS [FASTAS ...], --fastas FASTAS [FASTAS ...]
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-c COMPARISONS [COMPARISONS ...], --comparisons COMPARISONS [COMPARISONS ...]
-evalMotifs EVALMOTIFS, --evalMotifs EVALMOTIFS
-evalPatterns EVALPATTERNS, --evalPatterns EVALPATTERNS
-p POSITION, --position POSITION
-saliency, --saliency
-subtract, --subtract
-bg BACKGROUND, --background BACKGROUND
-vis, --makeVis
| Argumento | Descripción | Ejemplo |
|---|---|---|
| -h, --help | Muestre este mensaje de ayuda y salida | N / A |
| -traindir --traindir | Directorio que contiene el modelo de DeepAccess entrenado | prueba/ascl1vsctcf |
| -fastas -Fastas | Lista de archivos FASTA a Evaule | test/ascl1vsctcf/test.fa |
| -l -Abels | Lista de etiquetas para cada archivo de cama | C1 C2 C3 |
| -C --Comparisons | Lista de comparaciones entre diferentes etiquetas | ASCL1VSCTCF ASCL1VSNone ejecuta EPE diferencial entre ASCL1 y CTCF y EPE en ASCL1; C1, C2VSC3 ejecuta EPE diferencial para (C1 y C2) vs C3 |
| -Evalmotifs --EvalMotifs | Base de datos PWM o PCM de motivos de secuencia de ADN | predeterminado/hmv11_mouse.txt |
| -EvalPatterns --EvalPaterns | Archivo FASTA que contiene patrones de secuencia de ADN | Data/ascl1_space.fa |
| -BG - -BG | Archivo FASTA que contiene secuencias de fondo | predeterminado/fondos.fa |
| -Saliabilidad -Salidanza | Calcular la importancia del nucleótido base | N / A |
| -Subriendo - -subtrato | Use resta en lugar de relación para EPE / DEPE | FALSO |
| -vis -makeevis | ser utilizado con la prominencia para hacer resultados de visualización de la trama | N / A |