Este é o código para treinamento e interpretação de um conjunto de redes neurais convolucionais para classificação de várias tarefas. As instruções para download e início do lançamento atual estão disponíveis em https://cgs.csail.mit.edu/deepaccess-package/. O DeepAccess está disponível via Pip e Bioconda. O modelo DeepAccess treinado nos dados ATAC-seq de 10 tipos de células de mouse está disponível como um registro do Zenodo.
Para executar o DeepAccess com as regiões (formato do arquivo de cama), você deve instalar o Bedtools e adicioná -lo ao seu caminho. Os binários do BedTools estão disponíveis aqui.
Após a instalação, você pode adicionar bedtools ao seu caminho através do terminal ou modificando o seu ~/.bashrc
export PATH="/path/to/bedtools:$PATH"
O DeepAccess está disponível no Python Package Index (PYPI) e pode ser instalado com PIP:
pip install deepaccess
E via Bioconda:
conda install -c bioconda deepaccess
Para treinar um modelo DeepAccess para uma nova tarefa
usage: deepaccess train [-h] -l LABELS [LABELS ...]
-out OUT [-ref REFFASTA]
[-g GENOME] [-beds BEDFILES [BEDFILES ...]]
[-fa FASTA] [-fasta_labels FASTA_LABELS]
[-f FRAC_RANDOM] [-nepochs NEPOCHS]
[-ho HOLDOUT] [-seed SEED] [-verbose]
optional arguments:
-h, --help show this help message and exit
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-out OUT, --out OUT
-ref REFFASTA, --refFasta REFFASTA
-g GENOME, --genome GENOME
genome chrom.sizes file
-beds BEDFILES [BEDFILES ...], --bedfiles BEDFILES [BEDFILES ...]
-fa FASTA, --fasta FASTA
-fasta_labels FASTA_LABELS, --fasta_labels FASTA_LABELS
-f FRAC_RANDOM, --frac_random FRAC_RANDOM
-nepochs NEPOCHS, --nepochs NEPOCHS
-ho HOLDOUT, --holdout HOLDOUT
chromosome to holdout
-seed SEED, --seed SEED
-verbose, --verbose Print training progress
| Argumento | Descrição | Exemplo |
|---|---|---|
| -h, --help | Mostre esta mensagem de ajuda e saída | N / D |
| -L -Labels | Lista de etiquetas para cada arquivo de cama | C1 C2 C3 |
| -Out -Out | Nome da pasta de saída | MyOutput |
| -ref --ref | referência fasta; necessário com entrada da cama | mm10.fa |
| -g -Genome | Tamanhos cromossômicos genômicos; necessário com entrada da cama | padrão/mm10.chrom.sizes |
| -Beds -Bedfiles | lista de arquivos da cama; uma das camas ou entrada de FA necessária | C1.Bed C2.Bed C3.Bed |
| -FA - -FASTA | arquivo fasta; uma das camas ou entrada de FA necessária | C1C2C3.FA |
| -FASTA_LABELS --FASTA_LABELS | Arquivo de texto que contém rótulos delimitados da guia (0 ou 1) para cada linha de fasta com uma coluna para cada classe | C1C2C3.TXT |
| -f - -frac_random | Para a fração de entrada de arquivos de cama de regiões aleatórias de grupo externo para adicionar ao treinamento | 0.1 |
| -nepochs - -nepochs | Número de iterações de treinamento | 1 |
| -Ho -Holdout | Nome cromossômico a sustentar (apenas com entrada da cama) | Chr19 |
| -verbose --verbose | Progresso de treinamento e avaliação de impressão | N / D |
| -Ed -semente | Definir semente de tensorflow | 2021 |
Para executar a interpretação de um modelo DeepAccess
usage: deepaccess interpret [-h] -trainDir TRAINDIR
[-fastas FASTAS [FASTAS ...]]
[-l LABELS [LABELS ...]] [
-c COMPARISONS [COMPARISONS ...]]
[-evalMotifs EVALMOTIFS]
[-evalPatterns EVALPATTERNS]
[-p POSITION] [-saliency]
[-subtract] [-bg BACKGROUND] [-vis]
optional arguments:
-h, --help show this help message and exit
-trainDir TRAINDIR, --trainDir TRAINDIR
-fastas FASTAS [FASTAS ...], --fastas FASTAS [FASTAS ...]
-l LABELS [LABELS ...], --labels LABELS [LABELS ...]
-c COMPARISONS [COMPARISONS ...], --comparisons COMPARISONS [COMPARISONS ...]
-evalMotifs EVALMOTIFS, --evalMotifs EVALMOTIFS
-evalPatterns EVALPATTERNS, --evalPatterns EVALPATTERNS
-p POSITION, --position POSITION
-saliency, --saliency
-subtract, --subtract
-bg BACKGROUND, --background BACKGROUND
-vis, --makeVis
| Argumento | Descrição | Exemplo |
|---|---|---|
| -h, --help | Mostre esta mensagem de ajuda e saída | N / D |
| -Trarindir -TraIndir | Diretório contendo modelo treinado de DeepAccess | teste/ascl1vsctcf |
| -Fastas - -Fastas | Lista de arquivos fasta para evaular | teste/ascl1vsctcf/test.fa |
| -L -Labels | Lista de etiquetas para cada arquivo de cama | C1 C2 C3 |
| -C -Comparações | Lista de comparações entre diferentes rótulos | Ascl1vsctcf ascl1vsnone executa EPE diferencial entre ascl1 e ctcf e ePE no ASCL1; C1, C2VSC3 executa EPE diferencial para (C1 e C2) vs C3 |
| -Avalmotifs -Eavalmotifs | Base de dados PWM ou PCM de motivos de sequência de DNA | padrão/hmv11_mouse.txt |
| -EvalPatterns -EvalPatterns | FASTA FILA CONTINDO PADROS DE SEQUENCE DE DNA | dados/ascl1_space.fa |
| -bg - -bg | FASTA FILE CONTINTA SEQUÊNCIAS DE APENSSEM | padrão/backgrounds.fa |
| Saliência -saliência | Calcule por importância nucleotídica base | N / D |
| -Subtract - -subtract | Use a subtração em vez de proporção para EPE / depe | Falso |
| -vis - -makevis | para ser usado com saliência para fazer com que a trama visualize resultados | N / D |