
Virheat é uma ferramenta para visualizar VCFs como um mapa de calor e mapa de mapa para os respectivos genes.
Sempre quis ter uma visão condensada das frequências variantes depois de mapear suas leituras brutas para um genoma de referência viral/bacteriano e comparar vários arquivos VCF ao mesmo tempo? Do que virheat é para você. Você não pode apenas visualizar o mapa de calor, mas também ler em um arquivo GFF3 que permite exibir genes que abrigam uma mutação. Esse script leve foi inspirado no Snipit e no meu gráfico de frequência variante, obtendo os melhores recursos de visualização de ambos.

--scores 
pip install virheatconda install -c bioconda virheatgit clone https://github.com/jonas-fuchs/virHEAT
cd virHEAT
pip install -r requirements.txt
# or
pip install .Já era isso. Para verificar se funcionou:
virheat -vVocê deve ver a versão atual do virheat.
usage: virheat < folder containing vcfs > < output dir > -l or -g [additional arguments]
Argumentos:
positional arguments:
input folder containing input files and output folder
options:
-h, --help show this help message and exit
-r ref_id, --reference ref_id
reference identifier
--name virHEAT_plot.pdf
plot name and file type (pdf, png, svg, jpg). Default: virHEAT_plot.pdf
-l None, --genome-length None
length of the genome (needed if gff3 is not provided)
-g None, --gff3-path None
path to gff3 (needed if length is not provided)
-a [gene ...], --gff3-annotations [gene ...]
annotations to display from gff3 file (standard: gene). Multiple possible.
--gene-arrows, --no-gene-arrows
show genes in arrow format (only if the -g argument is provided) (default: False)
-t 0, --threshold 0 display frequencies above this threshold (0-1)
--delete, --no-delete
delete mutations that are present in all samples and their maximum frequency divergence is smaller than 0.5 (default: True)
-n None, --delete-n None
do not show mutations that occur n times or less (default: Do not delete)
-z start stop, --zoom start stop
restrict the plot to a specific genomic region.
--sort, --no-sort sort sample names alphanumerically (default: False)
--min-cov 20 display mutations covered at least x time (only if per base cov tsv files are provided)
-s scores_file pos_col score_col score_name, --scores scores_file pos_col score_col score_name
specify scores to be added to the plot by providing a CSV file containing scores, along with its column for amino-acid positions, its column for scores, and descriptive score names (e.g., expression, binding, antibody escape, etc.).
This option can be used multiple times to include multiple sets of scores.
-v, --version show program's version number and exit
Você precisa fornecer o comprimento do seu genoma de referência ou se deseja obter a anotação de sequência, precisará fornecer o arquivo GFF3.
Além disso, você também pode analisar se as mutações são suficientemente cobertas e exibir células não cobertas em cinza. Para isso, crie uma cobertura base por base de arquivos TSV para cada arquivo BAM com qualIMAP e forneça -o na mesma pasta que os arquivos VCF. Dê a eles o mesmo nome que seus arquivos VCF.
Além disso, existe uma opção para incluir visualizações de pontuações adicionais (por exemplo, pontuações do MAVE para afinidade de ligação, nível de expressão, escape de anticorpos, etc.) mapeados para mutações no mapa de calor. Para utilizar esse recurso, use o argumento -s ou -scores e forneça os seguintes argumentos: 1) caminho para o arquivo CSV contendo pontuações; 2) o nome da coluna neste arquivo que contém posições de mutação na notação clássica (por exemplo, T430Y); 3) o nome da coluna neste arquivo que contém as próprias pontuações; 4) Um nome de pontuação descritivo que será usado como rótulos no gráfico. Vários conjuntos de pontuação podem ser incluídos simultaneamente repetindo a opção -s ou -scores com argumentos diferentes. Por exemplo, dados de entrada e possíveis dados de saída, consulte os arquivos localizados na pasta Explet_Data/exemplo_Mave_Data.
Isenção de responsabilidade importante: O código está sob a licença GPLV3. O código não tem garantia; sem a garantia implícita de comercialização ou aptidão para uma finalidade específica. Este programa é um software livre: você pode redistribuí -lo e/ou modificá -lo nos termos da licença pública geral da GNU, conforme publicado pela Free Software Foundation, versão 3 da licença ou (por sua opção) qualquer versão posterior.