
Virheat - это инструмент для визуализации VCF в качестве тепловой карты и мутаций MAP для соответствующих генов.
Вы когда -нибудь хотели иметь сжатый взгляд на частоты вариантов после отображения ваших необработанных чтений с вирусным/бактериальным эталонным геномом и сравнивать несколько файлов VCF одновременно? Чем виргит для вас. Вы можете не только визуализировать тепловую карту, но и читать в файле GFF3, который позволяет отображать гены, несущие мутацию. Этот легкий сценарий был вдохновлен Snipit и моим вариантным частотным сюжетом, получив лучшие функции визуализации обоих.

--scores 
pip install virheatconda install -c bioconda virheatgit clone https://github.com/jonas-fuchs/virHEAT
cd virHEAT
pip install -r requirements.txt
# or
pip install .Это уже было. Чтобы проверить, сработало ли это:
virheat -vВы должны увидеть текущую версию Virheat.
usage: virheat < folder containing vcfs > < output dir > -l or -g [additional arguments]
Аргументы:
positional arguments:
input folder containing input files and output folder
options:
-h, --help show this help message and exit
-r ref_id, --reference ref_id
reference identifier
--name virHEAT_plot.pdf
plot name and file type (pdf, png, svg, jpg). Default: virHEAT_plot.pdf
-l None, --genome-length None
length of the genome (needed if gff3 is not provided)
-g None, --gff3-path None
path to gff3 (needed if length is not provided)
-a [gene ...], --gff3-annotations [gene ...]
annotations to display from gff3 file (standard: gene). Multiple possible.
--gene-arrows, --no-gene-arrows
show genes in arrow format (only if the -g argument is provided) (default: False)
-t 0, --threshold 0 display frequencies above this threshold (0-1)
--delete, --no-delete
delete mutations that are present in all samples and their maximum frequency divergence is smaller than 0.5 (default: True)
-n None, --delete-n None
do not show mutations that occur n times or less (default: Do not delete)
-z start stop, --zoom start stop
restrict the plot to a specific genomic region.
--sort, --no-sort sort sample names alphanumerically (default: False)
--min-cov 20 display mutations covered at least x time (only if per base cov tsv files are provided)
-s scores_file pos_col score_col score_name, --scores scores_file pos_col score_col score_name
specify scores to be added to the plot by providing a CSV file containing scores, along with its column for amino-acid positions, its column for scores, and descriptive score names (e.g., expression, binding, antibody escape, etc.).
This option can be used multiple times to include multiple sets of scores.
-v, --version show program's version number and exit
Вам необходимо либо предоставить длину вашего эталонного генома, либо если вы хотите получить аннотацию последовательности, вам необходимо предоставить файл GFF3.
Кроме того, вы также можете проанализировать, достаточно ли охватываются мутации и отображать не покрытые клетки в сером. Для этого сначала создайте файлы TSV с базовым покрытием для каждого файла BAM с Qualimap и предоставьте его в той же папке, что и файлы VCF. Дайте им то же имя, что и ваши файлы VCF.
Более того, есть возможность включить визуализации дополнительных баллов (например, MAVE оценки для сродства связывания, уровня экспрессии, выхода антител и т. Д.), Нанесенные на мутации на тепловой карте. Чтобы использовать эту функцию, используйте аргумент -S или -баллы и предоставьте следующие аргументы: 1) путь к файлу CSV, содержащий результаты; 2) имя столбца в этом файле, содержащем положения мутации в классической нотации (например, T430Y); 3) имя столбца в этом файле, содержащем сами баллы; 4) Описательное имя оценки, которое будет использоваться в качестве меток на графике. Несколько наборов баллов могут быть включены одновременно, повторяя опцию -s или -балл с разными аргументами. Например, входные и возможные выходные данные, пожалуйста, см. Файлы, расположенные в папке exatre_data/example_mave_data.
Важный отказ от ответственности: код находится под лицензией GPLV3. Код без каких -либо гарантии; даже без подразумеваемой гарантии торговой точки зрения или пригодности для определенной цели. Эта программа является бесплатным программным обеспечением: вы можете перераспределить его и/или изменить ее в соответствии с условиями общей публичной лицензии GNU, опубликованных Фондом Free Software, либо версией 3 лицензии, либо (по варианту) любой более поздней версии.