Biopal (V0.3) - это инструментарий биоинформатики, предназначенный для обработки файлов последовательности FASTA. Инструмент предоставляет несколько функциональных возможностей, таких как разделение файлов FASTA, расчет параметров белка, запрос таксономической информации от NCBI и многое другое. Он использует библиотеку tkinter для предоставления удобного графического интерфейса для удобного ввода файла и выбора функций.
Сплит файл FASTA : разбивает файл FASTA на несколько меньших файлов с максимум 99 последовательностей на файл. Иногда требуется для Post Prrocessing.
Заголовок Resumer : возобновляется длинные заголовки в более короткие, стандартизированные (например, на основе названия организма из формата NCBI [organism=...] ) и выводит CSV, отображающий оригинальные и новые заголовки. Он предоставляет как новый файл FASTA с новыми короткими заголовками, так и с последовательностями, так и файл CSV с «старыми» и «новыми/короткими» именами заголовков для адекватного отслеживания последовательностей.
Калькулятор POTPARAM : выполняет объемные расчеты различных свойств белка (например, молекулярная масса, изоэлектрическая точка и т. Д.), Подобно инструменту Expasy ProtParam и выводит результаты в файл CSV. Примечание. Эта программа игнорирует символы «x» во всех последовательностях для выполнения расчетов без ошибок. Возвращает файл CSV с результатами. До сих пор эта функция по-прежнему жестко кодируется, и пользователь не может изменить вывод программы.
Калькулятор индекса складывания : запрашивает инструмент индекса Proteopedia Fold для каждой последовательности в файле FASTA и выводит индекс сгиба каждой последовательности в файл CSV.
SAXAS SAGE : Запросы таксономической информации (разделение, порядок, класс, семья) для организмов в файле FASTA (требует наличия [organism=...] в заголовке) и записывает результаты в файл CSV.
Microsintenic Retriever : начиная с конитизированных генов Fasta, загруженных из коллекций наборов данных NCBI, он анализирует данные и находит данные GFF3 о 20 кбиплентражах, окружающих гены, представляющие интерес. Описывает данные в читаемом файле CSV, отлично подходит для эволюционного анализа.
Меню справки : предоставляет описание функциональных возможностей инструмента.
Выход : безопасно закрывает приложение. Программа не содержит информацию о пути/файле.
Этот инструмент требует установки следующих библиотек Python:
tkinter для графического интерфейса пользователя.biopython для анализа файлов FASTA и получения таксономической информации.requests и json для запроса онлайн -баз данных, таких как Proteopedia и NCBI.Вы можете установить необходимые зависимости, используя:
pip install biopython requestsgit clone https://github.com/SilicoGoBrr/BioPal.git
cd BioPalpip install -r requirements.txtpython biopal.pyВыберите «Входной файл» : нажмите кнопку «Выберите« Входной файл », чтобы выбрать файл FASTA.
Выберите операцию :
Результаты будут сохранены в том же каталоге, что и входной файл, с соответствующими именами файлов на основе выполненной операции.
Функция Taxa Sage использует API NCBI Entrez для извлечения таксономических данных. Для этого вам необходимо указать свой адрес электронной почты, как того требует API NCBI Entrez.
В коде найдите следующую строку:
Entrez . email = "" # Add your email hereЗамените его на свой действительный адрес электронной почты:
Entrez . email = "[email protected]"Этот шаг необходим для запросов API Entrez для правильной работы.
Ограничение скорости : API NCBI Entrez может наложить ограничения скорости. Чтобы избежать ограничения ставки, инструмент вводит короткую задержку между запросами API при использовании функции SAMAS SAGE.
Требования к формату FASTA : входной файл FASTA должен содержать теги [organism=...] для функции мудреца таксонов для правильной работы.
Эта программа предоставляется «как есть» без каких -либо гарантий или гарантий. Используйте его на свой собственный риск. Некоторые функции могут потребовать активного подключения к Интернету.