Biopal (V0.3) adalah toolkit bioinformatika yang dirancang untuk memproses file urutan FASTA. Alat ini menyediakan beberapa fungsi seperti membelah file FASTA, menghitung parameter protein, menanyakan informasi taksonomi dari NCBI, dan banyak lagi. Ini menggunakan pustaka tkinter untuk menyediakan antarmuka grafis yang ramah pengguna untuk input file dan pemilihan fungsi yang mudah.
Split Fasta File : Membagi file FASTA menjadi beberapa file kecil dengan maksimum 99 urutan per file. Terkadang diperlukan untuk pasca prrrocessing.
Header Resumer : Melanjutkan header panjang menjadi yang lebih pendek, standar (misalnya, berdasarkan nama organisme dari format NCBI [organism=...] ) dan menghasilkan pemetaan CSV yang asli dan header baru. Ini menyediakan file FASTA baru dengan header pendek baru dan urutan, dan file CSV dengan nama header "lama" dan "baru/pendek" untuk pelacakan urutan yang memadai.
Kalkulator ProtParam : Melakukan perhitungan curah dari berbagai sifat protein (misalnya, berat molekul, titik isoelektrik, dll.) Mirip dengan alat ProtParam Expasy dan mengeluarkan hasilnya ke dalam file CSV. Catatan: Program ini mengabaikan karakter "X" di semua urutan untuk melakukan perhitungan tanpa kesalahan. Mengembalikan file CSV dengan hasilnya. Sejauh ini, fitur ini masih sulit dikodekan, dan pengguna tidak dapat mengubah output program.
Kalkulator Indeks Lipat : Permintaan Alat Indeks Lipatan Proteopedia untuk setiap urutan dalam file FASTA dan mengeluarkan indeks lipatan setiap urutan ke file CSV.
Taxa Sage : menanyakan informasi taksonomi (divisi, pesanan, kelas, keluarga) untuk organisme dalam file FASTA (membutuhkan keberadaan [organism=...] di header) dan menulis hasilnya ke file CSV.
Microsintenic Retriever : Mulai dari gen conatining file FASTA yang diunduh dari koleksi dataset NCBI, ini mem -parsing data dan menemukan data GFF3 dari 20 KBP di sekitar gen yang menarik. Menggambarkan data dalam file CSV yang dapat dibaca, bagus untuk analisis evolusi.
Menu Bantuan : Memberikan deskripsi fungsionalitas alat.
Keluar : Dengan aman menutup aplikasi. Program tidak menyimpan informasi jalur/file.
Alat ini membutuhkan pustaka python berikut untuk diinstal:
tkinter untuk antarmuka pengguna grafis.biopython untuk parsing file fasta dan mengambil informasi taksonomi.requests dan json untuk meminta database online seperti Proteopedia dan NCBI.Anda dapat menginstal dependensi yang diperlukan menggunakan:
pip install biopython requestsgit clone https://github.com/SilicoGoBrr/BioPal.git
cd BioPalpip install -r requirements.txtpython biopal.pyPilih File Input : Klik tombol "Pilih File Input" untuk memilih file FASTA Anda.
Pilih operasi :
Hasilnya akan disimpan di direktori yang sama dengan file input, dengan nama file yang sesuai berdasarkan operasi yang dilakukan.
Fitur Taxa Sage menggunakan API Entrez NCBI untuk mengambil data taksonomi. Untuk ini, Anda perlu menentukan alamat email Anda, sebagaimana disyaratkan oleh NCBI's Entrez API.
Dalam kode, cari baris berikut:
Entrez . email = "" # Add your email hereGanti dengan alamat email Anda yang valid:
Entrez . email = "[email protected]"Langkah ini diperlukan untuk permintaan API entrez untuk bekerja dengan baik.
Pembatasan tingkat : API NCBI Entrez dapat memaksakan batas tingkat. Untuk menghindari terbatas pada tingkat, alat ini memperkenalkan penundaan singkat antara permintaan API saat menggunakan fitur taksa bijak.
Persyaratan Format FASTA : File Input FASTA harus berisi tag [organism=...] untuk fungsi taksa sage agar berfungsi dengan benar.
Program ini disediakan "sebagaimana adanya" tanpa jaminan atau jaminan. Gunakan dengan risiko Anda sendiri. Beberapa fitur mungkin memerlukan koneksi internet yang aktif.