Biopal (v0.3) เป็นชุดเครื่องมือทางชีวสารสนเทศที่ออกแบบมาเพื่อประมวลผลไฟล์ลำดับ Fasta เครื่องมือนี้ให้ฟังก์ชันการทำงานหลายอย่างเช่นการแยกไฟล์ FASTA การคำนวณพารามิเตอร์โปรตีนการสืบค้นข้อมูลอนุกรมวิธานจาก NCBI และอีกมากมาย มันใช้ไลบรารี tkinter เพื่อให้อินเทอร์เฟซกราฟิกที่ใช้งานง่ายสำหรับการป้อนไฟล์และการเลือกฟังก์ชั่นง่าย ๆ
แยกไฟล์ FASTA : แยกไฟล์ FASTA ออกเป็นไฟล์ขนาดเล็กหลายไฟล์ที่มีลำดับสูงสุด 99 ลำดับต่อไฟล์ บางครั้งจำเป็นสำหรับการโพสต์การประมวลผล
Resumer Header : กลับมาเป็นส่วนหัวที่ยาวกว่าเป็นมาตรฐานที่สั้นกว่า (เช่นตามชื่อสิ่งมีชีวิตจากรูปแบบ NCBI [organism=...] ) และส่งออกการแมป CSV ส่วนหัวเดิมและใหม่ มันมีทั้งไฟล์ FASTA ใหม่ที่มีส่วนหัวสั้นใหม่และลำดับและไฟล์ CSV ที่มีทั้งชื่อ "เก่า" และ "ใหม่/สั้น" สำหรับการติดตามลำดับที่เพียงพอ
เครื่องคิดเลข Protparam : ทำการคำนวณจำนวนมากของคุณสมบัติโปรตีนต่าง ๆ (เช่นน้ำหนักโมเลกุล, จุดไอโซอิเล็กทริก ฯลฯ ) คล้ายกับเครื่องมือ ProtParam ของ Expasy และส่งผลออกไปยังไฟล์ CSV หมายเหตุ: โปรแกรมนี้จะละเว้นอักขระ "X" ในทุกลำดับเพื่อทำการคำนวณโดยไม่มีข้อผิดพลาด ส่งคืนไฟล์ CSV พร้อมผลลัพธ์ จนถึงตอนนี้คุณลักษณะนี้ยังคงเป็นรหัสยากและผู้ใช้ไม่สามารถเปลี่ยนผลลัพธ์ของโปรแกรมได้
เครื่องคิดเลขดัชนีพับ : สอบถามเครื่องมือดัชนีการพับ proteopedia สำหรับแต่ละลำดับในไฟล์ FASTA และส่งออกดัชนีพับของแต่ละลำดับไปยังไฟล์ CSV
Taxa Sage : สอบถามข้อมูลอนุกรมวิธาน (ส่วนคำสั่ง, ชั้นเรียน, ครอบครัว) สำหรับสิ่งมีชีวิตในไฟล์ FASTA (ต้องมี [organism=...] ในส่วนหัว) และเขียนผลลัพธ์ไปยังไฟล์ CSV
Microsintenic Retriever : เริ่มต้นจากไฟล์ FASTA ที่รวมยีนที่ดาวน์โหลดจากคอลเลกชันชุดข้อมูลของ NCBI มันแยกวิเคราะห์ข้อมูลและค้นหาข้อมูล GFF3 ของ 20 kbp รอบยีนที่น่าสนใจ แสดงข้อมูลในไฟล์ CSV ที่อ่านได้เหมาะสำหรับการวิเคราะห์เชิงวิวัฒนาการ
เมนูช่วยเหลือ : ให้คำอธิบายเกี่ยวกับฟังก์ชันการทำงานของเครื่องมือ
ออก : ปิดแอปพลิเคชันอย่างปลอดภัย โปรแกรมไม่เก็บข้อมูลเส้นทาง/ไฟล์
เครื่องมือนี้ต้องการการติดตั้งไลบรารี Python ต่อไปนี้:
tkinter สำหรับส่วนต่อประสานผู้ใช้กราฟิกbiopython สำหรับการแยกวิเคราะห์ไฟล์ fasta และดึงข้อมูลอนุกรมวิธานrequests และ json สำหรับการสอบถามฐานข้อมูลออนไลน์เช่น Proteopedia และ NCBIคุณสามารถติดตั้งการพึ่งพาที่จำเป็นโดยใช้:
pip install biopython requestsgit clone https://github.com/SilicoGoBrr/BioPal.git
cd BioPalpip install -r requirements.txtpython biopal.pyเลือกไฟล์อินพุต : คลิกปุ่ม "เลือกอินพุตไฟล์" เพื่อเลือกไฟล์ FASTA ของคุณ
เลือกการดำเนินการ :
ผลลัพธ์จะถูกบันทึกในไดเรกทอรีเดียวกับไฟล์อินพุตพร้อมชื่อไฟล์ที่เหมาะสมตามการดำเนินการที่ดำเนินการ
คุณลักษณะ Taxa Sage ใช้ Entrez API ของ NCBI เพื่อดึงข้อมูลอนุกรมวิธาน สำหรับสิ่งนี้คุณต้องระบุที่อยู่อีเมลของคุณตามที่ต้องการโดย Entrez API ของ NCBI
ในรหัสค้นหาบรรทัดต่อไปนี้:
Entrez . email = "" # Add your email hereแทนที่ด้วยที่อยู่อีเมลที่ถูกต้องของคุณ:
Entrez . email = "[email protected]"ขั้นตอนนี้จำเป็นสำหรับคำขอ Entrez API เพื่อทำงานอย่างถูกต้อง
การ จำกัด อัตรา : NCBI Entrez API อาจกำหนดขีด จำกัด อัตรา เพื่อหลีกเลี่ยงการ จำกัด อัตราเครื่องมือจะแนะนำการหน่วงเวลาสั้น ๆ ระหว่างคำขอ API เมื่อใช้คุณสมบัติ Taxa Sage
ข้อกำหนดรูปแบบ FASTA : ไฟล์อินพุต Fasta ต้องมี [organism=...] แท็กสำหรับฟังก์ชั่น Taxa Sage ทำงานได้อย่างถูกต้อง
โปรแกรมนี้มีให้ "ตามสภาพ" โดยไม่มีการรับประกันหรือการรับประกัน ใช้มันตามความเสี่ยงของคุณเอง คุณสมบัติบางอย่างอาจต้องใช้การเชื่อมต่ออินเทอร์เน็ตที่ใช้งานอยู่