Biopal (v0.3) هي مجموعة أدوات المعلوماتية الحيوية مصممة لمعالجة ملفات تسلسل fasta. توفر الأداة العديد من الوظائف مثل تقسيم ملفات fasta ، وحساب معلمات البروتين ، والاستعلام عن معلومات التصنيفية من NCBI ، وأكثر من ذلك بكثير. يستخدم مكتبة tkinter لتوفير واجهة رسومية سهلة الاستخدام لإدخال ملفات ووظيفة سهلة.
تقسيم ملف fasta : يقسم ملف fasta إلى ملفات أصغر متعددة بحد أقصى 99 تسلسل لكل ملف. مطلوب في بعض الأحيان ل post prorocessing.
استئناف الرأس : يستأنف الرؤوس الطويلة إلى رؤوس أقصر وموحدة (على سبيل المثال ، استنادًا إلى اسم الكائن الحي من تنسيق NCBI [organism=...] ) ويؤدي إلى رسم خرائط CSV للرؤوس الأصلية والجديدة. يوفر كلا من ملف FASTA جديد مع رؤوس قصيرة جديدة وتسلسلات ، وملف CSV مع كل من أسماء الرأس "القديمة" و "جديدة/قصيرة" للتتبع الكافي للتسلسلات.
حاسبة Protparam : تقوم بحسابات كبيرة لخصائص البروتين المختلفة (على سبيل المثال ، الوزن الجزيئي ، النقطة الإلكترونية ، إلخ) على غرار أداة Protparam الخاصة بـ Expasy وتخرج النتائج في ملف CSV. ملاحظة: يتجاهل هذا البرنامج أحرف "X" في جميع التسلسلات لإجراء الحسابات دون أخطاء. إرجاع ملف CSV مع النتائج. حتى الآن ، لا تزال هذه الميزة مرمزة صلابة ، ولا يمكن للمستخدم تغيير إخراج البرنامج.
Fold Index Calculator : الاستعلامات أداة فهرس ProteOpedia لكل تسلسل في ملف FASTA وإخراج فهرس طية كل تسلسل إلى ملف CSV.
SAGE SAGE : الاستفسارات معلومات التصنيفية (القسم ، الطلب ، الفصل ، الأسرة) للكائنات الحية في ملف FASTA (يتطلب وجود [organism=...] في الرأس) ويكتب النتائج إلى ملف CSV.
Microsintenic Retriever : بدءًا من جينات Conating Fileda التي تم تنزيلها من مجموعات مجموعات بيانات NCBI ، فإنه يوسع البيانات ويجد بيانات GFF3 من 20 كيلو بايت حول جينات الاهتمام. يصور البيانات في ملف CSV قابل للقراءة ، وهو أمر رائع للتحليل التطوري.
قائمة المساعدة : توفر وصفًا لوظائف الأداة.
الخروج : يغلق التطبيق بأمان. البرنامج لا يحتفظ بمعلومات المسار/الملف.
تتطلب هذه الأداة تثبيت مكتبات Python التالية:
tkinter لواجهة المستخدم الرسومية.biopython لتحليل ملفات fasta واسترداد المعلومات التصنيفية.requests و json للاستعلام عن قواعد بيانات عبر الإنترنت مثل Proteopedia و NCBI.يمكنك تثبيت التبعيات اللازمة باستخدام:
pip install biopython requestsgit clone https://github.com/SilicoGoBrr/BioPal.git
cd BioPalpip install -r requirements.txtpython biopal.pyحدد ملف الإدخال : انقر فوق الزر "تحديد إدخال ملف" لاختيار ملف fasta الخاص بك.
اختر عملية :
سيتم حفظ النتائج في نفس الدليل مثل ملف الإدخال ، مع أسماء الملفات المناسبة بناءً على العملية التي تم تنفيذها.
تستخدم ميزة Taxa Sage واجهة برمجة تطبيقات Entrez من NCBI لاسترداد بيانات التصنيفية. لهذا ، تحتاج إلى تحديد عنوان بريدك الإلكتروني ، كما هو مطلوب من قبل API من NCBI.
في الكود ، حدد موقع السطر التالي:
Entrez . email = "" # Add your email hereاستبدله بعنوان بريدك الإلكتروني الصحيح:
Entrez . email = "[email protected]"هذه الخطوة ضرورية لطلبات API Entrez للعمل بشكل صحيح.
الحد من الأسعار : قد تفرض API NCBI Entrez حدود المعدل. لتجنب أن تكون محدودًا للمعدل ، تقدم الأداة تأخيرًا قصيرًا بين طلبات API عند استخدام ميزة SAGE SAGE.
متطلبات تنسيق fasta : يجب أن يحتوي ملف الإدخال fasta على [organism=...] علامات لوظيفة SAGE SAGE للعمل بشكل صحيح.
يتم توفير هذا البرنامج "كما هو" دون أي ضمانات أو ضمانات. استخدمه على مسؤوليتك الخاصة. قد تتطلب بعض الميزات اتصال إنترنت نشط.