แบบจำลองการฝังใหม่และปรับปรุงใหม่ซึ่งรวมการฝึกอบรมลำดับและโครงสร้างมีให้บริการที่ https://github.com/tbepler/prose!
พื้นที่เก็บข้อมูลนี้มีซอร์สโค้ดและลิงก์ไปยังข้อมูลและโมเดลการฝังที่เตรียมไว้ล่วงหน้าพร้อมกับกระดาษ ICLR 2019: การเรียนรู้ลำดับโปรตีนฝังตัวโดยใช้ข้อมูลจากโครงสร้าง
@inproceedings{
bepler2018learning,
title={Learning protein sequence embeddings using information from structure},
author={Tristan Bepler and Bonnie Berger},
booktitle={International Conference on Learning Representations},
year={2019},
}
การพึ่งพา:
เรียกใช้ setup.py เพื่อรวบรวมไฟล์ cython:
python setup.py build_ext --inplace
ชุดข้อมูลที่มีการแยกรถไฟ/dev/ทดสอบมีให้เป็นไฟล์. tar.gz จากลิงก์ด้านล่าง
สคริปต์การฝึกอบรมและการประเมินผลสมมติว่าชุดข้อมูลเหล่านี้ได้รับการสกัดลงในไดเรกทอรีที่เรียกว่า 'ข้อมูล'
รุ่นที่ผ่านการฝึกอบรมของเราของโมเดลการฝังโครงสร้างและโมเดลภาษาแบบสองทิศทางสามารถดาวน์โหลดได้ที่นี่
Tristan Bepler ([email protected])
โปรดอ้างอิงกระดาษด้านบนหากคุณใช้รหัสนี้หรือรุ่นที่ผ่านการฝึกอบรมในงานของคุณ
ซอร์สโค้ดและโมเดลที่ผ่านการฝึกอบรมนั้นมีให้ฟรีสำหรับการใช้งานที่ไม่ใช่เชิงพาณิชย์ภายใต้ข้อกำหนดของใบอนุญาต CC BY-NC 4.0 ดูไฟล์ใบอนุญาตและ/หรือ https://creativeCommons.org/licenses/by-nc/4.0/legalcode สำหรับข้อมูลเพิ่มเติม
หากคุณมีคำถามความคิดเห็นหรือต้องการรายงานข้อผิดพลาดโปรดยื่นปัญหา GitHub หรือติดต่อฉันที่ [email protected]