تنزيل AbLang2 - تنزيل رمز المصدر AbLang2

AbLang2

كود الذكاء الاصطناعي

1.0.0

تنزيل

Ablang-2

معالجة التحيز الجرثومي للأجسام المضادة وتأثيره على نماذج اللغة لتصميم الأجسام المضادة المحسنة

الدافع: خصائص الربط متعدد الاستخدامات للأجسام المضادة جعلتها فئة مهمة للغاية من العلاجات الحيوية. ومع ذلك ، فإن تطوير الأجسام المضادة العلاجية هو مهمة معقدة ومكلفة وتستغرق وقتًا طويلاً ، حيث يحتاج الجسم المضاد النهائي إلى عدم وجود ارتباط قوي ومحدد فحسب ، بل يتأثر أيضًا بأي مشاكل قابلية للتطوير. لقد أدى نجاح نماذج اللغة القائمة على المحولات في مساحة تسلسل البروتين وتوافر كميات هائلة من تسلسل الأجسام المضادة ، إلى تطوير العديد من نماذج اللغة الخاصة بالأجسام المضادة للمساعدة في توجيه اكتشاف الأجسام المضادة والتصميم. ينشأ تنوع الأجسام المضادة في المقام الأول من إعادة التركيب V (D) J ، والطفرات داخل CDRS ، و/أو من عدد صغير من الطفرات بعيدًا عن خط الجرثومة خارج CDRS. وبالتالي ، يبقى جزء كبير من المجال المتغير لجميع تسلسل الأجسام المضادة الطبيعية جرثومية. هذا يؤثر على التدريب المسبق لنماذج اللغة المضادة الخاصة بالأجسام المضادة ، حيث يقدم هذا الوجه من بيانات التسلسل تحيزًا سائد تجاه بقايا الخط الجرثومي. هذا يمثل تحديًا ، حيث أن الطفرات بعيدة عن الخط الجرثومي غالباً ما تكون حيوية لتوليد الربط المحدد والقوي للهدف ، مما يعني أن نماذج اللغة تحتاج إلى أن تكون قادرة على اقتراح طفرات رئيسية بعيدًا عن الجراثيم.

النتائج: في هذه الدراسة ، نستكشف الآثار المترتبة على تحيز الجراثيم ، ودراسة تأثيره على كل من النماذج اللغوية ذات البروتين العام والأجسام المضادة. نقوم بتطوير وتدريب سلسلة من نماذج اللغة المضادة الجديدة الخاصة بالأجسام المضادة المحسنة للتنبؤ بقايا غير أخلاقية. ثم نقوم بمقارنة نموذجنا النهائي ، Ablang-2 ، مع النماذج الحالية ونوضح كيف يقترح مجموعة متنوعة من الطفرات الصالحة ذات الاحتمال التراكمي العالي. يتم تدريب Ablang-2 على كل من البيانات غير المقترنة والمقترنة ، وهي متوفرة بحرية (https://github.com/oxpig/ablang2.git).

التوفر والتنفيذ: Ablang2 عبارة عن حزمة Python متوفرة على https://github.com/oxpig/ablang2.git.

tcrlang-paired: يمكن تهيئة بنية Ablang2 مع أوزان النماذج المدربة على تسلسل TCR المقترن. يمكن استخدام هذا النموذج بطريقة مماثلة لـ Ablang2 على تسلسل TCR. الوظيفة المفقودة الوحيدة هي عدم وجود أمر محاذاة. إن توليد ترميزات التسلسل والبقايا ، وكذلك التقنيع كلها متماثلة. على سبيل المثال ، يرجى الاطلاع على دفتر الملاحظات.

تثبيت Ablang2

Ablang متاح بحرية ويمكن تثبيته مع PIP.

    pip install ablang2

أو مباشرة من جيثب.

    pip install -U git+https://github.com/oxpig/AbLang2.git

NB: إذا كنت ترغب في محاذاة إخراجك المرتجع (أي استخدم الوسيطة "ALIGN = TRUE") ، فأنت بحاجة إلى تثبيت الباندا يدويًا ونسخة من Anarci في نفس البيئة. يمكن أيضًا تثبيت Anarci باستخدام Bioconda ؛ ومع ذلك ، يتم الحفاظ على هذا الإصدار من قبل طرف ثالث.

    conda install -c bioconda anarci

Ablang2 usecases

يمكن استخدام Ablang2 بطرق مختلفة وللأفراد المتنوعة. لبنات البناء المركزية هي Tokenizer و ABREP و Ablang.

Tokenizer: يحول التسلسلات والأحماض الأمينية إلى الرموز ، والعكس صحيح
ABREP: يولد ضمانات بقايا من الرموز
Ablang: يولد احتمالات الأحماض الأمينية من الرموز

 import ablang2

# Download and initialise the model
ablang = ablang2.pretrained(model_to_use='ablang2-paired', random_init=False, ncpu=1, device='cpu')

seq = [
'EVQLLESGGEVKKPGASVKVSCRASGYTFRNYGLTWVRQAPGQGLEWMGWISAYNGNTNYAQKFQGRVTLTTDTSTSTAYMELRSLRSDDTAVYFCARDVPGHGAAFMDVWGTGTTVTVSS', # The heavy chain (VH) needs to be the first element
'DIQLTQSPLSLPVTLGQPASISCRSSQSLEASDTNIYLSWFQQRPGQSPRRLIYKISNRDSGVPDRFSGSGSGTHFTLRISRVEADDVAVYYCMQGTHWPPAFGQGTKVDIK' # The light chain (VL) needs to be the second element
]

# Tokenize input sequences
seqs = [f"{seq[0]}|{seq[1]}"] # Input needs to be a list, with | used to separated the VH and VL 
tokenized_seq = ablang.tokenizer(seqs, pad=True, w_extra_tkns=False, device="cpu")
        
# Generate rescodings
with torch.no_grad():
    rescoding = ablang.AbRep(tokenized_seq).last_hidden_states

# Generate logits/likelihoods
with torch.no_grad():
    likelihoods = ablang.AbLang(tokenized_seq)

قمنا ببناء غلاف لاستخدامات محددة يمكن استكشافها عبر دفتر Noteber Jupyter التالي.

اقتباس

 @article{Olsen2024,
  title={Addressing the antibody germline bias and its effect on language models for improved antibody design},
  author={Tobias H. Olsen, Iain H. Moal and Charlotte M. Deane},
  journal={bioRxiv},
  doi={https://doi.org/10.1101/2024.02.02.578678},
  year={2024}
}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-10
الحجم 52.09KB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل