تنزيل esm2_loras - تنزيل رمز المصدر esm2

esm2_loras

كود الذكاء الاصطناعي

1.0.0

تنزيل

esm2_loras

هذه محاولة لتدريب تكيف منخفض (LORA) لنموذج لغة البروتين ESM-2 لمهمة تصنيف الرمز المميز. على وجه الخصوص ، نحاول تدريب تنبؤ موقع ربط الحمض النووي الريبي. لا تزال هناك بعض المشكلات التي يجب العمل عليها وأي ردود فعل أو نصيحة ستكون موضع تقدير كبير. هذا الرمز مخصص لنموذج صغير ، لذا يجب أن يقوم بتجهيزات WANDB للبحث عن ارتفاع الفائقة في فترة زمنية معقولة على أي وحدة معالجة الرسومات تقريبًا. يمكنك بسهولة تبديل نماذج أكبر على الرغم من أنك إذا أردت.

الأوزان النموذجية والتكوين

النموذج نفسه

 "AmelieSchreiber/esm2_t6_8M_UR50D_lora_rna_binding_sites"

يمكن العثور عليها على الوجه المعانقة هنا.

إعداد هذا الريبو

لإعداد بيئة كوندا ، استنساخ الريبو والتشغيل:

 conda env create -f environment.yml

ثم قم بالتشغيل:

 conda activate lora_esm_2

لتدريب النموذج المدى:

 from lora_esm2_script import train_protein_model

train_protein_model ()

للاستخدام ، حاول التشغيل:

 from transformers import AutoModelForTokenClassification , AutoTokenizer
from peft import PeftModel
import torch
import numpy as np
import random



# Path to the saved LoRA model
model_path = "esm2_t6_8M-finetuned-lora_2023-08-03_18-32-25"
# ESM2 base model
base_model_path = "facebook/esm2_t6_8M_UR50D"

# Load the model
base_model = AutoModelForTokenClassification . from_pretrained ( base_model_path )
loaded_model = PeftModel . from_pretrained ( base_model , model_path )

# Load the tokenizer
loaded_tokenizer = AutoTokenizer . from_pretrained ( model_path )

# New unseen protein sequence
new_protein_sequence = "FDLNDFLEQKVLVRMEAIINSMTMKERAKPEIIKGSRKRRIAAGSGMQVQDVNRLLKQFDDMQRMMKKM"

# Tokenize the new sequence
inputs = loaded_tokenizer ( new_protein_sequence , truncation = True , padding = 'max_length' , max_length = 512 , return_tensors = "pt" )

# Make predictions
with torch . no_grad ():
    outputs = loaded_model ( ** inputs )
    logits = outputs . logits
    predictions = torch . argmax ( logits , dim = 2 )

# Print logits for debugging
print ( "Logits:" , logits )

# Convert predictions to a list
predicted_labels = predictions . squeeze (). tolist ()

# Get input IDs to identify padding and special tokens
input_ids = inputs [ 'input_ids' ]. squeeze (). tolist ()

# Define a set of token IDs that correspond to special tokens
special_tokens_ids = { loaded_tokenizer . cls_token_id , loaded_tokenizer . pad_token_id , loaded_tokenizer . eos_token_id }

# Filter the predicted labels using the special_tokens_ids to remove predictions for special tokens
binding_sites = [ label for label , token_id in zip ( predicted_labels , input_ids ) if token_id not in special_tokens_ids ]

print ( "Predicted binding sites:" , binding_sites )

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-04
الحجم 49.49KB
من Github

تطبيقات ذات صلة

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
محرك تحليل البيانات Lihua الإصدار المجاني 3.0_search_navigation_collection_public Oplic_ranking_api

2022-06-28

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل