تنزيل RetroMAE - تنزيل رمز مصدر RetroMAE

RetroMAE

كود الذكاء الاصطناعي

1.0.0

تنزيل

retromae

قاعدة كود لتروماي وخارجها.

ما الجديد

أكتوبر 2022 ، Retromae: يتم قبول نماذج اللغة الموجه نحو الاسترجاع قبل التدريب عبر المشفر التلقائي المقنع إلى EMNLP 2022 ؛ عروض SOTA على MS Marco و Beir من Bert-Base Scale Retriever!
نوفمبر 2022 ، Retromae V2: Duplex مقنّع للتشفير التلقائي لنماذج اللغة الموجه نحو الاسترجاع مسبقًا على Arxiv. خطوة كبيرة أخرى إلى الأمام من V1 والتحسينات الرئيسية على MS Marco و Beir! النماذج والرمز ستأتي قريبًا!

نماذج صدر

لقد قمنا بتحميل بعض نقاط التفتيش إلى Huggingface Hub.

نموذج	وصف	وصلة
retromae	مسبقًا على ويكيبيديا و bookcorpus	shitao/retromae
retromae_msmarco	مسبقًا على ممر MsMarco	shitao/retromae_msmarco
retromae_msmarco_finetune	Finetune the Retromae_Msmarco على بيانات ممر MsMarco	shitao/retromae_msmarco_finetune
retromae_msmarco_distill	Finetune the Retromae_msmarco على بيانات ممر MsMarco عن طريق تقليل اختلاف KL مع الشفرات المتقاطعة	shitao/retromae_msmarco_distill
retromae_beir	Finetune The Retromae على بيانات ممر Msmarco لـ Beir (استخدم السلبيات الرسمية التي قدمتها بير)	shitao/retromae_beir

يمكنك تحميلها بسهولة باستخدام سلاسل المعرف. على سبيل المثال:

 from transformers import AutoModel
model = AutoModel . from_pretrained ( 'Shitao/RetroMAE' )

أداء أحدث الأداء

يمكن أن توفر Retromae تهيئة قوية للمسترد الكثيف ؛ بعد ضبطها مع البيانات في مجال في المناطق ، يؤدي ذلك إلى أداء استرجاع عالي الجودة خاضع للإشراف في السيناريو المقابل. علاوة على ذلك ، فإنه يحسن إلى حد كبير قابلية نقل النموذج الذي تم تدريبه مسبقًا ، مما يساعد على يؤدي إلى عروض صفرية متفوقة على مجموعات البيانات خارج المجال.

ممر Msmarco

النموذج الذي تم تدريبه مسبقًا على ويكيبيديا و bookcorpus:

نموذج	MRR@10	استدعاء@1000
بيرت	0.346	0.964
retromae	0.382	0.981

النموذج الذي تم تدريبه مسبقًا على msmarco:

نموذج	MRR@10	استدعاء@1000
Cocondenser	0.382	0.984
retromae	0.393	0.985
retromae (التقطير)	0.416	0.988

بير مقاعد

نموذج	AVG NDCG@10 (18 مجموعة بيانات)
بيرت	0.371
مكثف	0.407
retromae	0.452
retromae v2	0.491

تثبيت

 git clone https://github.com/staoxiao/RetroMAE.git
cd RetroMAE
pip install .

للتنمية ، قم بالتثبيت على أنه قابل للتحرير:

 pip install -e .

سير العمل

يتضمن هذا الريبو وظيفتين: ما قبل التدريب و Finetune. أولاً ، قم بتدريب Retromae على مجموعة البيانات العامة (أو مجموعة بيانات المصب) مع فقدان نمذجة لغة القناع. ثم Finetune retromae على مجموعة بيانات المصب مع فقدان التباين. لتحقيق أداء أفضل ، يمكنك أيضًا أن تتأثر بالعودة إلى التقطير في الدرجات التي يوفرها المشفر المتقاطع. سير عمل مفصل يرجى الرجوع إلى أمثلةنا.

ما قبل

 torchrun --nproc_per_node 8 
  -m pretrain.run 
  --output_dir {path to save ckpt} 
  --data_dir {your data} 
  --do_train True 
  --model_name_or_path bert-base-uncased 
  --pretrain_method {retromae or dupmae}

ضبط دقيق

 torchrun --nproc_per_node 8 
-m bi_encoder.run 
--output_dir {path to save ckpt} 
--model_name_or_path Shitao/RetroMAE 
--do_train  
--corpus_file ./data/BertTokenizer_data/corpus 
--train_query_file ./data/BertTokenizer_data/train_query 
--train_qrels ./data/BertTokenizer_data/train_qrels.txt 
--neg_file ./data/train_negs.tsv

أمثلة

قبل التدريب
- قبل التدريب على ويكيبيديا
- قبل التدريب على ممر msmarco
ثنائي الشفر
- Finetune على ممر MsMarco
- بير مقاعد
الشفرات المتقاطعة
- Reranker على ممر MsMarco

اقتباس

إذا وجدت عملنا مفيدًا ، فيرجى التفكير في الاستشهاد بنا:

 @inproceedings{RetroMAE,
  title={RetroMAE: Pre-Training Retrieval-oriented Language Models Via Masked Auto-Encoder},
  author={Shitao Xiao, Zheng Liu, Yingxia Shao, Zhao Cao},
  url={https://arxiv.org/abs/2205.12035},
  booktitle ={EMNLP},
  year={2022},
}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-06
الحجم 69.28KB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل