
يدمج هذا المشروع مجموعة متنوعة من مهام NLP التي تم تنفيذها بناءً على مكتبة Transformers.
Huggingface Transformers هو إطار عمل جيد جدًا مفتوح المصدر يدعم نماذج محولات التحميل/التدريب المريحة للغاية. يمكنك رؤية أساليب التثبيت والمكالمات المبتدئة للمكتبة هنا. يمكن للمكتبة أيضًا دعم المستخدمين لضبط نموذج مريح للغاية.
في هذا المشروع ، قمنا بدمج بعض مهام NLP السائدة. يمكنك العثور على المهام المقابلة واستبدال训练数据集في الكود你自己任务下的数据集لتدريب نموذج يطابق مهامك.
مهام NLP التي تم تنفيذها هي كما يلي (محدث):
احسب التشابه بين النصوص ، ويستخدم في الغالب:
搜索召回文本检索蕴含识别والمهام الأخرى.
| نموذج | منفذ |
|---|---|
| 【الإشراف】 نظرة عامة | [هنا] |
| 【الإشراف】 pointwise (برج واحد) | [هنا] |
| 【الإشراف】 DSSM (أبراج توأم) | [هنا] |
| 【الإشراف】 الجملة بيرت (أبراج التوأم) | [هنا] |
| 【غير إشراف】 simcse | [هنا] |
استخراج المعلومات المستهدفة من فقرة نصية معينة ، والتي تستخدم في الغالب للمهام
命名实体识别(NER)،实体关系抽取(RE)، إلخ.
| نموذج | منفذ |
|---|---|
| استخراج معلومات الكون (UIE) | [هنا] |
من خلال تصميم القالب السريع ، يمكننا تحقيق نتائج أفضل على النموذج المسبق باستخدام كمية أقل من البيانات ، ويتم استخدامه في الغالب من أجل:
Few-Shot،Zero-Shotوالمهام الأخرى.
| نموذج | منفذ |
|---|---|
| PET (استنادًا إلى طريقة تحديد نمط PROPT يدويًا) | [هنا] |
| P-tuning (طريقة الماكينة لتعلم نمط propt تلقائيًا) | [هنا] |
تصنيف نص معين ، والذي يستخدم في الغالب:
情感识别،文章分类识别والمهام الأخرى.
| نموذج | منفذ |
|---|---|
| BERT-CLS (مصنف قائم على BERT) | [هنا] |
يستخدم RLHF (التعلم التعزيز من ردود الفعل البشرية) التعلم التعزيز (RL) لتحديث نموذج توليد اللغة (LM) من خلال التعليقات البشرية ، وبالتالي تحقيق نتائج توليد أفضل (مثال تمثيلي: chatgpt) ؛ عادة ما يشمل مرحلتين: تدريب
奖励模型(Reward Model)والتدريب على强化学习(Reinforcement Learning).
| نموذج | منفذ |
|---|---|
| RLHF (تدريب نموذج المكافأة ، تحديث PPO GPT2) | [هنا] |
توليد النص (NLG) ، يستخدم عادةً لـ:
小说续写،智能问答،对话机器人وغيرها من المهام.
| نموذج | منفذ |
|---|---|
| نموذج أسئلة وأجوبة صينية (T5) | [هنا] |
| نموذج ملء (T5) | [هنا] |
بناء نموذج (LLM) نماذج (نماذج) نماذج كبيرة مطلوبة لحل مهام متعددة.
| نموذج | منفذ |
|---|---|
| تصنيف النص (chatglm-6b المستند إلى) | [هنا] |
| مطابقة النص (chatglm-6b) | [هنا] |
| استخراج المعلومات (chatglm-6b المستندة إلى) | [هنا] |
| اختبار شخصية نموذج كبير (LLMS MBTI) | [هنا] |
يرتبط التدريب النموذجي الكبير به ، ويغطي ما قبل التدريب ، وصقل التعليمات ، ونموذج المكافأة ، وتعلم التعزيز.
| نموذج | منفذ |
|---|---|
| ChatGlm-6b Finetune | [هنا] |
| تدريب نماذج كبيرة من الصفر | [هنا] |
بعض الأدوات الشائعة جمع.
| اسم الأداة | منفذ |
|---|---|
| عارض Tokenizer | [هنا] |