alpaca 7b chinese التنزيل

alpaca 7b chinese

كود الذكاء الاصطناعي

1.0.0

تنزيل

؟؟؟؟ FINETUNE LLAMA-7B مع مجموعات بيانات التعليم الصينية

لمزيد من الأساليب finetune لـ LLM ، يرجى الاطلاع على دليل LLM-Finetune

هذا المستودع هو برنامج تعليمي لـ LLAMA-7B مع مجموعات البيانات الصينية! أقوم بمسح ودمج مجموعة البيانات وطريقة لتصنيع LLM الخاص بي لمهام NLP المعقدة مثل التلخيص ، والإجابة على الأسئلة ، وتوليد النصوص ، وزيادة البيانات المخصصة ، إلخ.

نظرًا لأن Finetune الأصلي Stanford Alpaca-7B يحتاج إلى الكثير من موارد GPU ، فإنني أركز على مسح الطريقة مع انخفاض استهلاك GPU.

إذن ، إليك كيفية التكاثر:

تثبيت

تثبيت المتطلبات

$ pip install -r requirements.txt

تثبيت Pytorch في إصدار متوافق مع CUDA

$ pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1+cu116 --extra-index-url https://download.pytorch.org/whl/cu116

مجموعات البيانات

قام هذا المستودع بدمج جميع مجموعات البيانات باستخدام الإنجليزي ، البناء الصيني والمخرجات:

alpaca_data.json : مجموعة البيانات الأصلية من ستانفورد الألباكا
alpaca_data_cleansed.json : التطهير بواسطة gururise/alpacadatacleaned
alpaca-zhCN.json : ترجمة بواسطة carbonz0/alpaca-chinese-dataset
alpaca-zhTW.json : ترجمة إلى الصينيين التقليديين باستخدام OpenCC
alpaca-en-zh.json : الجمع بين التعليمات الإنجليزية/الإدخال والإخراج الصيني بواسطة ntunlplab/alpaca التقليدية-alpaca: (مجموعة البيانات الصينية التقليدية ترجمة API chatgpt ( gpt-3.5-turbo ) بواسطة ntunlblab/chinese-alpaca (تحديث في 2023.03.29)))

ضبط دقيق

طريقة Finetune المرجعية توفرها Tloen/Alpaca-Lora

قم بتشغيل 1 GPU مع Colab: https://colab.research.google.com/drive/1qvtrjpikkknksbwwg766sigbbw2tqrd5؟usp=sharing

LLaMA

$ cd finetune/
$ python finetune.py --base_model decapoda-research/llama-7b-hf --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/llama-7b-hf_alpaca-en-zh --lora_target_modules ' ["q_proj", "v_proj"] '

BLOOM

$ cd finetune/
$ python finetune.py --base_model bigscience/bloomz-7b1-mt --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/bloomz-7b1-mt_alpaca-en-zh --lora_target_modules ' ["query_key_value"] '

استخدم torchrun للتدريب الموزعة على GPUs المتعددة

LLaMA

$ cd finetune/
$ torchrun --standalone --nnodes=1 --nproc_per_node=4 finetune.py --base_model decapoda-research/llama-7b-hf --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/llama-7b-hf_alpaca-en-zh --lora_target_modules ' ["q_proj", "v_proj"] '

BLOOM

$ cd finetune/
$ torchrun --standalone --nnodes=1 --nproc_per_node=4 finetune.py --base_model bigscience/bloomz-7b1-mt --data_dir ../data/alpaca-en-zh.json --output_dir ../finetuned/bloomz-7b1-mt_alpaca-en-zh --lora_target_modules ' ["query_key_value"] '

مهام المجال Finetune

لقد جمعت مهام المجال المختلفة في مستودعتي: تعليمات التعليمات غير المقيدة

مرحبًا بكم في التعاون! يرجى الاتصال بي على: [email protected] . أرغب في تجربة المهام من مجالات مختلفة مثل الاستثمار والاحتيال والتجارة الإلكترونية والقانون والرعاية الصحية ...

نموذج الخدمة

لخدمة خدمة النموذج الخاصة بك من خلال واجهة برمجة التطبيقات (API) وموقع الويب البسيط UI!

نموذج API
```
$ cd serve/
$ python api.py
```
Demo UI
```
$ cd serve/
$ python ui.py
```

يتعلم أكثر

لقد رتبت أساليب Finetune لـ LLM في LLM-Finetune-Muide

قمت برعاية الكثير من الطرق التي تحاول تشغيل نماذج لغة كبيرة مع عدد أقل من موارد GPU:

PEFT
لورا
Flexgen ...

انظر القائمة الكاملة: chatgpt-alternities

 @misc{alpaca-7b-chinese,
  author = {JiunYi Yang},
  title = {Alpaca-7B Chinese: Finetune LLaMA-7B with Chinese instruction datasets},
  year = {2023},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {url{https://github.com/A-baoYang/alpaca-7b-chinese}},
}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-09-03
الحجم 18.02MB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
ألعاب DOS الصينية (ألعاب DOS الصينية في المتصفح) مشروع كود مصدر النسخة الرسمية

2022-11-01
كرة الألبكة: كل النجوم

2022-08-08

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل