تنزيل Multimodal GPT - تنزيل رمز مصدر Multimodal GPT

Multimodal GPT

شفرة المصدر الأخرى

1.0.0

تنزيل

؟ متعددة الوسائط GPT

تدريب chatbot متعددة الوسائط مع تعليمات مرئية ولغة!

استنادًا إلى نموذج OpenFlamingo متعدد المصادر مفتوح المصدر ، نقوم بإنشاء بيانات تعليمات مرئية مختلفة مع مجموعات بيانات مفتوحة ، بما في ذلك VQA ، تسميات توضيحية للصور ، التفكير البصري ، النص التعريفي ، والحوار المرئي. بالإضافة إلى ذلك ، نقوم أيضًا بتدريب مكون نموذج اللغة في OpenFlamingo باستخدام بيانات التعليمات اللغوية فقط.

التدريب المشترك للتعليمات المرئية واللغوية يحسن بشكل فعال أداء النموذج! لمزيد من التفاصيل ، يرجى الرجوع إلى تقريرنا الفني.

مرحبًا بك للانضمام إلينا!

الإنجليزية | 简体中文

سمات

دعم مختلف بيانات تعليمات الرؤية واللغة
المعلمة فعالة صقل مع لورا
ضبط الرؤية واللغة في نفس الوقت ، تكمل بعضها البعض

تثبيت

لتثبيت الحزمة في بيئة موجودة ، قم بتشغيل

git clone https://github.com/open-mmlab/Multimodal-GPT.git
cd Multimodal-GPT
pip install -r requirements.txt
pip install -v -e .

أو إنشاء بيئة جديدة

conda env create -f environment.yml

إطلاق العرض التوضيحي محليا

قم بتنزيل الأوزان التي تم تدريبها مسبقًا.
استخدم هذا البرنامج النصي لتحويل أوزان اللاما إلى تعانق تنسيق الوجه.
قم بتنزيل نموذج OpenFlamingo مسبقًا من OpenFlamingo/OpenFlamingo-9b.
قم بتنزيل وزن Lora من هنا.
ثم ضع هذه النماذج في مجلدات checkpoints مثل هذا:
```
 checkpoints
├── llama-7b_hf
│   ├── config.json
│   ├── pytorch_model-00001-of-00002.bin
│   ├── ......
│   └── tokenizer.model
├── OpenFlamingo-9B
│   └──checkpoint.pt
├──mmgpt-lora-v0-release.pt
```
إطلاق تجريبي Gradio
```
python app.py
```

أمثلة

وصفة:

خطة السفر:

فيلم:

الشخص الشهير:

الكون المثالى

إعداد مجموعات البيانات

A-OKVQA
قم بتنزيل التعليقات التوضيحية من هذا الرابط وفك الضغط على data/aokvqa/annotations .
كما يتطلب صورًا من مجموعة بيانات Coco التي يمكن تنزيلها من هنا.
تعليق كوكو
قم بتنزيل من هذا الرابط وفك الضغط على data/coco .
كما يتطلب صورًا من مجموعة بيانات Coco التي يمكن تنزيلها من هنا.
OCR VQA
قم بتنزيل من هذا الرابط والمكان في data/OCR_VQA/ .
llava
قم بتنزيل من Liuhaotian/llava-instruct-150k ووضعها في data/llava/ .
كما يتطلب صورًا من مجموعة بيانات Coco التي يمكن تنزيلها من هنا.
Mini-GPT4
قم بتنزيل من Vision-Cair/CC_SBU_ALIGN ووضعها في data/cc_sbu_align/ .
دوللي 15K
قم بتنزيل من Databricks/Databricks-Dolly-15K ووضعه في data/dolly/databricks-dolly-15k.jsonl .
الألبكة GPT4
قم بتنزيله من هذا الرابط ووضعه في data/alpaca_gpt4/alpaca_gpt4_data.json .

يمكنك أيضًا تخصيص مسار البيانات في configs/dataset_config.py.

بايز
قم بتنزيله من هذا الرابط ووضعه في data/baize/quora_chat_data.json .

ابدأ التدريب

torchrun --nproc_per_node=8 mmgpt/train/instruction_finetune.py 
  --lm_path checkpoints/llama-7b_hf 
  --tokenizer_path checkpoints/llama-7b_hf 
  --pretrained_path checkpoints/OpenFlamingo-9B/checkpoint.pt 
  --run_name train-my-gpt4 
  --learning_rate 1e-5 
  --lr_scheduler cosine 
  --batch_size 1  
  --tuning_config configs/lora_config.py 
  --dataset_config configs/dataset_config.py 
  --report_to_wandb

شكر وتقدير

OpenFlamingo
لافيس
ستانفورد الألباكا
مصغرة 4
llava
تعليمات ضبط مع GPT-4

إذا وجدت مشروعنا مفيدًا للبحث والتطبيقات ، فيرجى الاستشهاد باستخدام هذا bibtex:

 @misc { gong2023multimodalgpt ,
      title = { MultiModal-GPT: A Vision and Language Model for Dialogue with Humans } , 
      author = { Tao Gong and Chengqi Lyu and Shilong Zhang and Yudong Wang and Miao Zheng and Qian Zhao and Kuikun Liu and Wenwei Zhang and Ping Luo and Kai Chen } ,
      year = { 2023 } ,
      eprint = { 2305.04790 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { cs.CV }
}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-03-04
الحجم 107.26KB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
أحدث نسخة من GPT للسينما والتلفزيون

2023-10-30

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل