Unduh Multimodal GPT - Unduh Kode Sumber Multimodal GPT

Multimodal GPT

Kode sumber lainnya

1.0.0

Unduh

? GPT multi-modal

Latih chatbot multi-modal dengan instruksi visual dan bahasa!

Berdasarkan model multi-modal open-source OpenFlamingo, kami membuat berbagai data instruksi visual dengan set data terbuka, termasuk VQA, captioning gambar, penalaran visual, teks OCR, dan dialog visual. Selain itu, kami juga melatih komponen model bahasa OpenFlamingo hanya menggunakan data instruksi hanya bahasa .

Pelatihan bersama instruksi visual dan bahasa secara efektif meningkatkan kinerja model! Untuk detail lebih lanjut silakan lihat laporan teknis kami.

Selamat datang untuk bergabung dengan kami!

Bahasa Inggris | 简体中文

Fitur

Mendukung berbagai data pengajaran dan bahasa
Parameter fine-tuning efisien dengan lora
Menyetel visi dan bahasa pada saat yang sama, saling melengkapi

Instalasi

Untuk menginstal paket di lingkungan yang ada, jalankan

git clone https://github.com/open-mmlab/Multimodal-GPT.git
cd Multimodal-GPT
pip install -r requirements.txt
pip install -v -e .

atau menciptakan lingkungan Conda baru

conda env create -f environment.yml

Luncurkan demo secara lokal

Unduh bobot pra-terlatih.
Gunakan skrip ini untuk mengubah bobot llama menjadi memeluk format wajah.
Unduh model pra-terlatih OpenFlamingo dari OpenFlamingo/OpenFlamingo-9b.
Unduh berat Lora kami dari sini.
Kemudian tempatkan model -model ini di folder checkpoints seperti ini:
```
 checkpoints
├── llama-7b_hf
│   ├── config.json
│   ├── pytorch_model-00001-of-00002.bin
│   ├── ......
│   └── tokenizer.model
├── OpenFlamingo-9B
│   └──checkpoint.pt
├──mmgpt-lora-v0-release.pt
```
Luncurkan Demo Gradio
```
python app.py
```

Contoh

Resep:

Rencana Perjalanan:

Film:

Orang Terkenal:

gambar

Fine-tuning

Siapkan set data

A-okvqa
Unduh anotasi dari tautan ini dan unzip ke data/aokvqa/annotations .
Ini juga membutuhkan gambar dari dataset Coco yang dapat diunduh dari sini.
Keterangan Coco
Unduh dari tautan ini dan unzip ke data/coco .
Ini juga membutuhkan gambar dari dataset Coco yang dapat diunduh dari sini.
OCR VQA
Unduh dari tautan ini dan tempatkan dalam data/OCR_VQA/ .
Llava
Unduh dari Liuhaotian/llava-instruct-150k dan tempat di data/llava/ .
Ini juga membutuhkan gambar dari dataset Coco yang dapat diunduh dari sini.
Mini-gpt4
Unduh dari vision-cair/cc_sbu_align dan tempat di data/cc_sbu_align/ .
Dolly 15k
Unduh dari databricks/databricks-dolly-15k dan letakkan di data/dolly/databricks-dolly-15k.jsonl .
Alpaca GPT4
Unduh dari tautan ini dan letakkan di data/alpaca_gpt4/alpaca_gpt4_data.json .

Anda juga dapat menyesuaikan jalur data di konfigurasi/dataset_config.py.

Kain tebal dr wol kasar
Unduh dari tautan ini dan letakkan di data/baize/quora_chat_data.json .

Mulai pelatihan

torchrun --nproc_per_node=8 mmgpt/train/instruction_finetune.py 
  --lm_path checkpoints/llama-7b_hf 
  --tokenizer_path checkpoints/llama-7b_hf 
  --pretrained_path checkpoints/OpenFlamingo-9B/checkpoint.pt 
  --run_name train-my-gpt4 
  --learning_rate 1e-5 
  --lr_scheduler cosine 
  --batch_size 1  
  --tuning_config configs/lora_config.py 
  --dataset_config configs/dataset_config.py 
  --report_to_wandb

Ucapan Terima Kasih

OpenFlamingo
Lavis
Stanford Alpaca
Minigpt-4
Llava
Penyetelan instruksi dengan GPT-4

Jika Anda menemukan proyek kami berguna untuk penelitian dan aplikasi Anda, silakan kutip menggunakan Bibtex ini:

 @misc { gong2023multimodalgpt ,
      title = { MultiModal-GPT: A Vision and Language Model for Dialogue with Humans } , 
      author = { Tao Gong and Chengqi Lyu and Shilong Zhang and Yudong Wang and Miao Zheng and Qian Zhao and Kuikun Liu and Wenwei Zhang and Ping Luo and Kai Chen } ,
      year = { 2023 } ,
      eprint = { 2305.04790 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { cs.CV }
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-03-04
ukuran 107.26KB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Film dan televisi GPT versi terbaru

2023-10-30

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua