Unduh MedQA ChatGLM - Unduh Kode Sumber MedQA ChatGLM

Catatan
Selamat datang di karya terbaru kami: Carellama (Care Alpaca), model bahasa medis besar yang menggabungkan lusinan set data penyesuaian medis yang tersedia untuk umum dan secara terbuka tersedia model bahasa medis besar untuk mempromosikan perkembangan cepat LLM Medis: https://github.com/wangrongsheng/carellama: https://github.com/wangrongsheng/carellama: https://github.com/wangrongsheng/carellama

Medqa-Chatglm ¹

¹ Data yang digunakan adalah cmedqa2

sumber

proyek	Dataset	Model dasar
Chatmed	Konsultasikan berisi 50W + Konsultasi Online + Balas CHATGPT, TCM Tradition Chinese Medicine Diagnosis dan kumpulan data pengobatan belum dipublikasikan	Llama-7b
Chatdoctor	HealthCaremagic-100K berisi 100K+ Dataset Dialog Pasien-Doktor Nyata, ICLINIQ-10K berisi 10K+ Dataset Dialog Pasien-Doktor, GenMedGPT-5K berisi 5K+ Data Dialog Dokter-Pasien yang Dihasilkan oleh GPT	Llama-7b
Med-catglm	HUATUO-DATA, HUATUO-LIVER-CANCER	Chatglm-6b
HUatuo-Llama-Med-Chinese	HUATUO-DATA, HUATUO-LIVER-CANCER	Llama-7b
Dokterglm	Cmd., Meddialog, dataset proyek chatdoctor	Chatglm-6b
MedicalGpt-Zh	Data bukan sumber terbuka	Chatglm-6b
Dr.llama		Llama
Medical_nlp ²	-	-
CMCQA ³	-	-
Qizhengpt	-	-
Llm-pretrain-finetune	-	-
PMC-llama	-	Llama-7b
Bianque	-	-
Medalpaca	-	Llama-7b
MedicalGpt	-	-
Llm-pretrain-finetune	-	-
Shennong-tcm-llm	-	-
Sunsimiao	-	-
CMLM-ZHONGJING	-	-
Zhongjing	-	-
Ming	-	-
DISC-MEDLLM	-	-

² adalah sumber daya model besar untuk obat terkait, pastikan untuk memberikan perhatian khusus pada FreedomIntelligence
³ Dari Situs Web Tanya Jawab Dialog Medis Tiongkok Chunyu, Bahan Dialog Medis di 45 departemen termasuk menstruasi, otologi, kebidanan dan ginekologi
https://medical.chat-data.com/
https://huggingface.co/datasets/shibing624/medical

menggunakan

1. Lingkungan Instalasi

 pip install - r requirements . txt

2. Penyesuaian halus

2.1 Lora

 CUDA_VISIBLE_DEVICES = 0 python MedQA - ChatGLM / finetune . py 
                              - - do_train 
                              - - dataset merged - cMedQA 
                              - - finetuning_type lora 
                              - - output_dir . / med - lora 
                              - - per_device_train_batch_size 32 
                              - - gradient_accumulation_steps 256 
                              - - lr_scheduler_type cosine 
                              - - logging_steps 500 
                              - - save_steps 1000 
                              - - learning_rate 5e-5 
                              - - num_train_epochs 10.0 
                              - - fp16

2.2 Fine Fine Tune

 CUDA_VISIBLE_DEVICES = 0 python MedQA - ChatGLM / finetune . py 
                              - - do_train 
                              - - dataset merged - cMedQA 
                              - - finetuning_type freeze 
                              - - output_dir . / med - freeze 
                              - - per_device_train_batch_size 32 
                              - - gradient_accumulation_steps 256 
                              - - lr_scheduler_type cosine 
                              - - logging_steps 500 
                              - - save_steps 1000 
                              - - learning_rate 5e-5 
                              - - num_train_epochs 10.0 
                              - - fp16

2.3 P-turning V2

 CUDA_VISIBLE_DEVICES = 1 python MedQA - ChatGLM / finetune . py 
                              - - do_train - - dataset merged - cMedQA 
                              - - finetuning_type p_tuning 
                              - - output_dir . / med - p_tuning 
                              - - per_device_train_batch_size 32 
                              - - gradient_accumulation_steps 256 
                              - - lr_scheduler_type cosine 
                              - - logging_steps 500 
                              - - save_steps 1000 
                              - - learning_rate 5e-5 
                              - - num_train_epochs 10.0 
                              - - fp16

Untuk informasi parameter lebih lanjut, Anda dapat melihat penjelasan terperinci dari dokumen/parameter.md.

Pelatihan Terdistribusi Multi-GPU:

 # 配置分布式参数
accelerate config

# 分布式训练
accelerate launch src / finetune . py 
                  - - do_train 
                  - - dataset Huatuo , CMD , MedDialog , guanaco , cognition 
                  - - finetuning_type lora 
                  - - output_dir med - lora 
                  - - per_device_train_batch_size 16 
                  - - gradient_accumulation_steps 4 
                  - - lr_scheduler_type cosine 
                  - - logging_steps 10 
                  - - save_steps 1000 
                  - - learning_rate 5e-5 
                  - - num_train_epochs 3.0 
                  - - fp16 
                  - - ddp_find_unused_parameters False  # 分布式训练时，LoRA微调需要添加防止报错
                  - - plot_loss

3. Penalaran

3.1 Visualisasi

 CUDA_VISIBLE_DEVICES = 0 python MedQA - ChatGLM / web_demo . py 
                              - - checkpoint_dir med - lora /
                                              ( med - freez / )
                                              ( med - p_tuning / )

3.2 Baris Perintah

 CUDA_VISIBLE_DEVICES = 0 python MedQA - ChatGLM / infer . py 
                              - - checkpoint_dir med - lora /
                                              ( med - freez / )
                                              ( med - p_tuning / )

4. Gabungkan (opsional)

Gabungkan model:

 CUDA_VISIBLE_DEVICES = 0 python MedQA - ChatGLM / export_weights . py 
                              - - finetuning_weights_path . / med - lora 
                              - - save_weights_path . / save_lora

Memuat model gabungan:

 CUDA_VISIBLE_DEVICES = 0 python MedQA - ChatGLM / load_export_weights . py 
                              - - save_weights_path . / save_lora

hasil

Metode penyempurnaan	Berat model	Durasi pelatihan	Putaran pelatihan
Lora	Medqa-catglm-lora	28h	10
P-tuning v2	Medqa-catglm-ptuningv2	27h	10
Membekukan	Medqa-chatglm-freeze	28h	10

Pengaturan pelatihan

* Percobaan dilakukan pada sistem Linux, A100 (1x, 80GB)

Penafian

Sumber daya yang terkait dengan proyek ini hanya untuk penelitian akademik dan dilarang ketat untuk tujuan komersial. Saat menggunakan bagian yang melibatkan kode pihak ketiga, silakan ikuti protokol open source yang sesuai. Konten yang dihasilkan oleh model dipengaruhi oleh faktor -faktor seperti perhitungan model, keacakan dan kerugian akurasi kuantitatif, dan proyek ini tidak dapat menjamin keakuratannya. Sebagian besar set data dari proyek ini dihasilkan oleh model dan tidak dapat digunakan sebagai dasar untuk diagnosis medis yang sebenarnya bahkan jika mereka mematuhi fakta medis tertentu. Proyek ini mengasumsikan tidak ada kewajiban hukum untuk setiap output konten oleh model, juga tidak bertanggung jawab atas kerugian yang mungkin timbul dari penggunaan sumber daya yang relevan dan hasil output.

merujuk ke

https://github.com/zhangsheng93/cmedqa2
https://github.com/zhangsheng93/cmedqa
https://github.com/hiyouga/chatglm-eficient-tuning
https://github.com/jackaduma/chatglm-lora-rlhf-pytorch
https://github.com/thudm/chatglm-6b

Memperluas

MedQA ChatGLM

Medqa-Chatglm ¹

sumber

menggunakan

1. Lingkungan Instalasi

2. Penyesuaian halus

2.1 Lora

2.2 Fine Fine Tune

2.3 P-turning V2

3. Penalaran

3.1 Visualisasi

3.2 Baris Perintah

4. Gabungkan (opsional)

hasil

Penafian

merujuk ke

GitHub sgrebnov/cordova plugin background download

Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

GitHub the via/releases

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express

MedQA ChatGLM

Medqa-Chatglm 1

sumber

menggunakan

1. Lingkungan Instalasi

2. Penyesuaian halus

2.1 Lora

2.2 Fine Fine Tune

2.3 P-turning V2

3. Penalaran

3.1 Visualisasi

3.2 Baris Perintah

4. Gabungkan (opsional)

hasil

Penafian

merujuk ke

Medqa-Chatglm ¹