ทำไมเราถึงปรับรูปแบบภาษา? การปรับแต่งเป็นสิ่งจำเป็นเมื่อเราจำเป็น ต้องสอนทักษะใหม่ของ LLM หรือ เพิ่มความเข้าใจในโดเมนที่เฉพาะเจาะจง
ในโครงการนี้เราตั้งเป้าหมายที่จะปรับแต่งทั้งแบบจำลองขนาดเล็กและขนาดใหญ่/การแชทรวมถึง smollm สำหรับโมเดลภาษาขนาดเล็ก (SLM) และ mistral สำหรับโมเดลภาษาขนาดใหญ่ (LLM)
ชุดข้อมูลตัวอย่างหลักที่ใช้คือ medalpaca/medical_meadow_medical_flashcards ซึ่งได้มาจากใบแจ้งเตือนหลักสูตรการแพทย์ ANKI แฟลชการ์ดเหล่านี้สร้างและปรับปรุงอย่างสม่ำเสมอโดยนักศึกษาแพทย์ครอบคลุมหัวข้อทางการแพทย์ในวงกว้างเช่นกายวิภาคศาสตร์สรีรวิทยาพยาธิวิทยาและเภสัชวิทยา - และได้รับการออกแบบมาเพื่อสนับสนุนการเรียนรู้และการเก็บรักษาที่มีประสิทธิภาพ
แม้ว่าโครงการนี้จะใช้ชุดข้อมูล Medical_Meadow_medical_flashcards แต่สามารถปรับให้เข้ากับชุดข้อมูลอื่น ๆ สำหรับคำถาม/ตอบและสอนงาน/ตอบสนอง การรวมชุดข้อมูลที่แตกต่างกันสามารถทำได้อย่างง่ายดายโดยการแก้ไขไฟล์การกำหนดค่า
โครงการนี้ยังรองรับการหาปริมาณทำให้เป็นไปได้ที่จะปรับแต่งโมเดลขนาดใหญ่เช่น Mistral และ Llama ในการตั้งค่าฮาร์ดแวร์ที่เรียบง่ายขึ้น
รุ่น Smollm ที่ปรับแต่งได้มีให้ใน HuggingFace หรือไม่?
ในขณะที่การตอบสนองของโมเดลพื้นฐานเป็นเรื่องทั่วไปและเป็นไปตามรูปแบบการทำเครื่องหมาย แต่โมเดลที่ปรับแต่งได้อย่างมีประสิทธิภาพนั้นได้รวมทักษะพิเศษที่ได้รับการฝึกฝนมาอย่างมีประสิทธิภาพโดยเฉพาะอย่างยิ่งในการจำลองรูปแบบการตอบสนองที่คาดหวัง อย่างไรก็ตามในฐานะที่เป็นคนที่ไม่มีพื้นฐานทางการแพทย์ฉันไม่สามารถประเมินความถูกต้องหรือคุณภาพของการตอบสนองที่จัดทำโดยรุ่นใดรุ่นหนึ่ง ด้านล่างนี้เป็นตารางเปรียบเทียบการตอบสนองของโมเดลต้นฉบับโมเดลพื้นฐานและแบบจำลองที่ปรับแต่งสำหรับชุดคำถามทางการแพทย์
| คำถาม | การตอบสนองดั้งเดิม | การตอบสนองแบบจำลองพื้นฐาน | การตอบสนองแบบจำลองที่ปรับแต่ง |
|---|---|---|---|
| ยาต้านมาลาเรียชนิดใดที่มีกิจกรรมต่อต้าน plasmodium hypnozoites? | Primaquine เป็นยาต้านมาลาเรียที่มีกิจกรรมต่อต้าน plasmodium hypnozoites | ยาต้านมาลาเรียเป็นประเภทของยาที่มีประสิทธิภาพต่อปรสิตพลาสโมเดียมซึ่งมีหน้าที่ก่อให้เกิดมาลาเรีย ยาต้านมาลาเรียที่พบมากที่สุดที่ใช้ในการรักษามาลาเรีย ได้แก่ : 1. ampicillin (amphotericin B) : ยาปฏิชีวนะในวงกว้างสเปกตรัมที่มีประสิทธิภาพต่อสปีชีส์พลาสโมเดียม 2. fosamivir (fosamivir) : ไวรัสไวรัสในวงกว้างที่มีประสิทธิภาพต่อสายพันธุ์พลาสโมเดียม 3. influvir (influvir) : ไวรัสไวรัสในวงกว้างที่มีประสิทธิภาพต่อสปีชีส์พลาสโมเดียม 4. ** ampicillin | Erythromycin เป็นยาต้านมาลาเรียที่มีกิจกรรมต่อต้าน plasmodium hypnozoites |
| คำที่ใช้อธิบายปริมาณสารที่กรองในพื้นที่ของ Bowman ต่อหน่วยเวลาคืออะไร? | ปริมาณของสารที่กรองในพื้นที่ของ Bowman ต่อหน่วยเวลาเรียกว่าโหลดที่กรอง | คำว่า "พื้นที่ของ Bowman" เป็นภาษาพูดที่ใช้อธิบายปริมาณของสารที่กรองในพื้นที่ของ Bowman ซึ่งเป็นพื้นที่สมมุติฐานที่ยานอวกาศถูกเปิดตัวสู่วงโคจร แนวคิดนี้ขึ้นอยู่กับความคิดที่ว่ายานอวกาศสามารถเปิดตัวเป็นวงโคจรแล้วกลับสู่โลกด้วยยานอวกาศที่กรองอนุภาคหรือเศษซากที่เหลืออยู่ใด ๆ ที่อาจมีอยู่ในอวกาศ คำว่า "พื้นที่ของ Bowman" มักใช้เพื่ออธิบายปริมาณของสารที่กรองในพื้นที่ของ Bowman ซึ่งเป็นพื้นที่สมมุติฐานที่ยานอวกาศถูกเปิดตัวสู่วงโคจรแล้วกลับสู่โลก ที่ | คำที่ใช้อธิบายปริมาณสารที่กรองในพื้นที่ของ Bowman ต่อหน่วยเวลาเรียกว่าประสิทธิภาพการกรอง |
| คำที่ใช้อธิบายปริมาณเลือดที่มีอยู่ในเส้นเลือดคืออะไร? | ปริมาณเลือดที่มีอยู่ในเส้นเลือดเรียกว่าปริมาตรที่ไม่หนัก | คำว่า "ปริมาตรเลือด" หมายถึงปริมาณเลือดที่ไหลเวียนผ่านระบบไหลเวียนโลหิตของร่างกาย มันเป็นกระบวนการที่ซับซ้อนที่เกี่ยวข้องกับการแลกเปลี่ยนออกซิเจนสารอาหารและของเสียระหว่างเลือดและเนื้อเยื่อ โดยทั่วไปปริมาณเลือดจะถูกวัดเป็นลิตร (L) หรือมิลลิลิตร (ML) และโดยทั่วไปจะกระจายไปทั่วร่างกายผ่านระบบไหลเวียนโลหิต มีองค์ประกอบสำคัญหลายประการที่นำไปสู่ปริมาณเลือด: 1. เซลล์เม็ดเลือดแดง : เซลล์เหล่านี้คือเซลล์ที่มีออกซิเจนจากปอดไปยังเนื้อเยื่อ พวกเขามีเส้นผ่านศูนย์กลางประมาณ 1.5 มม. และประกอบด้วยฮีโมโกลบิน | คำที่ใช้อธิบายปริมาณเลือดที่มีอยู่ในหลอดเลือดดำเรียกว่าเลือดหลอดเลือดดำ |
| ปัจจัยที่สำคัญที่สุดในการพิจารณาการพยากรณ์โรคของมะเร็งเซลล์ในช่วงเปลี่ยนผ่านคืออะไร? | ปัจจัยที่สำคัญที่สุดในการพิจารณาการพยากรณ์โรคของมะเร็งเซลล์ในช่วงเปลี่ยนผ่านคือระดับของการบุกรุก | การพิจารณาการพยากรณ์โรคของมะเร็งเซลล์เปลี่ยนผ่าน (TCC) เป็นสิ่งสำคัญเนื่องจากสามารถส่งผลกระทบอย่างมีนัยสำคัญต่อคุณภาพชีวิตของผู้ป่วยทางเลือกการรักษาและการอยู่รอดโดยรวม ปัจจัยที่สำคัญที่สุดในการพิจารณาการพยากรณ์โรคของ TCC คือการปรากฏตัวของการวินิจฉัยที่ชัดเจนเนื้องอกที่กำหนดไว้อย่างดีและการพยากรณ์โรคที่ดี นี่คือปัจจัยสำคัญบางประการที่สามารถมีอิทธิพลต่อการพยากรณ์โรคของ TCC: 1. การวินิจฉัยที่ชัดเจน : TCC ได้รับการวินิจฉัยว่าเป็นเนื้องอกที่ชัดเจนซึ่งหมายความว่ามันมีการเจริญเติบโตที่อ่อนโยนหรือไม่เป็นพิษเป็นภัย TCC ยังได้รับการวินิจฉัยว่ามีการพยากรณ์โรคที่ดีเนื่องจากไม่น่าจะแพร่กระจายไปยัง | ปัจจัยที่สำคัญที่สุดในการพิจารณาการพยากรณ์โรคของมะเร็งเซลล์ในระยะเปลี่ยนผ่านคือการปรากฏตัวของเกรดสูง |
ความแม่นยำของการตอบสนอง: โมเดลที่ปรับแต่งจะจำลองรูปแบบและสไตล์ที่คาดหวัง แต่แสดงให้เห็นถึงความไม่ถูกต้องบางอย่าง ตัวอย่างเช่น erythromycin ถูกระบุอย่างไม่ถูกต้องว่าเป็นยาต้านมาลาเรียที่มีประสิทธิภาพต่อ plasmodium hypnozoites คำตอบที่ถูกต้องควรเป็น primaquine
ปัญหาแบบจำลองพื้นฐาน: การตอบสนองของโมเดลพื้นฐานนั้นมีความยาวมากเกินไปและบางครั้งก็ปิดหัวข้อโดยเฉพาะอย่างยิ่งในบริบททางการแพทย์ดังที่เห็นในคำอธิบายที่ไม่ถูกต้องเกี่ยวกับพื้นที่ของ Bowman และปริมาณเลือด
หมายเหตุ: ผลลัพธ์นี้ได้รับหลังจากการฝึกอบรมเพียง 10 ครั้ง การฝึกอบรมสำหรับยุคเพิ่มเติมอาจนำไปสู่ผลลัพธ์ที่ดีขึ้น¯ (ツ) /¯
ในการเรียกใช้โครงการนี้อย่างราบรื่นต้องมี Python 3.10 โครงการได้รับการทดสอบและตรวจสอบใน Python 3.10.13 ทำตามขั้นตอนด้านล่างเพื่อตั้งค่าสภาพแวดล้อมของคุณ:
สร้างสภาพแวดล้อมเสมือนจริง:
python -m venv env
เปิดใช้งานสภาพแวดล้อมเสมือนจริง:
source env/bin/activate
ติดตั้งการพึ่งพาที่ต้องการ:
pip install -r requirements.txt
ตั้งค่าตัวแปรสภาพแวดล้อม: คัดลอกไฟล์. env.example และเปลี่ยนชื่อเป็น. env:
mv .env.example .env
คุณสามารถสำรวจขั้นตอนการฝึกอบรมโดยใช้สมุดบันทึก Jupyter:
cd notebooks
jupyter-lab
หรือคุณสามารถเริ่มกระบวนการปรับแต่งได้โดยตรง พารามิเตอร์ที่ใช้สำหรับการปรับแต่งมีการระบุไว้ในไฟล์การกำหนดค่าภายในโฟลเดอร์ configs ในการเริ่มต้นกระบวนการปรับจูนด้วยรุ่น Smallm เริ่มต้น Run:
python train.py
หากคุณต้องการฝึกอบรมโมเดลอื่นคุณสามารถระบุการกำหนดค่าโมเดลได้โดยส่งชื่อไฟล์กำหนดค่าเป็นอาร์กิวเมนต์:
python train.py --model Mistral
แทนที่ Mistral ด้วยชื่อของไฟล์กำหนดค่าของโมเดลที่ต้องการ ในการฝึกอบรมรุ่นใหม่เพียงสร้างไฟล์กำหนดค่าใหม่ด้วยการตั้งค่าที่ต้องการและเรียกใช้ Train.py ด้วยชื่อรุ่นที่เหมาะสม