พื้นที่เก็บข้อมูลนี้ให้กรอบสำหรับการจำแนกตามการจัดหมวดหมู่โดยใช้แบบจำลองภาษาที่ผ่านการฝึกอบรมมาก่อนโดยมุ่งเน้นไปที่งานการจำแนกประเภทข้อความเปอร์เซีย มันมีสคริปต์และสมุดบันทึกสำหรับการสร้างพรอมต์, การปรับแต่งการปรับแต่งสำหรับการจำแนก, การประเมินผลลัพธ์และการวิเคราะห์ตัวชี้วัดประสิทธิภาพของแบบจำลองเช่นคะแนน F1, ความแม่นยำและการเรียกคืน ที่เก็บยังรองรับการเรียนรู้ K-shot เพื่อเพิ่มความสามารถในการปรับตัวแบบจำลองโดยการรวมตัวอย่างที่เกี่ยวข้อง
รหัส : มีรหัสหลักและสมุดบันทึกสำหรับการฝึกอบรมแบบจำลองการสร้างพรอมต์และการประเมินผล
AYA-Colab.ipynb : สมุดบันทึกหลักสำหรับการฝึกอบรมและการปรับแต่งพร้อมกับโมเดล AYA บน ColabClassification_report.ipynb : สร้างตัวชี้วัดการจำแนกประเภทรวมถึงคะแนน F1 ความแม่นยำและการเรียกคืนสำหรับการตั้งค่าพรอมต์ที่แตกต่างกันCreating_dataset.ipynb : การเตรียมข้อมูลและการสร้างชุดข้อมูลสำหรับการเรียนรู้ตามพรอมต์f1-calculation.py : Python Script เพื่อคำนวณและแสดงคะแนน F1 คะแนนnews-aya-symbol-tuning.ipynb : สมุดบันทึกสำหรับการปรับแต่งสัญลักษณ์ด้วยโมเดล AYA สำหรับการจำแนกข้อความnews-aya-system-user-prompt.ipynb : สคริปต์สำหรับการสร้างระบบและการแจ้งเตือนผู้ใช้โดยใช้รูปแบบภาษาที่ผ่านการฝึกอบรมมาก่อนSymbol_tuning_aya.ipynb : โน้ตบุ๊กการปรับสัญลักษณ์สำหรับการปรับประสิทธิภาพที่รวดเร็วชุดข้อมูล : มีชุดข้อมูลที่ใช้สำหรับการฝึกอบรมและการประเมินผล
พรอมต์ : มีเทมเพลตพรอมต์ที่ใช้สำหรับงานการจำแนกประเภทต่างๆ
สไลด์ : เอกสารเอกสารและการนำเสนอที่อธิบายการเรียนรู้ในบริบทการออกแบบที่รวดเร็วการเรียนรู้ K-shot และการปรับสัญลักษณ์
In-Context Learning.pptx & In-Context Learning.pdf : รายละเอียดเกี่ยวกับการใช้การเรียนรู้ในบริบทสำหรับการปรับโมเดลSystem-User Prompt Design.pptx & System-User Prompt Design.pdf : คู่มือสำหรับการออกแบบระบบและพรอมต์ของผู้ใช้Symbol Tuning.pptx & Symbol Tuning.pdf : คำแนะนำเกี่ยวกับการใช้การปรับสัญลักษณ์เพื่อปรับปรุงประสิทธิภาพที่รวดเร็ว โคลนที่เก็บ:
git clone https://github.com/ShayanSalehi81/BachelorProject
cd BachelorProjectติดตั้งแพ็คเกจที่ต้องการ:
pip install -r requirements.txtรับรองความถูกต้องด้วยใบหน้ากอด (ถ้าจำเป็น) และติดตั้งไลบรารีเพิ่มเติม:
huggingface-cli login --token YOUR_HUGGINGFACE_TOKEN เรียกใช้สคริปต์โน๊ตบุ๊คหรือ Python ใด ๆ ในไดเรกทอรี Codes เพื่อดำเนินการงานเช่นการสร้างชุดข้อมูลการปรับจูนหรือการประเมินผล
Generator โหลดแบบจำลองภาษาที่ผ่านการฝึกอบรมมาแล้วรูปแบบการแจ้งเตือนและสร้างการคาดการณ์ สคริปต์รองรับการหาปริมาณ 4 บิตสำหรับการใช้หน่วยความจำที่มีประสิทธิภาพและใช้ประโยชน์จากการแจ้งเตือนที่ผู้ใช้ให้เพื่อจำแนกข้อมูลข่าวเปอร์เซียเป็น "สำคัญ" หรือ "ไม่สำคัญ"news-aya-symbol-tuning.ipynb และ Symbol_tuning_aya.ipynb ได้รับการออกแบบมาเพื่อปรับสัญลักษณ์ที่ได้รับการปรับแต่งซึ่งสามารถปรับปรุงความสามารถในการตีความแบบจำลองและการตอบสนองที่สอดคล้องกัน การปรับแต่งสัญลักษณ์แนะนำการปรับเปลี่ยนเล็กน้อยไปยังพรอมต์เพิ่มความเข้าใจของโมเดลเกี่ยวกับการสืบค้นที่เหมาะสม Creating_dataset.ipynb เพื่อประมวลผลล่วงหน้าและจัดรูปแบบชุดข้อมูลของคุณnews-aya-system-user-prompt.ipynb เพื่อกำหนดระบบและพรอมต์ของผู้ใช้และเรียกใช้การจัดหมวดหมู่บนชุดข้อมูลClassification_report.ipynb เพื่อคำนวณตัวชี้วัดเช่นความแม่นยำและคะแนน F1 และ f1-calculation.py เพื่อแสดงประสิทธิภาพnews-aya-symbol-tuning.ipynb เพื่อปรับแต่งการออกแบบพรอมต์ด้วยการปรับสัญลักษณ์ โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT
ยินดีต้อนรับ! อย่าลังเลที่จะส่งปัญหาคำขอคุณลักษณะหรือการดึงคำขอเพื่อปรับปรุงโครงการนี้