
Transformers เป็นไลบรารี Python ที่พัฒนาโดย Hugging Face ซึ่งรองรับการโหลดโมเดลภาษาที่ผ่านการฝึกอบรมมาก่อนส่วนใหญ่ ด้วยการเพิ่มขึ้นของโมเดลเช่น Bert และ GPT ผู้ใช้จำนวนมากขึ้นเรื่อย ๆ ใช้ไลบรารี Transformers เพื่อสร้างแอปพลิเคชันการประมวลผลภาษาธรรมชาติ
โครงการนี้เป็นที่เก็บรหัสสำหรับการสอน "Transformers Library Quick Start" และรหัสถูกจัดระเบียบดังนี้:
- ข้อมูล : เก็บชุดข้อมูลที่ใช้แล้ว
- SRC : เก็บรหัสตัวอย่างแต่ละงานจะสอดคล้องกับโฟลเดอร์ซึ่งสามารถดาวน์โหลดและใช้งานแยกกันได้
บทช่วยสอนนี้อยู่ภายใต้การอัปเดตและค่อยๆเพิ่มเนื้อหาที่เกี่ยวข้องในรูปแบบภาษาขนาดใหญ่
การเริ่มต้นอย่างรวดเร็วของห้องสมุด Transformers
ส่วนที่หนึ่ง: ความรู้พื้นฐาน
- บทที่ 1: การประมวลผลภาษาธรรมชาติ
- บทที่ 2: โมเดลหม้อแปลง
- บทที่ 3: กลไกความสนใจ
ตอนที่ 2: การพบกันครั้งแรกกับ Transformers
- บทที่ 4: ท่อส่งออกจากกล่อง
- บทที่ 5: แบบจำลองและพาร์ติชันคำ
- บทที่ 6: ความรู้ Pytorch ที่จำเป็น
- บทที่ 7: ปรับแต่งโมเดลที่ผ่านการฝึกอบรมมาก่อน
ตอนที่ 3: Transformers Battle Battle
- บทที่ 8: Partitioner คำด่วน
- บทที่ 9: งานคำอธิบายประกอบลำดับ
- บทที่ 10: งานแปล
- บทที่ 11: งานสรุปข้อความ
- บทที่ 12: คำถามและคำตอบที่สกัด
- บทที่ 13: การวิเคราะห์ความเชื่อมั่น
ตอนที่ 4: ยุคของรูปแบบภาษาใหญ่
- บทที่ 14: บทนำสู่เทคโนโลยีโมเดลภาษาขนาดใหญ่
- บทที่ 15: รูปแบบภาษาขนาดใหญ่ก่อนการฝึกอบรม
- บทที่ 16: การใช้รูปแบบภาษาขนาดใหญ่
- บทที่ 17: การเรียนการสอนชั้นดีอุโมงค์ Flant5 รุ่น
- บทที่ 18: การเรียนการสอนปรับแต่ง Llama2 แบบจำลอง
รหัสตัวอย่าง
- pairwise_cls_similarity_afqmc: งานจำแนกคู่ประโยคการตัดสินคำพ้องความหมายทางการเงิน
- sequence_labeling_ner_cpd: งานการติดฉลากลำดับชื่อการจดจำเอนทิตี
- SEQ2SEQ_TRANSLATION: งาน SEQ2SEQ, การแปลภาษาจีน-อังกฤษ
- SEQ2SEQ_SUMMARIZATION: งาน SEQ2SEQ, สรุปข้อความ
- sequence_labeling_extractiveqa_cmrc: งานการติดฉลากลำดับคำถามและคำตอบที่สกัด
- text_cls_prompt_senti_chnsenticorp: งานการจำแนกประเภทข้อความ, การวิเคราะห์ความเชื่อมั่นที่รวดเร็ว
การอัปเดตที่สำคัญ
| วันที่ | เนื้อหา |
|---|
| 2024-07-06 | การแสดงออกที่เป็นข้อความของบทแรกของ "การประมวลผลภาษาธรรมชาติ" ได้รับการปรับให้เหมาะสมรูปภาพบางภาพถูกเพิ่มเข้ามาและมีการแนะนำแบบจำลองภาษาขนาดใหญ่ |
| 2024-07-27 | กรอกร่างเบื้องต้นของการแนะนำเทคโนโลยีของรูปแบบภาษาขนาดใหญ่ (บทที่ 14 ถึง 16) |