[กระดาษ] [โมเดล] [สาธิต]
การสร้างบทกวีเป็นงานที่ท้าทายในด้านการประมวลผลภาษาธรรมชาติเนื่องจากต้องใช้แบบจำลองเพื่อทำความเข้าใจความแตกต่างของภาษาความเชื่อมั่นและสไตล์ ในบทความนี้เราเสนอให้ใช้แบบจำลองภาษาขนาดใหญ่เพื่อสร้างบทกวีเวียดนามของประเภทต่าง ๆ จากการแจ้งภาษาธรรมชาติซึ่งช่วยอำนวยความสะดวกในกระบวนการที่ใช้งานง่ายด้วยการควบคุมเนื้อหาที่เพิ่มขึ้น
โมเดลที่มีประสิทธิภาพที่สุดของเราคือตัวแปร GPT-3 Babbage ได้รับคะแนนการประเมินที่กำหนดเอง 0.8 โดยเฉพาะอย่างยิ่งปรับให้เข้ากับประเภท "Luc Bat" ของบทกวีเวียดนาม นอกจากนี้เรายังสำรวจความคิดของบทกวีการถอดความเป็นข้อความปกติและให้คะแนนค่อนข้างสูง 0.781 ในประเภท "LUC BAT" การทดลองนี้นำเสนอศักยภาพในการแปลบทกวีข้ามภาษากับบทกวีด้วยบทกวีที่แปลเป็นอินพุตในขณะที่ยังคงควบคุมเนื้อหาที่สร้างขึ้นพร้อมกัน
ชุดข้อมูล orignial เป็นคอลเล็กชั่นบทกวีเวียดนาม 171188 ที่มีแนวเพลงที่แตกต่างกัน: Luc-bat, 5-chu, 7-chu, 8-chu, 4-chu ดาวน์โหลดที่นี่
สำหรับรายละเอียดเพิ่มเติมโปรดดูส่วน กิตติกรรมประกาศ
นอกจากนี้เรายังสร้างชุดข้อมูลของเราเองสำหรับการสร้างแบบพรอมต์ในโฟลเดอร์ทรัพยากร/ชุดข้อมูล
เราได้รับการฝึกอบรมประเภทตัวจําแนกประเภทที่กำหนดเองตาม Bert ด้วยความแม่นยำ 99.7% เพื่อจำแนกประเภทที่ถูกต้องก่อนการให้คะแนน สำหรับรายละเอียดเพิ่มเติมโปรดดูที่ Vietnamese-poem-classifier ของเรา สิ่งนี้จะเป็นประโยชน์ในระหว่างการทดสอบคนตาบอด (ซึ่งไม่ได้ระบุประเภท)
รหัสการฝึกอบรมอยู่ใน repo นี้ ในการฝึกอบรมตัวแยกประเภทวิ่ง:
python poem_classifier_training.py
เราใช้ฟังก์ชั่นที่กำหนดเองเพื่อทำคะแนนคุณภาพของบทกวีโดยใช้โครงสร้างที่มีการขายตามกฎที่เข้มงวดของบทกวีเวียดนามประเภทต่างๆ ใช้ 3 เกณฑ์: ความยาวโทนและสัมผัสดังต่อไปนี้: score = L/10 + 3T/10 + 6R/10
ตารางที่ 1: การเปรียบเทียบผลลัพธ์ของแบบจำลอง
| แบบจำลอง | LUC BAT | ตาบอด | 7 ชู | 8 Chu | 5 ชู | 4 ชู |
|---|---|---|---|---|---|---|
| ข้อความเป็น poem | ||||||
| CHATGPT (zero-shot) | 0.440 | 0.345 | 0.292 | 0.197 | 0.284 | 0.238 |
| Davinci (1,000 ตัวอย่าง) | 0.580 | - | - | - | - | - |
| บาน (ตัวอย่าง 20k) | 0.678 | 0.596 | 0.367 | 0.279 | 0.480 | 0.440 |
| Babbage (ตัวอย่าง 20k) | 0.718 | - | - | - | - | - |
| ที่รัก | 0.805 | 0.795 | 0.661 | 0.500 | 0.382 | 0.392 |
| บทกวี | ||||||
| ที่รัก | 0.781 | - | - | - | - | - |
ปัจจุบันคะแนนประเภท Luc Bat สูงสุดเนื่องจากขนาดตัวอย่างที่แท้จริง นอกจากนี้ยังมีแนวโน้มที่จะจัดประเภท Luc Bat เมื่อไม่ได้ระบุประเภทดังนั้นมันจึงให้คะแนนสูงมากในระหว่างการทดสอบคนตาบอด
เวอร์ชัน OpenSource ใช้ LORA สำหรับ Bloom-7b1 ใน 8 บิตและสามารถทำงานบน colab คุณสามารถลองได้ที่นี่ (อาจหมดหน่วยความจำและความผิดพลาดมันใช้ในการทำงานที่ดีเวอร์ชันห้องสมุดใหม่ขัดแย้งกันมาก)
@misc { huynh2024vietnamese ,
title = { Vietnamese Poem Generation & The Prospect Of Cross-Language Poem-To-Poem Translation } ,
author = { Triet Minh Huynh and Quan Le Bao } ,
year = { 2024 } ,
eprint = { 2401.01078 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
} โครงการนี้ได้รับแรงบันดาลใจจากวิธีการประเมินผลจากบทกวีบทกวี SP-GPT2 ของ fsoft-ailab
ชุดข้อมูลที่นำมาจาก repo ของพวกเขา