[kertas] [model] [demo]
Generasi puisi telah menjadi tugas yang menantang di bidang pemrosesan bahasa alami, karena membutuhkan model untuk memahami nuansa bahasa, sentimen, dan gaya. Dalam makalah ini, kami mengusulkan menggunakan model bahasa besar untuk menghasilkan puisi Vietnam dari berbagai genre dari petunjuk bahasa alami, sehingga memfasilitasi proses intuitif dengan kontrol konten yang ditingkatkan.
Model kami yang paling manjur, varian Babbage GPT-3, mencapai skor evaluasi khusus 0.8 , secara khusus dirancang dengan genre "Luc Bat" dari puisi Vietnam. Selain itu, kami juga mengeksplorasi gagasan puisi parafrase ke dalam permintaan teks normal dan menghasilkan skor yang relatif tinggi 0.781 dalam genre "Luc Bat". Eksperimen ini menyajikan potensi terjemahan puisi-ke-poem lintas-bahasa dengan puisi yang diterjemahkan sebagai input sambil secara bersamaan mempertahankan kontrol penuh atas konten yang dihasilkan.
Dataset Orignial adalah kumpulan puisi Vietnam 171188 dengan genre yang berbeda: luc-bat, 5-chu, 7-chu, 8-chu, 4-chu. Unduh di sini.
Untuk detail lebih lanjut, lihat bagian Ucapan Terima Kasih
Kami juga membuat kumpulan data kami sendiri untuk pembuatan berbasis prompt di folder sumber daya/dataset.
Kami melatih classifier genre khusus berdasarkan Bert dengan akurasi 99.7% untuk mengklasifikasikan genre yang benar sebelum mencetak. Untuk detail lebih lanjut, rujuk ke Klasifier Poem Vietnamese kami. Ini akan membantu selama tes buta (di mana genre tidak ditentukan).
Kode pelatihan ada dalam repo ini. Untuk melatih classifier, jalankan:
python poem_classifier_training.py
Kami menggunakan fungsi kustom untuk mencetak kualitas puisi, berdasarkan pada konformasi pada aturan kaku dari berbagai jenis puisi Vietnam. Menggunakan 3 kriteria: panjang, nada dan sajak sebagai berikut: score = L/10 + 3T/10 + 6R/10
Tabel 1: Hasil Perbandingan Model
| Model | Luc Bat | Buta | 7 chu | 8 Chu | 5 chu | 4 chu |
|---|---|---|---|---|---|---|
| Teks-ke-poem | ||||||
| Chatgpt (nol-shot) | 0.440 | 0.345 | 0.292 | 0.197 | 0.284 | 0.238 |
| DaVinci (1000 sampel) | 0,580 | - | - | - | - | - |
| Bloom (sampel 20k) | 0.678 | 0,596 | 0.367 | 0.279 | 0.480 | 0.440 |
| Babbage (sampel 20k) | 0.718 | - | - | - | - | - |
| Babbage | 0.805 | 0.795 | 0.661 | 0,500 | 0.382 | 0.392 |
| puisi-ke-poem | ||||||
| Babbage | 0.781 | - | - | - | - | - |
Saat ini, skor genre Luc Bat tertinggi karena ukuran sampel semata -mata. Ia juga memiliki kecenderungan untuk membuat genrerasi Luc Bat ketika genre tidak ditentukan, sehingga juga skor sangat tinggi selama tes buta.
Versi OpenSource menggunakan LORA untuk Bloom-7b1 di 8bit dan dapat berjalan di Colab. Anda dapat mencobanya di sini (mungkin kehabisan memori dan macet. Dulu berjalan dengan baik, versi perpustakaan baru bertentangan banyak)
@misc { huynh2024vietnamese ,
title = { Vietnamese Poem Generation & The Prospect Of Cross-Language Poem-To-Poem Translation } ,
author = { Triet Minh Huynh and Quan Le Bao } ,
year = { 2024 } ,
eprint = { 2401.01078 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
} Proyek ini terinspirasi oleh metode evaluasi dari puisi fsoft-ailab
Dataset juga diambil dari repo mereka