Eunoia-plus: Sistem Chitchhat Domain Terbuka
Eunoia-Plus adalah sistem chitchhat domain terbuka canggih yang mengintegrasikan beberapa modul AI untuk menciptakan percakapan yang dinamis, cerdas, dan alami. Sistem ini dirancang menggunakan arsitektur multi-modul, memungkinkannya untuk memahami dan menanggapi input pengguna di berbagai domain, termasuk cuaca, mata uang, dan banyak lagi.
Fitur
Arsitektur Modular : Sistem ini dibagi menjadi empat modul utama:
- Pemahaman Bahasa Alami (NLU) : Menggunakan model Roberta yang disesuaikan untuk mendeteksi maksud pengguna dan mengekstrak informasi yang diperlukan dengan akurasi tinggi.
- Validasi Intent : Model berbasis XGBoost memastikan kebenaran niat yang terdeteksi, menangani niat ambigu dan tumpang tindih secara efisien.
- Dialog State Tracking (DST) : Melacak keadaan percakapan menggunakan metode turbo berbasis aturan dan GPT-3.5, menawarkan fleksibilitas dalam manajemen aliran percakapan.
- Generasi Jawaban : Memanfaatkan model Bloom dan T5 untuk menghasilkan respons yang koheren dan sesuai kontekstual.
Dukungan untuk berbagai struktur niat : Menangani empat kategori niat:
- Bermaksud tanpa slot.
- Bermaksud dengan slot opsional.
- Maksud yang membutuhkan satu slot penting.
- Maksud yang membutuhkan beberapa slot penting.
Akurasi Tinggi : Sistem memberikan akurasi tinggi di beberapa metrik:
- Modul NLU: akurasi deteksi niat 96%, akurasi pengisian slot 97%.
- Validasi Inten: Akurasi 95%.
- Pelacakan Negara Dialog: akurasi 92% menggunakan metode berbasis aturan, dengan akurasi kontekstual yang ditingkatkan melalui metode berbasis GPT.
- Generasi Jawaban: Menghasilkan tanggapan yang relevan dengan memanfaatkan sejarah dan keadaan percakapan.
Penggunaan
- Sistem ini dibangun untuk menangani percakapan multi-giliran berdasarkan dataset domain terbuka.
- Pengguna dapat berinteraksi dengan sistem melalui baris perintah atau mengintegrasikannya ke dalam platform atau aplikasi percakapan lainnya.
- Arsitektur modular memungkinkan untuk kustomisasi yang mudah, membuatnya mudah beradaptasi dengan domain atau maksud yang berbeda.
Struktur proyek
-
nlu/ : Berisi kode untuk modul pemahaman bahasa alami dan datanya. -
api/ : Berisi kode API untuk memanggil model fine-tuned sebagai server. -
intent_validation/ : modul berbasis XGBoost untuk memvalidasi maksud yang terdeteksi. -
dst/ : Berbasis aturan dan GPT-3.5 Berbasis Implementasi Pelacakan Negara. -
answer_generation/ : Model generasi jawaban, termasuk Bloom dan T5.
Model yang digunakan
- Roberta : Untuk deteksi niat dan pengisian slot.
- XGBoost : Untuk validasi maksud dan memastikan resolusi niat yang andal.
- GPT-3.5 Turbo : Untuk pelacakan negara dialog lanjutan menggunakan beberapa pembelajaran shot.
- Bloom dan T5 : Untuk menghasilkan tanggapan yang relevan secara kontekstual.
Pertunjukan
Sistem ini telah dievaluasi menggunakan beberapa metrik utama:
- Deteksi Inten : Akurasi 96%.
- Pengisian slot : akurasi 97%.
- Validasi Inten : Akurasi 95%.
- Dialog Pelacakan Negara :
- Berbasis aturan: 92% akurasi negara.
- Berbasis GPT: Akurasi keseluruhan 69,94% (output NLU), 100% kelancaran (aliran percakapan).