Kumpulan lapisan abstraksi dan fungsi dukungan yang membentuk fondasi pemrosesan bahasa alami dari proyek Zamia AI:
phonetics : Fungsi terjemahan antara berbagai huruf fonetik (IPA, X-SAMPA, X-Arpabet, ...)
tts : Lapisan abstraksi untuk menggunakan Espeak NG, MaryTTS, SVOX PICO TTS atau server TTS jarak jauh dan Sequitur G2P
asr : Lapisan abstraksi untuk menggunakan Kaldi-Asr dan Pocketsphinx, model dapat ditemukan di sini: http://goofy.zamia.org/voxforge/
sequiturclient : G2P menggunakan Sequitur
pulseplayer : Playback Audio Melalui Pulseaudio
pulserecorder : Rekaman audio melalui pulseaudio
tokenizer : Tokenizer Kata Bahasa Inggris, Prancis dan Jerman yang ditujukan untuk aplikasi bahasa lisan
threadpool : Implementasi Pool Thread Sederhana
vad : Deteksi Aktivitas Suara Mesin Negara Terbatas Berdasarkan WebRTC VAD
macro_engine : Mesin makro sederhana yang ditujukan untuk menghasilkan ekspansi bahasa alami
Saya berencana untuk menambahkan modul karena saya membutuhkannya di proyek Zamia AI. Beberapa modul seperti phonetics dan tokenizer memiliki beberapa tumpang tindih dengan proyek yang lebih besar seperti NLTK atau Spacy - modul saya cenderung lebih berhak dan berpikiran sederhana daripada ini dan karenanya sama sekali tidak dimaksudkan untuk menggantinya.

Catatan : Mungkin tidak lengkap.
Python 2.7
untuk tts satu atau lebih dari:
Marytts, Py-Marytts
Espeak-ng, py-estas-ng
Svox pico tts, py-picotts
untuk ASR satu atau lebih dari:
Kaldi-Asr 5.1, Py-Kaldi-Asr
Pocketsphinx
Sequitur
Pulseaudio
WEBRTC
Kode saya sendiri adalah APACHE-2.0 berlisensi kecuali dinyatakan lain dalam header hak cipta skrip.
Beberapa skrip dan file didasarkan pada karya orang lain, dalam kasus -kasus itu adalah niat saya untuk menjaga lisensi asli tetap utuh. Pastikan untuk memeriksa header hak cipta di dalam untuk informasi lebih lanjut.
Guenter Bartsch <[email protected]> Paul Guyot <[email protected]>