مجموعة من طبقات التجريد ووظائف الدعم التي تشكل أساس معالجة اللغة الطبيعية لمشروع Zamia AI:
phonetics : وظائف الترجمة بين الحروف الهجائية الصوتية المختلفة (IPA ، X-Sampa ، X-ARPABET ، ...)
tts : طبقة التجريد نحو استخدام Espeak NG أو Marytts أو SVOX Pico TTS أو خادم TTS عن بُعد و Sequitur G2P
asr : طبقة التجريد نحو استخدام Kaldi-ASR و Abocketsphinx ، يمكن العثور على النماذج هنا: http://goofy.zamia.org/voxforge/
sequiturclient : G2P باستخدام Sequitur
pulseplayer : تشغيل الصوت من خلال Pulseaudio
pulserecorder : تسجيل الصوت من خلال Pulseaudio
tokenizer : المميزات الإنجليزية والفرنسية والألمانية تهدف إلى تطبيقات اللغة المنطوقة
threadpool : تطبيق تجمع مؤشراتيد بسيط
vad : آلة الحالة المحدودة للكشف عن النشاط الصوتي على أساس WEBRTC VAD
macro_engine : محرك ماكرو بسيط يهدف إلى توليد توسعات اللغة الطبيعية
أخطط لإضافة وحدات لأنني في حاجة إليها في مشاريع Zamia AI. تتداخل بعض الوحدات النمطية مثل phonetics والرمز tokenizer مع مشاريع أكبر مثل NLTK أو Spacy - تميل وحداتاتي إلى أن تكون أكثر عملية وبسيطة من هذه المشاريع ، وبالتالي فهي لا تهدف إلى استبدالها بأي حال من الأحوال.

ملاحظة : ربما غير مكتمل.
بيثون 2.7
ل TTS واحد أو أكثر من:
Marytts ، Py-Marytts
ESPEAK-NG ، PY-SEPEAK-NG
svox pico tts ، py-picotts
ل ASR واحد أو أكثر من:
Kaldi-Asr 5.1 ، Py-Kaldi-Asr
جيوبسفينس
Sequitur
Pulseaudio
Webrtc
الكود الخاص بي هو Apache-2.0 مرخصة ما لم يذكر خلاف ذلك في رؤوس حقوق الطبع والنشر للنص.
تعتمد بعض البرامج النصية والملفات على أعمال أخرى ، وفي هذه الحالات ، أعتزم الحفاظ على الترخيص الأصلي سليمًا. يرجى التأكد من التحقق من رؤوس حقوق الطبع والنشر في الداخل لمزيد من المعلومات.
Guenter Bartsch <[email protected]> Paul Guyot <[email protected]>