Une collection de couches d'abstraction et de fonctions de support qui forment la fondation de traitement du langage naturel du projet Zamia AI:
phonetics : fonctions de traduction entre divers alphabets phonétiques (IPA, X-Sampa, X-Arpabet,…)
tts : calque d'abstraction vers l'utilisation de l'escalade, Marytts, Svox Pico TTS ou un serveur TTS distant et Sequitur G2P
asr : couche d'abstraction vers l'utilisation de kaldi-asr et de pochetsphinx, les modèles peuvent être trouvés ici: http://goofy.zamia.org/voxforge/
sequiturclient : G2P Utilisation de Sequitur
pulseplayer : lecture audio via Pulseaudio
pulserecorder : enregistrement audio via Pulseaudio
tokenizer : Tokenisers de mots anglais, français et allemand visant les applications en langue parlée
threadpool : Implémentation de pool de thread simple
vad : Machine d'état finie de détection d'activité vocale basée sur webrtc VAD
macro_engine : moteur macro simple visant à générer des extensions de langage naturel
J'ai l'intention d'ajouter des modules car j'en ai besoin dans les projets Zamia AI. Certains modules comme phonetics et tokenizer ont un certain chevauchement avec des projets plus grands comme NLTK ou Spacy - mes modules ont tendance à être plus pratiques et simples que ceux-ci et ne sont donc en aucun cas censés les remplacer.

Remarque : probablement incomplet.
Python 2.7
Pour TTS un ou plusieurs de:
Marytts, py-marytts
Espeak-ng, py-espeak-ng
Svox Pico TTS, Py-Picotts
Pour ASR un ou plusieurs de:
Kaldi-ASR 5.1, Py-Kaldi-ASR
pochetsphinx
séquestre
pullaudio
webrtc
Mon propre code est Apache-2.0 sous licence, sauf indication contraire dans les en-têtes de copyright du script.
Certains scripts et fichiers sont basés sur des travaux d'autres, dans ces cas, j'ai l'intention de garder la licence d'origine intacte. Veuillez vous assurer de vérifier les en-têtes des droits d'auteur à l'intérieur pour plus d'informations.
Guenter Bartsch <[email protected]> Paul Guyot <[email protected]>