Uma coleção de camadas de abstração e funções de suporte que formam a base de processamento de linguagem natural do projeto Zamia AI:
phonetics : Funções de tradução entre vários alfabetos fonéticos (IPA, X-Sampa, X-Arpabet,…)
tts : Camada de abstração para usar Espeak Ng, Marytts, Svox Pico TTS ou um servidor TTS remoto e sequitur G2P
asr : Camada de abstração para usar Kaldi-ASR e Pocketsphinx, os modelos podem ser encontrados aqui: http://goofy.zamia.org/voxforge/
sequiturclient : G2P usando sequitur
pulseplayer : reprodução de áudio através de pulseaudio
pulserecorder : gravação de áudio através de pulseaudio
tokenizer : Tokenizers de palavras em inglês, francês e alemão
threadpool : implementação simples do pool de threads
vad : Máquina de Estado Finito de Detecção de Atividades de Voz com base no WebRTC Vad
macro_engine : Macro simples com o objetivo de gerar expansões de linguagem natural
Eu pretendo adicionar módulos como preciso deles nos projetos Zamia AI. Alguns módulos como phonetics e tokenizer têm alguma sobreposição de projetos maiores, como NLTK ou Spacy - meus módulos tendem a ser mais práticos e simples que estes e, portanto, não devem substituí -los.

Nota : Provavelmente incompleto.
Python 2.7
para TTS um ou mais de:
Marytts, Py-Marytts
Espeak-ng, py-espinhando-ng
Svox pico tts, py-picotts
para ASR um ou mais de:
KALDI-ASR 5.1, PY-KALDI-ASR
Pocketsphinx
Sequitur
pulseaudio
webrtc
Meu próprio código é licenciado Apache-2.0, a menos que indicado de outra forma nos cabeçalhos de direitos autorais do script.
Alguns scripts e arquivos são baseados em obras de outros; nesses casos, é minha intenção manter intacta a licença original. Verifique os cabeçalhos de direitos autorais para mais informações.
Guenter Bartsch <[email protected]> Paul Guyot <[email protected]>