构成Zamia AI项目的自然语言处理基础的抽象层和支持功能的集合:
phonetics :各种语音字母之间的翻译功能(IPA,X-Sampa,X-arpabet,…)
tts :用于使用ESPEAK NG,MARYTTS,SVOX PICO TTS或远程TTS服务器和Sequitur G2P的抽象层
asr :用于使用kaldi-asr和pocketsphinx的抽象层,可以在此处找到:http://goofy.zamia.org/voxforge/
sequiturclient :使用sequitur的G2P
pulseplayer :通过Pulseaudio播放音频
pulserecorder :通过脉冲记录的音频记录
tokenizer :针对口语应用的英语,法语和德语单词Tokenizer
threadpool :简单的线程池实现
vad :基于WEBRTC VAD的语音活动检测有限状态机器
macro_engine :旨在生成自然语言扩展的简单宏引擎
我计划在Zamia AI项目中需要添加模块,因为它们需要它们。一些模块(例如phonetics和tokenizer与NLTK或SPACY(例如NLTK或Spacy)的较大项目有一些重叠 - 我的模块往往比这些模块更动手和简单,因此绝不意味着要替代它们。

注意:可能不完整。
Python 2.7
对于TTS,一个或多个:
Marytts,Py-Marytts
Espeak-ng,py-epepeak-ng
svox pico tts,py-picotts
对于ASR一个或多个:
Kaldi-ASR 5.1,PY-KALDI-ASR
Pocketsphinx
序列
脉冲
webrtc
除非脚本的版权标题中另有说明,否则我自己的代码是Apache-2.0许可。
某些脚本和文件是基于其他脚本的作品,在这种情况下,我打算保持原始许可完整。请确保检查内部的版权标题以获取更多信息。
Guenter Bartsch <[email protected]> Paul Guyot <[email protected]>