構成Zamia AI項目的自然語言處理基礎的抽象層和支持功能的集合:
phonetics :各種語音字母之間的翻譯功能(IPA,X-Sampa,X-arpabet,…)
tts :用於使用ESPEAK NG,MARYTTS,SVOX PICO TTS或遠程TTS服務器和Sequitur G2P的抽象層
asr :用於使用kaldi-asr和pocketsphinx的抽象層,可以在此處找到:http://goofy.zamia.org/voxforge/
sequiturclient :使用sequitur的G2P
pulseplayer :通過Pulseaudio播放音頻
pulserecorder :通過脈衝記錄的音頻記錄
tokenizer :針對口語應用的英語,法語和德語單詞Tokenizer
threadpool :簡單的線程池實現
vad :基於WEBRTC VAD的語音活動檢測有限狀態機器
macro_engine :旨在生成自然語言擴展的簡單宏引擎
我計劃在Zamia AI項目中需要添加模塊,因為它們需要它們。一些模塊(例如phonetics和tokenizer與NLTK或SPACY(例如NLTK或Spacy)的較大項目有一些重疊 - 我的模塊往往比這些模塊更動手和簡單,因此絕不意味著要替代它們。

注意:可能不完整。
Python 2.7
對於TTS,一個或多個:
Marytts,Py-Marytts
Espeak-ng,py-epepeak-ng
svox pico tts,py-picotts
對於ASR一個或多個:
Kaldi-ASR 5.1,PY-KALDI-ASR
Pocketsphinx
序列
脈衝
webrtc
除非腳本的版權標題中另有說明,否則我自己的代碼是Apache-2.0許可。
某些腳本和文件是基於其他腳本的作品,在這種情況下,我打算保持原始許可完整。請確保檢查內部的版權標題以獲取更多信息。
Guenter Bartsch <[email protected]> Paul Guyot <[email protected]>