Zamia AI 프로젝트의 자연 언어 처리 재단을 형성하는 추상화 계층 및 지원 기능 모음 :
phonetics : 다양한 발음 알파벳 사이의 번역 기능 (IPA, X-Sampa, X-Arpabet,…)
tts : Espeak NG, Marytts, Svox Pico TTS 또는 원격 TTS 서버 및 시설 G2P 사용에 대한 추상화 레이어
asr : Kaldi-ASR 및 PocketSphinx를 사용하기위한 추상화 레이어, 모델은 여기에서 찾을 수 있습니다 : http://goofy.zamia.org/voxforge/
sequiturclient : 세력을 사용한 G2P
pulseplayer : Pulseaudio를 통한 오디오 재생
pulserecorder : Pulseaudio를 통한 오디오 녹음
tokenizer : 영어, 프랑스어 및 독일어 및 독일어 단어 토 케네이저는 음성 언어 응용 프로그램을 목표로합니다.
threadpool : 간단한 스레드 풀 구현
vad : WEBRTC VAD를 기반으로 한 음성 활동 감지 유한 상태 기계
macro_engine : 자연어 확장 생성을 목표로하는 간단한 매크로 엔진
Zamia AI 프로젝트에서 필요한 모듈을 추가 할 계획입니다. phonetics 및 tokenizer 와 같은 일부 모듈은 NLTK 또는 Spacy와 같은 더 큰 프로젝트와 겹치는 일부 모듈이 있습니다. 내 모듈은 이보다 더 실습적이고 단순한 마음을 사로 잡는 경향이 있으므로이를 대체 할 수 없습니다.

참고 : 아마도 불완전합니다.
파이썬 2.7
하나 이상의 TTS의 경우 :
Marytts, Py-Marytts
espeak-ng, py-speak-ng
svox pico tts, py-picotts
ASR 하나 이상의 경우 :
Kaldi-Asr 5.1, Py-Kaldi-Asr
Pocketsphinx
격리
Pulseaudio
Webrtc
내 자신의 코드는 스크립트의 저작권 헤더에 달리 명시되지 않는 한 Apache-2.0 라이센스가 부여됩니다.
일부 스크립트와 파일은 다른 스크립트의 작품을 기반으로하며,이 경우 원래 라이센스를 그대로 유지하려는 의도입니다. 자세한 내용은 내부에 저작권 헤더를 확인하십시오.
Guenter Bartsch <[email protected]> Paul Guyot <[email protected]>