Коллекция слоев абстракции и функций поддержки, которые формируют основу по обработке естественного языка проекта Zamia AI:
phonetics : функции перевода между различными фонетическими алфавитами (IPA, X-Sampa, X-Arpabet,…)
tts : слой абстракции для использования Espeak Ng, Marytts, Svox pico TTS или удаленного сервера TTS и Sequitur G2P
asr : Abstraction Layer для использования Kaldi-ASR и PocketSphinx, модели можно найти здесь: http://goofy.zamia.org/voxforge/
sequiturclient : G2P с использованием sequitur
pulseplayer : воспроизведение аудио через PulseAudio
pulserecorder : аудиозапись через PulseAudio
tokenizer : английские, французские и немецкие токенизаторы слов, направленные на приложения разговорного языка
threadpool : простая реализация пула потоков
vad : Обнаружение голосовой активности конечная машина на основе WEBRTC VAD
macro_engine : простой макро -двигатель, направленный на создание расширения естественного языка
Я планирую добавить модули, поскольку они мне нужны в проектах Zamia AI. Некоторые модули, такие как phonetics и tokenizer имеют некоторое совпадение с более крупными проектами, такими как NLTK или Spacy - мои модули, как правило, являются более практичными и простыми, чем они, и поэтому никоим образом не предназначены для их замены.

Примечание : вероятно, неполный.
Python 2.7
для ТТ один или несколько из:
Мэриттс, Пи-Мариттс
Espeak-ng, py-epeak-ng
Svox pico tts, py-picotts
для ASR один или несколько из:
Kaldi-ASR 5.1, Py-Kaldi-Asr
Pocketsphinx
Sequitur
Pulseaudio
webrtc
Мой собственный код-Apache-2.0 лицензирован, если не указано иное в заголовках авторских прав сценария.
Некоторые сценарии и файлы основаны на работах других, в этих случаях я намерен сохранить исходную лицензию нетронутой. Пожалуйста, не забудьте проверить заголовки авторских прав внутри для получения дополнительной информации.
Guenter Bartsch <[email protected]> Пол Гайот <[email protected]>