Una colección de capas de abstracción y funciones de soporte que forman la base de procesamiento del lenguaje natural del proyecto Zamia AI:
phonetics : Funciones de traducción entre varios alfabetos fonéticos (IPA, X-Sampa, X-Arpabet, ...)
tts : capa de abstracción para usar espeak ng, marytts, svox pico tts o un servidor TTS remoto y Sequitur G2P
asr : Capa de abstracción para usar Kaldi-ASR y PocketsPhinx, se pueden encontrar modelos aquí: http://goofy.zamia.org/voxforge/
sequiturclient : G2P usando Sequitur
pulseplayer : reproducción de audio a través de PulseAudio
pulserecorder : grabación de audio a través de PulseAudio
tokenizer : tokenizadores de palabras en inglés, francés y alemán dirigidos a aplicaciones de idiomas hablados
threadpool : implementación simple del grupo de hilos
vad : Máquina de estado finito de detección de actividad de voz basada en WebRTC VAD
macro_engine : motor macro simple dirigido a generar expansiones del lenguaje natural
Planeo agregar módulos como los necesito en los proyectos de Zamia AI. Algunos módulos como phonetics y tokenizer tienen una superposición con proyectos más grandes como NLTK o Spacy: mis módulos tienden a ser más prácticos y simples que estos y, por lo tanto, de ninguna manera están destinados a reemplazarlos.

Nota : Probablemente incompleto.
Python 2.7
Para TTS uno o más de:
Marytts, Py-Marytts
espeak-ng, py-aspiring-ng
Svox pico tts, py-picotts
Para ASR uno o más de:
Kaldi-ASR 5.1, Py-Kaldi-asr
PocketsPhinx
Sequitur
pulseaudio
Webrtc
Mi propio código es Apache-2.0 con licencia a menos que se indique lo contrario en los encabezados de derechos de autor del script.
Algunos scripts y archivos se basan en obras de otros, en esos casos es mi intención mantener intacta la licencia original. Asegúrese de consultar los encabezados de derechos de autor para obtener más información.
Guenter Bartsch <[email protected]> Paul Guyot <[email protected]>