Eine Sammlung von Abstraktionsebenen und Unterstützungsfunktionen, die die Fundament der natürlichen Sprachverarbeitung des Zamia AI -Projekts bilden:
phonetics : Übersetzungsfunktionen zwischen verschiedenen phonetischen Alphabeten (IPA, X-Sampa, X-Arpabet,…)
tts : Abstraktionsschicht zur Verwendung von ESPEAK NG, MARYTTS, SVOX PICO TTS oder einem Remote -TTS -Server und Sequitur G2P
asr : Abstraktionschicht zur Verwendung von Kaldi-ASR und Taschensphinx. Modelle finden Sie hier: http://goofy.zamia.org/voxforge/
sequiturclient : g2p mit sequitur
pulseplayer : Audio -Wiedergabe durch Pulseaudio
pulserecorder : Audioaufzeichnung durch Pulseaudio
tokenizer : Englisch, französische und deutsche Wort Tokenisierer, die auf gesprochene Sprachanwendungen abzielten
threadpool : Einfacher Threadpool -Implementierung
vad : Sprachaktivitätserkennung Finite -Status -Maschine basierend auf WEBRTC VAD
macro_engine : Einfache Makro -Engine, die darauf abzielt, natürliche Spracherweiterungen zu erzeugen
Ich habe vor, Module hinzuzufügen, da ich sie in den Zamia -AI -Projekten brauche. Einige Module wie phonetics und tokenizer überlappen sich mit größeren Projekten wie NLTK oder Spacy - meine Module sind in der Regel praktischer und einfacher als diese und sind daher in keiner Weise, sie zu ersetzen.

Hinweis : Wahrscheinlich unvollständig.
Python 2.7
Für TTS eine oder mehrere von:
Marytts, Py-Marytts
espeak-ng, py-espeak-ng
Svox Pico Tts, Py-Picotts
für ASR eine oder mehrere von:
Kaldi-Asr 5.1, Py-Kaldi-Asr
Taschesphin
Sequitur
Pulsaudio
webrtc
Mein eigener Code ist apache-2.0 lizenziert, sofern in den Urheberrechtsüberschriften des Skripts nicht anders angegeben.
Einige Skripte und Dateien basieren auf Werken anderer. In diesen Fällen ist es meine Absicht, die ursprüngliche Lizenz intakt zu halten. Bitte überprüfen Sie die Copyright -Header im Inneren, um weitere Informationen zu erhalten.
Guenter Bartsch <[email protected]> Paul Guyot <[email protected]>