Zamia AIプロジェクトの自然言語処理基盤を形成する抽象化層とサポート関数のコレクション:
phonetics :さまざまな音声アルファベット間の翻訳機能(IPA、X-Sampa、X-Arpabet、…)
tts :ESPEAK NG、MARYTTS、SVOX PICO TTS、またはリモートTTSサーバーとSequitTur G2Pの使用に向けた抽象化レイヤー
asr :kaldi-asrとpocketsphinxの使用に向けて抽象化レイヤーは、http://goo.zamia.org/voxforge/でモデルをご覧ください。
sequiturclient :SKITURを使用したG2P
pulseplayer :Pulseaudioを介したオーディオ再生
pulserecorder :Pulseaudioを介したオーディオ録音
tokenizer :話し言葉のアプリケーションを目的とした英語、フランス語、ドイツ語のトークンザー
threadpool :シンプルなスレッドプールの実装
vad :音声アクティビティ検出webrtc vadに基づく有限状態マシン
macro_engine :自然言語の拡張を生成することを目的としたシンプルなマクロエンジン
Zamia AIプロジェクトで必要なモジュールを追加する予定です。 phoneticsやtokenizerなどの一部のモジュールには、NLTKやスペイシーなどのより大きなプロジェクトと重複しています。私のモジュールは、これらよりも実践的でシンプルな考え方である傾向があるため、それらを置き換えることはできません。

注:おそらく不完全です。
Python 2.7
TTSの場合1つ以上:
Marytts、py-marytts
espeak-ng、py-espeak-ng
svox pico tts、py-picotts
1つ以上のASRの場合:
Kaldi-asr 5.1、py-kaldi-asr
Pocketsphinx
Stayitur
Pulseaudio
webrtc
私自身のコードは、スクリプトの著作権ヘッダーに特に明記されていない限り、Apache-2.0のライセンスです。
一部のスクリプトとファイルは、他の作品の作品に基づいています。そのような場合、元のライセンスをそのまま維持することが私の意図です。詳細については、内部の著作権ヘッダーを確認してください。
Guenter bartsch <[email protected]> Paul Guyot <[email protected]>