RasaのResponses.ymlファイル形式を使用して、Replica StudiosのAI Voices APIを使用してダイアログオーディオファイルを自動生成します。
クリエイティブチャットボットプロジェクトで使用しているテキストダイアログのオーディオファイルを生成して、コードが「現実的」、おそらくユニークな音声で「話す」ことができるようにします。
このユーティリティスタンドアロン、またはRASAプロジェクトフォルダー内で使用できます。
彼らのウェブサイトを引用するには:
AI Games + FilmsのVoice Actors
それはすべて、才能のある声優が私たちのAIの演奏方法を訓練する時間を費やすことから始まります。私たちのAIモデルは、本物の音声俳優をコピーする方法を学びます。最終結果は、ゲームや映画で使用できるAIの声優です。
彼らのウェブサイトを引用するには:
Rasaは、大規模なパーソナライズされた会話のための、主要な会話型AIプラットフォームです。
RASAオープンソースは、自然言語の理解、対話管理、統合のためのフレームワークです。 Rasa Xは、RASAオープンソースを使用して構築された仮想アシスタントを改善するために使用される無料のツールセットです。一緒に、強力なテキストおよび音声ベースのアシスタントとチャットボットを作成するためのすべての機能が含まれています。
このユーティリティは、GNU General Public License v3.0の下で配布されています。これは、ファイルlicence.txtにあります。要約すれば:
この強力なコピーレフトライセンスの許可は、同じライセンスの下で、ライセンスされた作業を使用した大規模な作品を含む、ライセンス作業と修正の完全なソースコードを利用可能にすることを条件としています。著作権とライセンス通知を保存する必要があります。貢献者は、特許権の明示的な助成金を提供します。
まず、レプリカスタジオを使用してアカウントが必要です。 2021年7月の時点で、サインアップ時に30分間の無料クレジットが得られます。次の紹介リンクを使用すると、60分かかります。
https://replicastudios.com/account/signup?referral_code=xe07evdx
アクティブなアカウントを取得したら、ダイアログ生成スクリプトがAPIに対して認証できるように、クレデンシャルをローカルファイルに入れてください。
# replica_api_credentials.json
{
"client_id" : "<your replica username>",
"secret" : "<your replica password>"
}
(注: replica_api_credentials.json 、gitリポジトリに追加またはプッシュされるべきではなく、デフォルトでは.gitignoreで無視されます。)
次に、音声の名前とレプリカUIDを指定してオーディオファイルを生成する必要があります。これが例です:
# replica_config.json
{
"replica_voice_uids" : {
"amber" : "4807ea95-5b17-43b7-b25d-e409736a099f",
"thomas" : "c7c81053-7ac3-4b2f-9809-0be6fae07ca5"
}
}
執筆時点(2021年7月)では、音声を選択するときにレプリカのWebサイトプロジェクトページのソースを表示することにより、UIDを取得することのみが可能です。
dialogフォルダーと現在/プロジェクトフォルダーにresponses.ymlファイルが必要で、生成するダイアログを定義します。
mkdir dialog
RASA V2ドキュメントから取得した単純な例responses.yml次のとおりです。
# ./dialog/responses.yml
---
version: "2.0"
responses:
utter_greet:
- text: "Hi there!"
utter_bye:
- text: "See you!"
Python仮想環境(VENV)を作成し、 requirements.txtで定義されたパッケージ依存関係をインストールします。txt:
python3 -m venv ./venv
source ./venv/bin/activate
pip3 install -r requirements.txt
ここまでそれを作成した場合は、 ./dialog/responses.yml responses.ymlのすべてのダイアログを使用して、それぞれのOGGオーディオファイルを生成しようとするgenerate_dialog.pyを実行できるようになりました( replica_config.jsonで指定した最初の音声を使用):
python generate_dialog.py
問題: ModuleNotFoundError 、例えば「リクエスト」:
% python generate_dialog.py
Traceback (most recent call last):
File "generate_dialog.py", line 1, in <module>
import requests
ModuleNotFoundError: No module named 'requests'
解決策:PIP3(上記のように)を使用してdepdendenciesをインストールしたことを確認してください。その後、実行前に(再)venvをアクティブにしました。
source ./venv/bin/activate
python generate_dialog.py
バグを見つけましたか?問題を提起することを検討してください:
これにより、調査できる貢献者に通知し、通常、問題について応答し、その過程でお客様に通知する必要があります。
新機能を追加したり、既存のバグを修正したい場合は、お気軽にお問い合わせください!
これに従うべきプロセスの要約は次のとおりです。
あなたが何に取り組むか、そしてその理由を説明する問題が存在することを確認してください。そうでない場合は、新しい問題を送信して、「バグ」などでラベルを付けます。
このリポジトリ(Repo)の新しいブランチを作成します。これには、貢献の実装が含まれ、問題番号は支店名にあります。
git checkout -b 123-name-of-your-new-branch
(ここで、「123」は問題番号です);
git add .
git commit -m "fixed a bug"
git push origin 123-name-of-your-new-branch
これにより、レビューを開始し、GitHubを介してお客様と通信できるプロジェクト所有者に通知する必要があります。