TTS-STTはPython&Flask Powerdであり、簡単に使用できるシステムで、テキストをスピーチまたは音声にテキストに変換してテキストに変換します。
TTS(テキストからスピーチ)機能はReverso翻訳のおかげで無料ですが、テキストへのスピーチへの機能には、有効な請求アカウントを備えたアクティブなGoogle APIクラウドアカウントが必要です(価格表はこちらにあります)。
私が述べたように、Googleの音声認識を使用するには、Googleアプリケーションを作成してAPIを有効にする必要があります。プログラムをGoogleスピーチツーテキストAPIと統合するために必要な手順を次に示します。
Google APIにアクセスするために最初に必要なのは、GoogleアカウントとGoogleアプリケーションを作成することです。 Googleコンソール:Googleコンソールに移動すると、Googleアプリケーションを作成できます。
Googleコンソールを開いたら、上部のドロップダウンをクリックします。このドロップダウンは、既存のGoogleアプリケーションを表示しています。クリックすると、ポップアップが表示され、「新しいプロジェクト」をクリックします。


次に、アプリケーション名を入力し、[作成]をクリックします。
Googleアプリケーションを作成したら、「Google Cloud Speech-tostex」APIへのアプリケーションアクセスを許可する必要があります。これを行うには、アプリケーションダッシュボードに移動し、そこからAPISの概要に移動します。以下のアクセス方法を参照してください:

「APIとサービスを有効にする」をクリックしてから、「Speech」で検索し、テキストを使用するすべてのGoogle APIがリストされます。


[enable]をクリックします。有効になると、「Google Cloud Speech to Text API」にアクセスするために、アプリケーションに権限を付与します。
次のステップは、Google資格情報をダウンロードすることです。資格情報は必要なので、Googleはアプリケーションを認証できるため、GoogleはAPIがあなたからアクセスされていることを知っています。このようにして、彼らはあなたが彼らのAPIをどれだけ使用しているかを測定し、消費がフリーしきい値を通過した場合にあなたに充電することができます。
Google資格情報をダウンロードする手順は次のとおりです。まず、ホームダッシュボードから、「APISの概要に移動する」ようになり、前と同じように、左側のメニューで、資格情報をクリックします。

次に、「資格情報の作成」をクリックし、「サービスアカウント」を作成します。

好きなサービスアカウント名を入力し、[作成]をクリックします。オプションでは、プロジェクトへのサービスアカウントアクセスを許可し、[完了]をクリックできます。

次に、作成したばかりのサービスアカウントをクリックします。最後のクリックでは、サービスアカウントの詳細に移動します。

「キー」セクションに移動し、「キーの追加」をクリックして「新しいキーを作成」します。これにより、新しいキーが作成されます。このキーは、サービスアカウントを介してアプリケーションに関連付けられています。

ポップアップで、JSONを選択し、[create]をクリックします。これにより、マシンのキーを含むJSONファイルがダウンロードされます。次に必要なので、このファイルを保存する場所をメモしてください。

version : " 3.7 "
services :
tts-stt :
image : techblog/tts-stt:latest
ports :
- " 8080:8080 "
container_name : tts-stt
labels :
- " com.ouroboros.enable=true "
networks :
- default
volumes :
- ./ttstt/keys/key-file.json:/opt/ttstt/keys/key-file.json
- /etc/localtime:/etc/localtime:ro
restart : unless-stopped「key-file.json」名前は必須です(変更できません)。これは、ステップ3で作成およびダウンロードしたキーファイルです。
次に、 docker-copmose up -dを実行して、コンテナを引っ張って実行します。ブラウザを開き、コンテナIPアドレスWIEH PORT 8080にネビゲートすると、次の画面が表示されます。 