次の展開方法を参照してください。
最初にコードのコピーをフォークして、独自のVercelに展開してください。デモビデオを参照してください。
鉄道は月に500時間の制限を追加しており、自動的にシャットダウンされないため、毎月使用できない期間があります。可能であれば、Dockerを使用して展開します。
Dockerが必要です。
# 拉取镜像
docker pull wxxxcxx/ms-ra-forwarder:latest
# 运行
docker run --name ms-ra-forwarder -d -p 3000:3000 wxxxcxx/ms-ra-forwarder
# or
docker run --name ms-ra-forwarder -d -p 3000:3000 -e TOKEN:自定义TOKEN wxxxcxx/ms-ra-forwarder
# 浏览器访问 http://localhost:3000docker-compose.ymlを作成して、次のコンテンツを書き込み、保存します。
version : ' 3 '
services :
ms-ra-forwarder :
container_name : ms-ra-forwarder
image : wxxxcxx/ms-ra-forwarder:latest
restart : unless-stopped
ports :
- 3000:3000
environment :
# 不需要可以不用设置环境变量
- TOKEN=自定义TOKEN docker-compose.ymlディレクトリでdocker compose up -dします。
手動操作では、GITとNodeJを事前にインストールする必要があります。
# 获取代码
git clone https://github.com/wxxxcxx/ms-ra-forwarder.git
cd ms-ra-forwarder
# 安装依赖
npm install
# 运行
npm run start展開したWebサイトにアクセスし、ページでテストした後、「読み取り(Legado)Voice Engine Link」をクリックしてから、Reading(Legado)にインポートします。
インターフェイスアドレスはapi/raです。形式は次のとおりです。
POST /api/ra
FORMAT: audio-16khz-128kbitrate-mono-mp3
Content-Type: text/plain
<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="en-US">
<voice name="zh-CN-XiaoxiaoNeural">
如果喜欢这个项目的话请点个 Star 吧。
</voice>
</speak>
要求されたテキストはSSML形式で、カスタムの発音と音声スタイルをサポートしています(現在、Azureバージョンのみがカスタムスピーチスタイルをサポートしています)。以下は、関連する例とドキュメントです。
テキストから音声
音声合成マークアップ言語(SSML)で合成を改善する
デフォルトのオーディオ形式はWebmです。他の形式でオーディオを取得する必要がある場合は、リクエストヘッダーのFORMATを変更してください(利用可能なオプションはra/index.tsで表示できます)。
他の人が展開されたサービスを誤用するのを防ぐ必要がある場合は、アプリケーションの環境変数にTOKENを追加してから、 Authorization: Bearer <TOKEN>リクエストヘッダーへのアクセスを追加できます。
Microsoftの公式Azure TTSサービスには現在、一定の自由制限があります。自由制限が十分である場合は、公式サービスをサポートしてください。
固定されたテキストの音声のみを生成する必要がある場合は、オーディオコンテンツの作成を使用できます。より自然な音を生み出すためのより豊かな機能を提供します。
このプロジェクトでは、エッジブラウザの「読み取り」とAzure TTSデモページの間のインターフェイスを使用しますが、その後の可用性と安定性は保証されません。
このプロジェクトは学習と参照のみであり、市販されていません。
2023-04-19:Azureにはデモページのオフライントライアル機能があり、Azureバージョンインターフェイスが使用できなくなりました。 Edgeブラウザインターフェイスに移行してください。
2022-11-18:辞書ファイルのサポートを追加します。https://github.com/wxxxcxx/azure-tts-lexicon-cn/blob/main/lexicon.xmlを参照してください。
2022-09-10:Dockerリポジトリアドレスを変更すると、後で構築されたDocker画像がWXXXCXX/MS-RA-Forwarderに移行されます(元のリポジトリ画像の古いバージョンはまだ有効です)。
2022-09-01:Azure TTS APIは再び変更されたようです。古いバージョンのユーザーはそれを正常に使用できない場合があります。最新バージョンに更新してください。
2022-07-17:Azure TTS APIサポートを追加しました(私はそれをあまりテストしていません、それがそれを使用するかどうかはわかりません)。 Azure TTS APIを呼び出すには、承認コードを取得する必要があるためです。その他の方法は、一定期間または1回だけ使用できます。Vercelは、APIに電話するたびに承認コードを再獲得する必要があります。タイムアウトが簡単であるだけでなく、Microsoftサーバーの負担も増加するため、Vercelに展開するユーザーにはお勧めしません(ただし、Microsoftが傷つき、インターフェイスを再度変更するのが悪い場合)。
2022-07-02:エッジバージョンAPIテストで現在サポートされている形式には、 webm-24khz-16bit-mono-opu 、 audio-24khz-48kbitrate-mono-mp3 、およびaudio-24khz-96kbitrate-mono-mp3が含まれます。さらに、今日の午後から、ドロップダウンリストにないサウンドを使用する場合、「サポートされていない音声Zh-Cn-Yuneenural」などのエラーが表示されます。使用して大切にしてください!
2022-07-01:中国本土外のサーバーに展開されているサービスは、現在したがって、Vercelを使用するユーザーはそれを再展開する必要があります。webm-24khz-16bit-mono-opus形式でのみオーディオを選択できます!
2022-06-16:Edgeブラウザが提供するインターフェイスは、音声スタイルを設定できなくなりました。正常に使用できないことがわかった場合は、更新については#12を参照してください。
このプロジェクトへのサポートについて、次の組織/個人に感謝します