ms ra forwarderダウンロード-MS ms ra forwarderソースコードダウンロード

ms ra forwarder

AI ソースコード

1.0.0

ダウンロード

展開する

次の展開方法を参照してください。

Vercelに展開します

~~最初にコードのコピーをフォークして、独自のVercelに展開してください。デモビデオを参照してください。~~

鉄道に展開します

鉄道は月に500時間の制限を追加しており、自動的にシャットダウンされないため、毎月使用できない期間があります。可能であれば、Dockerを使用して展開します。

Herokuに展開します

Docker（推奨）

Dockerが必要です。

 # 拉取镜像
docker pull wxxxcxx/ms-ra-forwarder:latest
# 运行
docker run --name ms-ra-forwarder -d -p 3000:3000 wxxxcxx/ms-ra-forwarder
# or
docker run --name ms-ra-forwarder -d -p 3000:3000 -e TOKEN:自定义TOKEN wxxxcxx/ms-ra-forwarder

# 浏览器访问 http://localhost:3000

Dockerは作曲します

docker-compose.ymlを作成して、次のコンテンツを書き込み、保存します。

 version : ' 3 '

services :
  ms-ra-forwarder :
    container_name : ms-ra-forwarder
    image : wxxxcxx/ms-ra-forwarder:latest
    restart : unless-stopped
    ports :
      - 3000:3000
    environment :
      # 不需要可以不用设置环境变量
      - TOKEN=自定义TOKEN

docker-compose.ymlディレクトリでdocker compose up -dします。

手動で実行します

手動操作では、GITとNodeJを事前にインストールする必要があります。

 # 获取代码
git clone https://github.com/wxxxcxx/ms-ra-forwarder.git

cd ms-ra-forwarder
# 安装依赖
npm install 
# 运行
npm run start

使用

読むためにインポート（gemado）

展開したWebサイトにアクセスし、ページでテストした後、「読み取り（Legado）Voice Engine Link」をクリックしてから、Reading（Legado）にインポートします。

手動で電話してください

インターフェイスアドレスはapi/raです。形式は次のとおりです。

 POST /api/ra
FORMAT: audio-16khz-128kbitrate-mono-mp3
Content-Type: text/plain

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="en-US">
  <voice name="zh-CN-XiaoxiaoNeural">
    如果喜欢这个项目的话请点个 Star 吧。
  </voice>
</speak>

カスタムの発音とトーン

要求されたテキストはSSML形式で、カスタムの発音と音声スタイルをサポートしています（現在、Azureバージョンのみがカスタムスピーチスタイルをサポートしています）。以下は、関連する例とドキュメントです。

テキストから音声

音声合成マークアップ言語（SSML）で合成を改善する

オーディオ形式

デフォルトのオーディオ形式はWebmです。他の形式でオーディオを取得する必要がある場合は、リクエストヘッダーのFORMATを変更してください（利用可能なオプションはra/index.tsで表示できます）。

アクセスを制限します

他の人が展開されたサービスを誤用するのを防ぐ必要がある場合は、アプリケーションの環境変数にTOKENを追加してから、 Authorization: Bearer <TOKEN>リクエストヘッダーへのアクセスを追加できます。

その他の指示

Microsoftの公式Azure TTSサービスには現在、一定の自由制限があります。自由制限が十分である場合は、公式サービスをサポートしてください。
固定されたテキストの音声のみを生成する必要がある場合は、オーディオコンテンツの作成を使用できます。より自然な音を生み出すためのより豊かな機能を提供します。
このプロジェクトでは、エッジブラウザの「読み取り」とAzure TTSデモページの間のインターフェイスを使用しますが、その後の可用性と安定性は保証されません。
このプロジェクトは学習と参照のみであり、市販されていません。

重要な変更

2023-04-19：Azureにはデモページのオフライントライアル機能があり、Azureバージョンインターフェイスが使用できなくなりました。 Edgeブラウザインターフェイスに移行してください。

2022-11-18：辞書ファイルのサポートを追加します。https://github.com/wxxxcxx/azure-tts-lexicon-cn/blob/main/lexicon.xmlを参照してください。

2022-09-10：Dockerリポジトリアドレスを変更すると、後で構築されたDocker画像がWXXXCXX/MS-RA-Forwarderに移行されます（元のリポジトリ画像の古いバージョンはまだ有効です）。

2022-09-01：Azure TTS APIは再び変更されたようです。古いバージョンのユーザーはそれを正常に使用できない場合があります。最新バージョンに更新してください。

2022-07-17：Azure TTS APIサポートを追加しました（私はそれをあまりテストしていません、それがそれを使用するかどうかはわかりません）。 Azure TTS APIを呼び出すには、承認コードを取得する必要があるためです。その他の方法は、一定期間または1回だけ使用できます。Vercelは、APIに電話するたびに承認コードを再獲得する必要があります。タイムアウトが簡単であるだけでなく、Microsoftサーバーの負担も増加するため、Vercelに展開するユーザーにはお勧めしません（ただし、Microsoftが傷つき、インターフェイスを再度変更するのが悪い場合）。

2022-07-02：エッジバージョンAPIテストで現在サポートされている形式には、 webm-24khz-16bit-mono-opu 、 audio-24khz-48kbitrate-mono-mp3 、およびaudio-24khz-96kbitrate-mono-mp3が含まれます。さらに、今日の午後から、ドロップダウンリストにないサウンドを使用する場合、「サポートされていない音声Zh-Cn-Yuneenural」などのエラーが表示されます。使用して大切にしてください！

2022-07-01：~~中国本土外のサーバーに展開されているサービスは、現在webm-24khz-16bit-mono-opus形式でのみオーディオを選択できます！~~したがって、Vercelを使用するユーザーはそれを再展開する必要があります。

2022-06-16：Edgeブラウザが提供するインターフェイスは、音声スタイルを設定できなくなりました。正常に使用できないことがわかった場合は、更新については＃12を参照してください。

このプロジェクトへのサポートについて、次の組織/個人に感謝します

拡大する

追加情報