Загрузка ms ra forwarder кода ms ra forwarder

ms ra forwarder

AI Исходный код

1.0.0

Скачать

развертывать

Пожалуйста, обратитесь к следующему методу развертывания.

Развернуть в Vercel

~~Пожалуйста, сначала разделите копию кода и разверните ее в собственном Vercel. См. Демо -видео.~~

Развернуть на железной дороге

Железная дорога добавила 500-часовой лимит в месяц и не будет автоматически отключаться, поэтому в месяц будет период времени, который не может быть использован. Если возможно, используйте Docker для развертывания.

Развернуть в Heroku

Docker (рекомендуется)

Docker требуется.

 # 拉取镜像
docker pull wxxxcxx/ms-ra-forwarder:latest
# 运行
docker run --name ms-ra-forwarder -d -p 3000:3000 wxxxcxx/ms-ra-forwarder
# or
docker run --name ms-ra-forwarder -d -p 3000:3000 -e TOKEN:自定义TOKEN wxxxcxx/ms-ra-forwarder

# 浏览器访问 http://localhost:3000

Docker Compose

Создайте docker-compose.yml чтобы написать следующий контент и сохранить его.

 version : ' 3 '

services :
  ms-ra-forwarder :
    container_name : ms-ra-forwarder
    image : wxxxcxx/ms-ra-forwarder:latest
    restart : unless-stopped
    ports :
      - 3000:3000
    environment :
      # 不需要可以不用设置环境变量
      - TOKEN=自定义TOKEN

Выполнить docker compose up -d в каталоге docker-compose.yml .

Бежать вручную

Ручная операция требует, чтобы GIT и Nodejs были установлены заранее.

 # 获取代码
git clone https://github.com/wxxxcxx/ms-ra-forwarder.git

cd ms-ra-forwarder
# 安装依赖
npm install 
# 运行
npm run start

использовать

Импорт для чтения (Легадо)

Пожалуйста, посетите веб -сайт, который вы развернули, и после тестирования на странице нажмите «Generate Reading (Legado) ссылка голосового двигателя», а затем импортируйте его в чтение (Legado).

Позвонить вручную

Адрес интерфейса - api/ra . Формат:

 POST /api/ra
FORMAT: audio-16khz-128kbitrate-mono-mp3
Content-Type: text/plain

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="en-US">
  <voice name="zh-CN-XiaoxiaoNeural">
    如果喜欢这个项目的话请点个 Star 吧。
  </voice>
</speak>

Пользовательское произношение и тон

Запрашиваемый текст находится в формате SSML, который поддерживает пользовательские стили произношения и речи (в настоящее время только версия Azure поддерживает пользовательские стили речи). Следующие примеры и документация:

Текст на голос

Улучшить синтез с языком разметки синтеза речи (SSML)

Аудио формат

Аудио -формат по умолчанию - Webm. Если вам нужно получить аудио в других форматах, измените FORMAT заголовка запроса (доступные параметры можно просматривать в ra/index.ts).

Ограничить доступ

Если вам необходимо предотвратить неправильное использование ваших развернутых услуг, вы можете добавить TOKEN к переменной среды приложения, а затем добавить Authorization: Bearer <TOKEN> Доступ к заголовку запроса.

Другие инструкции

Официальная служба Microsoft Azure TTS в настоящее время имеет определенный бесплатный лимит. Если для вас достаточно бесплатного лимита, пожалуйста, поддержите официальную услугу.
Если вам нужно только генерировать голос для фиксированного текста, вы можете использовать создание звукового контента. Это обеспечивает более богатые функции для создания более естественных звуков.
В этом проекте используется интерфейс между Edge Browser «Читать вслух» и демонстрационные страницы Azure, и не гарантирует последующую доступность и стабильность.
Этот проект предназначен только для обучения и ссылки и не является коммерчески доступным.

Важные изменения

2023-04-19: Azure имеет автономную пробную функцию для демонстрационной страницы, которая вызвала непригодность интерфейса версии Azure. Пожалуйста, перейдите на интерфейс браузера Edge.

2022-11-18: Добавить поддержку файла словаря, см. Https://github.com/wxxxxx/azure-ts-lexicon-cn/blob/main/lexicon.xml для формата файла словаря.

2022-09-10: изменить адрес репозитория Docker, а изображение Docker, созданное позже

2022-09-01: API Azure TTS, похоже, снова изменился. Пользователи старых версий могут не использовать его обычно. Пожалуйста, обновите до последней версии.

2022-07-17: добавлена поддержка API Azure TTS (я не проверял ее, я не знаю, стабильно ли она или не использует ее). Потому что вызов Azure TTS API требует получения кода авторизации. Другие методы могут быть использованы только в течение периода времени или один раз, и Vercel необходимо повторно поместить код авторизации каждый раз, когда он называет API. Мало того, что это легко время от времени, это также увеличивает бремя на серверах Microsoft, поэтому для пользователей, которые развертывают его в Vercel (хотя его невозможно использовать ~, но если Microsoft будет ранен, и будет плохо снова изменить интерфейс?).

2022-07-02: Edge Version API API Форматы, поддерживаемые в настоящее время тестами, включают webm-24khz-16bit-mono-opu , audio-24khz-48kbitrate-mono-mp3 и audio-24khz-96kbitrate-mono-mp3 . Кроме того, начиная с сегодняшнего дня, если вы используете звук, которого нет в раскрывающемся списке, вы увидите такую ошибку, как «неподдерживаемый голос Zh-cn-Yunyenural.», И это также может быть отключено в будущем. Используйте и берегите это!

2022-07-01: Услуги, развернутые на серверах за пределами материкового Китая, в настоящее время могут выбрать аудио только в формате webm-24khz-16bit-mono-opus ! Таким образом, пользователям, которые используют Vercel, необходимо передать его.

2022-06-16: интерфейс, предоставленный браузером Edge, больше не может установить стиль речи. Если вы обнаружите, что его нельзя использовать нормально, пожалуйста, обратитесь к #12 для обновлений.

Спасибо следующим организациям/частным лицам за поддержку этого проекта

Расширять

Дополнительная информация