ms ra forwarder Download - ms ra forwarder Código Fonte Download

ms ra forwarder

Código-Fonte de IA

1.0.0

Baixar

implantar

Consulte o seguinte método de implantação.

Implantar para vercel

~~Por favor, faça uma cópia do código primeiro e implante -a em seu próprio vercel. Consulte o vídeo de demonstração.~~

Implantar para a ferrovia

A Railway adicionou um limite de 500 horas por mês e não será desligado automaticamente; portanto, haverá um período de tempo a cada mês que não pode ser usado. Se possível, use o Docker para implantar.

Implantar para Heroku

Docker (recomendado)

Docker é necessário.

 # 拉取镜像
docker pull wxxxcxx/ms-ra-forwarder:latest
# 运行
docker run --name ms-ra-forwarder -d -p 3000:3000 wxxxcxx/ms-ra-forwarder
# or
docker run --name ms-ra-forwarder -d -p 3000:3000 -e TOKEN:自定义TOKEN wxxxcxx/ms-ra-forwarder

# 浏览器访问 http://localhost:3000

Docker compor

Crie docker-compose.yml para escrever o seguinte conteúdo e salvá-lo.

 version : ' 3 '

services :
  ms-ra-forwarder :
    container_name : ms-ra-forwarder
    image : wxxxcxx/ms-ra-forwarder:latest
    restart : unless-stopped
    ports :
      - 3000:3000
    environment :
      # 不需要可以不用设置环境变量
      - TOKEN=自定义TOKEN

Execute docker compose up -d no diretório docker-compose.yml .

Correr manualmente

A operação manual exige que o GIT e o NodeJs sejam instalados com antecedência.

 # 获取代码
git clone https://github.com/wxxxcxx/ms-ra-forwarder.git

cd ms-ra-forwarder
# 安装依赖
npm install 
# 运行
npm run start

usar

Importar para ler (LEGADO)

Visite o site que você implantou e, depois de testar na página, clique em "Gerente o link do mecanismo de voz de leitura (LEGADO)" e, em seguida, importá -lo na leitura (LEGADO).

Ligue manualmente

O endereço da interface é api/ra . O formato é:

 POST /api/ra
FORMAT: audio-16khz-128kbitrate-mono-mp3
Content-Type: text/plain

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="en-US">
  <voice name="zh-CN-XiaoxiaoNeural">
    如果喜欢这个项目的话请点个 Star 吧。
  </voice>
</speak>

Pronúncia e tom personalizados

O texto solicitado está no formato SSML, que suporta estilos de pronúncia e fala personalizados (atualmente apenas a versão do Azure suporta estilos de fala personalizados). Os seguintes são exemplos e documentação relacionados:

Texto para voz

Melhorar a síntese com a linguagem de marcação de síntese de fala (SSML)

Formato de áudio

O formato de áudio padrão é o WebM. Se você precisar obter áudio em outros formatos, modifique FORMAT do cabeçalho da solicitação (as opções disponíveis podem ser visualizadas em ra/index.ts).

Restringir o acesso

Se você precisar impedir que outras pessoas usem mal seus serviços implantados, poderá adicionar TOKEN à variável de ambiente do aplicativo e adicionar Authorization: Bearer <TOKEN> Acesso ao cabeçalho da solicitação.

Outras instruções

Atualmente, o Serviço Official do Azure TTS do Azure tem um certo limite livre. Se o limite livre for suficiente para você, apoie o serviço oficial.
Se você precisar gerar voz para texto fixo, poderá usar a criação de conteúdo de áudio. Ele fornece recursos mais ricos para gerar sons mais naturais.
Este projeto usa a interface entre o navegador de borda "Read em voz alta" e as páginas de demonstração do Azure TTS, e não garante a disponibilidade e estabilidade subsequentes.
Este projeto é apenas para aprender e referência e não está disponível comercialmente.

Mudanças importantes

2023-04-19: O Azure tem função de teste offline para a página de demonstração, que fez com que a interface da versão do Azure fosse inutilizável. Por favor, migre para a interface do navegador Edge.

2022-11-18: Adicione suporte ao arquivo de dicionário, consulte https://github.com/wxxxcxx/azure-tts-lelicon-cn/blob/main/lexicon.xml para formato de arquivo de dicionário.

2022-09-10: Modifique o endereço do repositório do Docker, e a imagem do Docker construída posteriormente será migrada para WXXXCXX/MS-RA-Forwer (a versão antiga da imagem do repositório original ainda é válida).

2022-09-01: A API do Azure TTS parece ter sido alterada novamente. Os usuários da versão mais antiga podem não ser capazes de usá -lo normalmente. Por favor, atualize a versão mais recente.

2022-07-17: Adicionado suporte da API do Azure TTS (eu não testei muito, não sei se é estável ou não para usá-lo). Porque chamar a API do Azure TTS exige a obtenção do código de autorização. Outros métodos podem ser usados por apenas um período de tempo ou uma vez, e Vercel precisa re-obter novamente o código de autorização toda vez que ele chama a API. Não é apenas fácil passar o tempo, mas também aumenta o ônus dos servidores da Microsoft, por isso não é recomendado para usuários que o implantam no vercel (embora não seja impossível usá -lo ~, mas se a Microsoft estiver ferida e será ruim alterar a interface novamente?).

2022-07-02: API da versão de borda Os formatos atualmente suportados por testes incluem webm-24khz-16bit-mono-opu , audio-24khz-48kbitrate-mono-mp3 e audio-24khz-96kbitrate-mono-mp3 . Além disso, a partir desta tarde, se você usar o som que não estiver na lista suspensa, verá um erro como "voz não suportada ZH-CN-Yunieneural"., E também pode ser cortado no futuro. Use e valorize!

2022-07-01: ~~Os serviços implantados em servidores fora da China continental atualmente podem escolher apenas o áudio no formato webm-24khz-16bit-mono-opus !~~ Portanto, os usuários que usam o Vercel precisam reimuperá -lo.

2022-06-16: A interface fornecida pelo navegador Edge não pode mais definir o estilo de fala. Se você achar que não pode ser usado normalmente, consulte o #12 para obter atualizações.

Graças às seguintes organizações/indivíduos por seu apoio a este projeto

Expandir

Informações adicionais