Consulte o seguinte método de implantação.
Por favor, faça uma cópia do código primeiro e implante -a em seu próprio vercel. Consulte o vídeo de demonstração.
A Railway adicionou um limite de 500 horas por mês e não será desligado automaticamente; portanto, haverá um período de tempo a cada mês que não pode ser usado. Se possível, use o Docker para implantar.
Docker é necessário.
# 拉取镜像
docker pull wxxxcxx/ms-ra-forwarder:latest
# 运行
docker run --name ms-ra-forwarder -d -p 3000:3000 wxxxcxx/ms-ra-forwarder
# or
docker run --name ms-ra-forwarder -d -p 3000:3000 -e TOKEN:自定义TOKEN wxxxcxx/ms-ra-forwarder
# 浏览器访问 http://localhost:3000 Crie docker-compose.yml para escrever o seguinte conteúdo e salvá-lo.
version : ' 3 '
services :
ms-ra-forwarder :
container_name : ms-ra-forwarder
image : wxxxcxx/ms-ra-forwarder:latest
restart : unless-stopped
ports :
- 3000:3000
environment :
# 不需要可以不用设置环境变量
- TOKEN=自定义TOKEN Execute docker compose up -d no diretório docker-compose.yml .
A operação manual exige que o GIT e o NodeJs sejam instalados com antecedência.
# 获取代码
git clone https://github.com/wxxxcxx/ms-ra-forwarder.git
cd ms-ra-forwarder
# 安装依赖
npm install
# 运行
npm run startVisite o site que você implantou e, depois de testar na página, clique em "Gerente o link do mecanismo de voz de leitura (LEGADO)" e, em seguida, importá -lo na leitura (LEGADO).
O endereço da interface é api/ra . O formato é:
POST /api/ra
FORMAT: audio-16khz-128kbitrate-mono-mp3
Content-Type: text/plain
<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="en-US">
<voice name="zh-CN-XiaoxiaoNeural">
如果喜欢这个项目的话请点个 Star 吧。
</voice>
</speak>
O texto solicitado está no formato SSML, que suporta estilos de pronúncia e fala personalizados (atualmente apenas a versão do Azure suporta estilos de fala personalizados). Os seguintes são exemplos e documentação relacionados:
Texto para voz
Melhorar a síntese com a linguagem de marcação de síntese de fala (SSML)
O formato de áudio padrão é o WebM. Se você precisar obter áudio em outros formatos, modifique FORMAT do cabeçalho da solicitação (as opções disponíveis podem ser visualizadas em ra/index.ts).
Se você precisar impedir que outras pessoas usem mal seus serviços implantados, poderá adicionar TOKEN à variável de ambiente do aplicativo e adicionar Authorization: Bearer <TOKEN> Acesso ao cabeçalho da solicitação.
Atualmente, o Serviço Official do Azure TTS do Azure tem um certo limite livre. Se o limite livre for suficiente para você, apoie o serviço oficial.
Se você precisar gerar voz para texto fixo, poderá usar a criação de conteúdo de áudio. Ele fornece recursos mais ricos para gerar sons mais naturais.
Este projeto usa a interface entre o navegador de borda "Read em voz alta" e as páginas de demonstração do Azure TTS, e não garante a disponibilidade e estabilidade subsequentes.
Este projeto é apenas para aprender e referência e não está disponível comercialmente.
2023-04-19: O Azure tem função de teste offline para a página de demonstração, que fez com que a interface da versão do Azure fosse inutilizável. Por favor, migre para a interface do navegador Edge.
2022-11-18: Adicione suporte ao arquivo de dicionário, consulte https://github.com/wxxxcxx/azure-tts-lelicon-cn/blob/main/lexicon.xml para formato de arquivo de dicionário.
2022-09-10: Modifique o endereço do repositório do Docker, e a imagem do Docker construída posteriormente será migrada para WXXXCXX/MS-RA-Forwer (a versão antiga da imagem do repositório original ainda é válida).
2022-09-01: A API do Azure TTS parece ter sido alterada novamente. Os usuários da versão mais antiga podem não ser capazes de usá -lo normalmente. Por favor, atualize a versão mais recente.
2022-07-17: Adicionado suporte da API do Azure TTS (eu não testei muito, não sei se é estável ou não para usá-lo). Porque chamar a API do Azure TTS exige a obtenção do código de autorização. Outros métodos podem ser usados por apenas um período de tempo ou uma vez, e Vercel precisa re-obter novamente o código de autorização toda vez que ele chama a API. Não é apenas fácil passar o tempo, mas também aumenta o ônus dos servidores da Microsoft, por isso não é recomendado para usuários que o implantam no vercel (embora não seja impossível usá -lo ~, mas se a Microsoft estiver ferida e será ruim alterar a interface novamente?).
2022-07-02: API da versão de borda Os formatos atualmente suportados por testes incluem webm-24khz-16bit-mono-opu , audio-24khz-48kbitrate-mono-mp3 e audio-24khz-96kbitrate-mono-mp3 . Além disso, a partir desta tarde, se você usar o som que não estiver na lista suspensa, verá um erro como "voz não suportada ZH-CN-Yunieneural"., E também pode ser cortado no futuro. Use e valorize!
2022-07-01: Os serviços implantados em servidores fora da China continental atualmente podem escolher apenas o áudio no formato Portanto, os usuários que usam o Vercel precisam reimuperá -lo.webm-24khz-16bit-mono-opus !
2022-06-16: A interface fornecida pelo navegador Edge não pode mais definir o estilo de fala. Se você achar que não pode ser usado normalmente, consulte o #12 para obter atualizações.
Graças às seguintes organizações/indivíduos por seu apoio a este projeto