다음 배치 방법을 참조하십시오.
코드 사본을 먼저 포크하고 자신의 vercel에 배포하십시오. 데모 비디오를 참조하십시오.
Railway는 한 달에 500 시간의 한도를 추가했으며 자동으로 종료되지 않으므로 매달 사용할 수없는 기간이 있습니다. 가능하면 Docker를 사용하여 배포하십시오.
Docker가 필요합니다.
# 拉取镜像
docker pull wxxxcxx/ms-ra-forwarder:latest
# 运行
docker run --name ms-ra-forwarder -d -p 3000:3000 wxxxcxx/ms-ra-forwarder
# or
docker run --name ms-ra-forwarder -d -p 3000:3000 -e TOKEN:自定义TOKEN wxxxcxx/ms-ra-forwarder
# 浏览器访问 http://localhost:3000 docker-compose.yml 만들려면 다음 내용을 작성하고 저장하십시오.
version : ' 3 '
services :
ms-ra-forwarder :
container_name : ms-ra-forwarder
image : wxxxcxx/ms-ra-forwarder:latest
restart : unless-stopped
ports :
- 3000:3000
environment :
# 不需要可以不用设置环境变量
- TOKEN=自定义TOKEN docker-compose.yml 디렉토리에서 docker compose up -d 실행하십시오.
수동 작업을 위해서는 GIT 및 NODEJS를 미리 설치해야합니다.
# 获取代码
git clone https://github.com/wxxxcxx/ms-ra-forwarder.git
cd ms-ra-forwarder
# 安装依赖
npm install
# 运行
npm run start배포 한 웹 사이트를 방문한 다음 페이지에서 테스트 한 후 "Reading (LEGADO) 음성 엔진 링크 생성"을 클릭 한 다음 Reading (LEGADO)에서 가져 오십시오.
인터페이스 주소는 api/ra 입니다. 형식은 다음과 같습니다.
POST /api/ra
FORMAT: audio-16khz-128kbitrate-mono-mp3
Content-Type: text/plain
<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="en-US">
<voice name="zh-CN-XiaoxiaoNeural">
如果喜欢这个项目的话请点个 Star 吧。
</voice>
</speak>
요청 된 텍스트는 SSML 형식으로 사용자 정의 발음 및 음성 스타일을 지원합니다 (현재 Azure 버전 만 사용자 정의 음성 스타일을 지원합니다). 다음은 관련 예제 및 문서입니다.
목소리로 텍스트
음성 합성 마크 업 언어 (SSML)로 합성 개선
기본 오디오 형식은 웹입니다. 다른 형식으로 오디오를 가져와야하는 경우 요청 헤더의 FORMAT 수정하십시오 (사용 가능한 옵션은 ra/index.ts에서 볼 수 있음).
다른 사람이 배포 된 서비스를 오용하지 않아야하는 경우 응용 프로그램의 환경 변수에 TOKEN 추가 한 다음 요청 헤더에 대한 Authorization: Bearer <TOKEN> 액세스를 추가 할 수 있습니다.
Microsoft의 공식 Azure TTS Service는 현재 특정 자유 제한을 가지고 있습니다. 자유 한도가 충분하다면 공식 서비스를 지원하십시오.
고정 텍스트에 대한 음성 만 생성 해야하는 경우 오디오 컨텐츠 생성을 사용할 수 있습니다. 보다 자연스러운 사운드를 생성 할 수있는 풍부한 기능을 제공합니다.
이 프로젝트는 Edge 브라우저 "읽기 Aloud"와 Azure TTS 데모 페이지 간의 인터페이스를 사용하며 후속 가용성과 안정성을 보장하지 않습니다.
이 프로젝트는 학습 및 참조 전용이며 상업적으로 이용 가능하지 않습니다.
2023-04-19 : Azure는 데모 페이지의 오프라인 시험 기능을 가지고있어 Azure 버전 인터페이스를 사용할 수 없었습니다. 에지 브라우저 인터페이스로 마이그레이션하십시오.
2022-11-18 : 사전 파일 지원 추가, 사전 파일 형식은 https://github.com/wxxxcxx/azure-tts-lexicon-cn/blob/main/lexicon.xml을 참조하십시오.
2022-09-10 : Docker 리포지토리 주소를 수정하면 나중에 내장 된 Docker 이미지는 WXXXCXX/MS-RA-Forwarder로 마이그레이션됩니다 (원래 리포지토리 이미지의 이전 버전은 여전히 유효합니다).
2022-09-01 : Azure TTS API가 다시 변경된 것으로 보입니다. 이전 버전 사용자는 정상적으로 사용할 수 없습니다. 최신 버전으로 업데이트하십시오.
2022-07-17 : Azure TTS API 지원이 추가되었습니다 (테스트하지 않은 경우 안정적인지 또는 사용하지 않는지 모르겠습니다). Azure TTS API를 호출하려면 승인 코드를 얻어야하기 때문입니다. 다른 방법은 한 번 또는 한 번만 사용될 수 있으며 Vercel은 API를 호출 할 때마다 권한 부여 코드를 다시 구입해야합니다. 시간이 용이 할뿐만 아니라 Microsoft 서버의 부담을 증가시키기 때문에 Vercel에 배치 한 사용자에게는 권장되지 않습니다 (사용하는 것은 불가능하지는 않지만 Microsoft가 상처를 입히면 인터페이스를 다시 변경하는 것이 좋지 않습니까?).
2022-07-02 : Edge 버전 API 테스트에서 현재 지원되는 형식에는 webm-24khz-16bit-mono-opu , audio-24khz-48kbitrate-mono-mp3 및 audio-24khz-96kbitrate-mono-mp3 포함됩니다. 또한 오늘 오후부터 드롭 다운 목록에없는 사운드를 사용하면 "지원되지 않은 음성 ZH-CN-YUNYENURAL"과 같은 오류가 표시되며 앞으로도 끊어 질 수 있습니다. 그것을 사용하고 소중히!
2022-07-01 : 중국 본토 이외의 서버에 배포 된 서비스는 현재 따라서 Vercel을 사용하는 사용자는 재배치해야합니다.webm-24khz-16bit-mono-opus 형식에서만 오디오를 선택할 수 있습니다!
2022-06-16 : Edge 브라우저에서 제공하는 인터페이스는 더 이상 음성 스타일을 설정할 수 없습니다. 정상적으로 사용할 수없는 경우 업데이트는 #12를 참조하십시오.
이 프로젝트에 대한 지원에 대한 다음 조직/개인 덕분에