โปรดดูวิธีการปรับใช้ต่อไปนี้
กรุณาแยกสำเนารหัสก่อนและปรับใช้กับ vercel ของคุณเอง อ้างถึงวิดีโอสาธิต
Railway ได้เพิ่มขีด จำกัด 500 ชั่วโมงต่อเดือนและจะไม่ปิดโดยอัตโนมัติดังนั้นจะมีระยะเวลาในแต่ละเดือนที่ไม่สามารถใช้งานได้ ถ้าเป็นไปได้ให้ใช้ Docker เพื่อปรับใช้
ต้องใช้ท่าเทียบเรือ
# 拉取镜像
docker pull wxxxcxx/ms-ra-forwarder:latest
# 运行
docker run --name ms-ra-forwarder -d -p 3000:3000 wxxxcxx/ms-ra-forwarder
# or
docker run --name ms-ra-forwarder -d -p 3000:3000 -e TOKEN:自定义TOKEN wxxxcxx/ms-ra-forwarder
# 浏览器访问 http://localhost:3000 สร้าง docker-compose.yml เพื่อเขียนเนื้อหาต่อไปนี้และบันทึก
version : ' 3 '
services :
ms-ra-forwarder :
container_name : ms-ra-forwarder
image : wxxxcxx/ms-ra-forwarder:latest
restart : unless-stopped
ports :
- 3000:3000
environment :
# 不需要可以不用设置环境变量
- TOKEN=自定义TOKEN ดำเนินการ docker compose up -d ในไดเรกทอรี docker-compose.yml
การดำเนินการด้วยตนเองต้องการการติดตั้ง Git และ NodeJs ล่วงหน้า
# 获取代码
git clone https://github.com/wxxxcxx/ms-ra-forwarder.git
cd ms-ra-forwarder
# 安装依赖
npm install
# 运行
npm run startกรุณาเยี่ยมชมเว็บไซต์ที่คุณได้ปรับใช้และหลังจากการทดสอบบนหน้าเว็บคลิก "สร้างลิงค์การอ่านเสียง (Legado) Voice Engine" จากนั้นนำเข้าในการอ่าน (Legado)
ที่อยู่อินเตอร์เฟสคือ api/ra รูปแบบคือ:
POST /api/ra
FORMAT: audio-16khz-128kbitrate-mono-mp3
Content-Type: text/plain
<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="en-US">
<voice name="zh-CN-XiaoxiaoNeural">
如果喜欢这个项目的话请点个 Star 吧。
</voice>
</speak>
ข้อความที่ร้องขออยู่ในรูปแบบ SSML ซึ่งรองรับการออกเสียงและสไตล์การพูดที่กำหนดเอง (ปัจจุบันเฉพาะเวอร์ชัน Azure เท่านั้นที่รองรับสไตล์การพูดที่กำหนดเอง) ต่อไปนี้เป็นตัวอย่างและเอกสารที่เกี่ยวข้อง:
ส่งข้อความถึงเสียง
ปรับปรุงการสังเคราะห์ด้วยภาษามาร์กอัปการสังเคราะห์เสียงพูด (SSML)
รูปแบบเสียงเริ่มต้นคือ webm หากคุณต้องการรับเสียงในรูปแบบอื่นโปรดแก้ไข FORMAT ของส่วนหัวคำขอ (สามารถดูตัวเลือกที่มีอยู่ใน RA/INDEX.TS)
หากคุณต้องการป้องกันไม่ให้ผู้อื่นใช้บริการที่ใช้งานในทางที่ผิดคุณสามารถเพิ่ม TOKEN ลงในตัวแปรสภาพแวดล้อมของแอปพลิเคชันแล้วเพิ่ม Authorization: Bearer <TOKEN> เข้าถึงส่วนหัวคำขอ
ปัจจุบันบริการ Azure TTS อย่างเป็นทางการของ Microsoft มีขีด จำกัด ฟรี หากขีด จำกัด ฟรีเพียงพอสำหรับคุณโปรดรองรับบริการอย่างเป็นทางการ
หากคุณต้องการสร้างเสียงสำหรับข้อความคงที่คุณสามารถใช้การสร้างเนื้อหาเสียง มันให้คุณสมบัติที่สมบูรณ์ยิ่งขึ้นเพื่อสร้างเสียงที่เป็นธรรมชาติมากขึ้น
โครงการนี้ใช้อินเทอร์เฟซระหว่างเบราว์เซอร์ขอบ "อ่านออกเสียง" และหน้าสาธิต Azure TTS และไม่รับประกันความพร้อมใช้งานและความเสถียรในภายหลัง
โครงการนี้มีไว้สำหรับการเรียนรู้และการอ้างอิงเท่านั้นและไม่สามารถใช้งานได้ในเชิงพาณิชย์
2023-04-19: Azure มีฟังก์ชั่นการทดลองแบบออฟไลน์สำหรับหน้าสาธิตซึ่งทำให้อินเทอร์เฟซเวอร์ชัน Azure ไม่สามารถใช้งานได้ โปรดย้ายไปยังส่วนต่อประสานเบราว์เซอร์ Edge
2022-11-18: เพิ่มการสนับสนุนไฟล์พจนานุกรมโปรดดูที่ https://github.com/wxxxcxx/azure-tts-lexicon-cn/blob/main/lexicon.xml สำหรับรูปแบบไฟล์พจนานุกรม
2022-09-10: แก้ไขที่อยู่ที่เก็บของ Docker และอิมเมจนักเทียบท่าที่สร้างขึ้นในภายหลังจะถูกย้ายไปยัง WXXXCXX/MS-RA-Forwarder (ภาพที่เก็บต้นฉบับรุ่นเก่ายังคงใช้ได้)
2022-09-01: Azure TTS API ดูเหมือนจะเปลี่ยนไปอีกครั้ง ผู้ใช้รุ่นเก่าอาจไม่สามารถใช้งานได้ตามปกติ โปรดอัปเดตเป็นเวอร์ชันล่าสุด
2022-07-17: เพิ่มการสนับสนุน Azure TTS API (ฉันไม่ได้ทดสอบมากฉันไม่รู้ว่ามันมีเสถียรภาพหรือไม่ใช้) เนื่องจากการเรียก Azure TTS API ต้องได้รับรหัสการอนุญาต วิธีการอื่น ๆ สามารถใช้เป็นระยะเวลาเพียงครั้งเดียวหรือครั้งเดียวและ Vercel จำเป็นต้องได้รับรหัสการอนุญาตใหม่ทุกครั้งที่เขาเรียก API ไม่เพียง แต่จะหมดเวลา แต่ยังเพิ่มภาระของเซิร์ฟเวอร์ Microsoft ดังนั้นจึงไม่แนะนำสำหรับผู้ใช้ที่ปรับใช้ใน Vercel (แม้ว่าจะไม่สามารถใช้งานได้ ~ แต่ถ้า Microsoft ได้รับบาดเจ็บและจะไม่ดีที่จะเปลี่ยนอินเทอร์เฟซอีกครั้ง?)
2022-07-02: Edge Version API รูปแบบที่รองรับในปัจจุบันโดยการทดสอบ ได้แก่ webm-24khz-16bit-mono-opu , audio-24khz-48kbitrate-mono-mp3 และ audio-24khz-96kbitrate-mono-mp3 นอกจากนี้การเริ่มต้นบ่ายวันนี้หากคุณใช้เสียงที่ไม่ได้อยู่ในรายการดรอปดาวน์คุณจะเห็นข้อผิดพลาดเช่น "เสียงที่ไม่ได้รับการสนับสนุน zh-cn-yunyeneural" และอาจถูกตัดออกไปในอนาคต ใช้และถนอมมัน!
2022-07-01: บริการที่ปรับใช้บนเซิร์ฟเวอร์นอกประเทศจีนแผ่นดินใหญ่สามารถเลือกเสียงในรูปแบบ ดังนั้นผู้ใช้ที่ใช้ Vercel จำเป็นต้องปรับใช้ใหม่webm-24khz-16bit-mono-opus !
2022-06-16: อินเทอร์เฟซที่ได้รับจากเบราว์เซอร์ขอบไม่สามารถตั้งค่าสไตล์การพูดได้อีกต่อไป หากคุณพบว่าไม่สามารถใช้งานได้ตามปกติโปรดดูที่ #12 สำหรับการอัปเดต
ขอบคุณองค์กร/บุคคลต่อไปนี้สำหรับการสนับสนุนโครงการนี้