ดาวน์โหลด ms ra forwarder - ดาวน์โหลดซอร์สโค้ด ms ra forwarder

ms ra forwarder

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

ปรับใช้

โปรดดูวิธีการปรับใช้ต่อไปนี้

ปรับใช้กับ vercel

~~กรุณาแยกสำเนารหัสก่อนและปรับใช้กับ vercel ของคุณเอง อ้างถึงวิดีโอสาธิต~~

ปรับใช้กับทางรถไฟ

Railway ได้เพิ่มขีด จำกัด 500 ชั่วโมงต่อเดือนและจะไม่ปิดโดยอัตโนมัติดังนั้นจะมีระยะเวลาในแต่ละเดือนที่ไม่สามารถใช้งานได้ ถ้าเป็นไปได้ให้ใช้ Docker เพื่อปรับใช้

นำไปใช้กับ Heroku

Docker (แนะนำ)

ต้องใช้ท่าเทียบเรือ

 # 拉取镜像
docker pull wxxxcxx/ms-ra-forwarder:latest
# 运行
docker run --name ms-ra-forwarder -d -p 3000:3000 wxxxcxx/ms-ra-forwarder
# or
docker run --name ms-ra-forwarder -d -p 3000:3000 -e TOKEN:自定义TOKEN wxxxcxx/ms-ra-forwarder

# 浏览器访问 http://localhost:3000

นักเทียบท่า

สร้าง docker-compose.yml เพื่อเขียนเนื้อหาต่อไปนี้และบันทึก

 version : ' 3 '

services :
  ms-ra-forwarder :
    container_name : ms-ra-forwarder
    image : wxxxcxx/ms-ra-forwarder:latest
    restart : unless-stopped
    ports :
      - 3000:3000
    environment :
      # 不需要可以不用设置环境变量
      - TOKEN=自定义TOKEN

ดำเนินการ docker compose up -d ในไดเรกทอรี docker-compose.yml

วิ่งด้วยตนเอง

การดำเนินการด้วยตนเองต้องการการติดตั้ง Git และ NodeJs ล่วงหน้า

 # 获取代码
git clone https://github.com/wxxxcxx/ms-ra-forwarder.git

cd ms-ra-forwarder
# 安装依赖
npm install 
# 运行
npm run start

ใช้

นำเข้าเพื่ออ่าน (Legado)

กรุณาเยี่ยมชมเว็บไซต์ที่คุณได้ปรับใช้และหลังจากการทดสอบบนหน้าเว็บคลิก "สร้างลิงค์การอ่านเสียง (Legado) Voice Engine" จากนั้นนำเข้าในการอ่าน (Legado)

โทรด้วยตนเอง

ที่อยู่อินเตอร์เฟสคือ api/ra รูปแบบคือ:

 POST /api/ra
FORMAT: audio-16khz-128kbitrate-mono-mp3
Content-Type: text/plain

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="https://www.w3.org/2001/mstts" xml:lang="en-US">
  <voice name="zh-CN-XiaoxiaoNeural">
    如果喜欢这个项目的话请点个 Star 吧。
  </voice>
</speak>

การออกเสียงและน้ำเสียงที่กำหนดเอง

ข้อความที่ร้องขออยู่ในรูปแบบ SSML ซึ่งรองรับการออกเสียงและสไตล์การพูดที่กำหนดเอง (ปัจจุบันเฉพาะเวอร์ชัน Azure เท่านั้นที่รองรับสไตล์การพูดที่กำหนดเอง) ต่อไปนี้เป็นตัวอย่างและเอกสารที่เกี่ยวข้อง:

ส่งข้อความถึงเสียง

ปรับปรุงการสังเคราะห์ด้วยภาษามาร์กอัปการสังเคราะห์เสียงพูด (SSML)

รูปแบบเสียง

รูปแบบเสียงเริ่มต้นคือ webm หากคุณต้องการรับเสียงในรูปแบบอื่นโปรดแก้ไข FORMAT ของส่วนหัวคำขอ (สามารถดูตัวเลือกที่มีอยู่ใน RA/INDEX.TS)

จำกัด การเข้าถึง

หากคุณต้องการป้องกันไม่ให้ผู้อื่นใช้บริการที่ใช้งานในทางที่ผิดคุณสามารถเพิ่ม TOKEN ลงในตัวแปรสภาพแวดล้อมของแอปพลิเคชันแล้วเพิ่ม Authorization: Bearer <TOKEN> เข้าถึงส่วนหัวคำขอ

คำแนะนำอื่น ๆ

ปัจจุบันบริการ Azure TTS อย่างเป็นทางการของ Microsoft มีขีด จำกัด ฟรี หากขีด จำกัด ฟรีเพียงพอสำหรับคุณโปรดรองรับบริการอย่างเป็นทางการ
หากคุณต้องการสร้างเสียงสำหรับข้อความคงที่คุณสามารถใช้การสร้างเนื้อหาเสียง มันให้คุณสมบัติที่สมบูรณ์ยิ่งขึ้นเพื่อสร้างเสียงที่เป็นธรรมชาติมากขึ้น
โครงการนี้ใช้อินเทอร์เฟซระหว่างเบราว์เซอร์ขอบ "อ่านออกเสียง" และหน้าสาธิต Azure TTS และไม่รับประกันความพร้อมใช้งานและความเสถียรในภายหลัง
โครงการนี้มีไว้สำหรับการเรียนรู้และการอ้างอิงเท่านั้นและไม่สามารถใช้งานได้ในเชิงพาณิชย์

การเปลี่ยนแปลงที่สำคัญ

2023-04-19: Azure มีฟังก์ชั่นการทดลองแบบออฟไลน์สำหรับหน้าสาธิตซึ่งทำให้อินเทอร์เฟซเวอร์ชัน Azure ไม่สามารถใช้งานได้ โปรดย้ายไปยังส่วนต่อประสานเบราว์เซอร์ Edge

2022-11-18: เพิ่มการสนับสนุนไฟล์พจนานุกรมโปรดดูที่ https://github.com/wxxxcxx/azure-tts-lexicon-cn/blob/main/lexicon.xml สำหรับรูปแบบไฟล์พจนานุกรม

2022-09-10: แก้ไขที่อยู่ที่เก็บของ Docker และอิมเมจนักเทียบท่าที่สร้างขึ้นในภายหลังจะถูกย้ายไปยัง WXXXCXX/MS-RA-Forwarder (ภาพที่เก็บต้นฉบับรุ่นเก่ายังคงใช้ได้)

2022-09-01: Azure TTS API ดูเหมือนจะเปลี่ยนไปอีกครั้ง ผู้ใช้รุ่นเก่าอาจไม่สามารถใช้งานได้ตามปกติ โปรดอัปเดตเป็นเวอร์ชันล่าสุด

2022-07-17: เพิ่มการสนับสนุน Azure TTS API (ฉันไม่ได้ทดสอบมากฉันไม่รู้ว่ามันมีเสถียรภาพหรือไม่ใช้) เนื่องจากการเรียก Azure TTS API ต้องได้รับรหัสการอนุญาต วิธีการอื่น ๆ สามารถใช้เป็นระยะเวลาเพียงครั้งเดียวหรือครั้งเดียวและ Vercel จำเป็นต้องได้รับรหัสการอนุญาตใหม่ทุกครั้งที่เขาเรียก API ไม่เพียง แต่จะหมดเวลา แต่ยังเพิ่มภาระของเซิร์ฟเวอร์ Microsoft ดังนั้นจึงไม่แนะนำสำหรับผู้ใช้ที่ปรับใช้ใน Vercel (แม้ว่าจะไม่สามารถใช้งานได้ ~ แต่ถ้า Microsoft ได้รับบาดเจ็บและจะไม่ดีที่จะเปลี่ยนอินเทอร์เฟซอีกครั้ง?)

2022-07-02: Edge Version API รูปแบบที่รองรับในปัจจุบันโดยการทดสอบ ได้แก่ webm-24khz-16bit-mono-opu , audio-24khz-48kbitrate-mono-mp3 และ audio-24khz-96kbitrate-mono-mp3 นอกจากนี้การเริ่มต้นบ่ายวันนี้หากคุณใช้เสียงที่ไม่ได้อยู่ในรายการดรอปดาวน์คุณจะเห็นข้อผิดพลาดเช่น "เสียงที่ไม่ได้รับการสนับสนุน zh-cn-yunyeneural" และอาจถูกตัดออกไปในอนาคต ใช้และถนอมมัน!

2022-07-01: บริการที่ปรับใช้บนเซิร์ฟเวอร์นอกประเทศจีนแผ่นดินใหญ่สามารถเลือกเสียงในรูปแบบ webm-24khz-16bit-mono-opus ! ดังนั้นผู้ใช้ที่ใช้ Vercel จำเป็นต้องปรับใช้ใหม่

2022-06-16: อินเทอร์เฟซที่ได้รับจากเบราว์เซอร์ขอบไม่สามารถตั้งค่าสไตล์การพูดได้อีกต่อไป หากคุณพบว่าไม่สามารถใช้งานได้ตามปกติโปรดดูที่ #12 สำหรับการอัปเดต

ขอบคุณองค์กร/บุคคลต่อไปนี้สำหรับการสนับสนุนโครงการนี้

ขยาย

ข้อมูลเพิ่มเติม