ดาวน์โหลด FireRedTTS - FireRedTTS Source Source Download

FireRedTTS

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

Fireeredtts: โครงร่างข้อความเป็นคำพูดสำหรับการประยุกต์ใช้คำพูดระดับอุตสาหกรรมระดับอุตสาหกรรม

- กระดาษ Fireeredtts ??

- Demos Fireeredtts ??

- Fireeredtts Space (การสาธิตแบบโต้ตอบ) ??

ข่าว

[2024/10/17] เราเปิดตัวรูปแบบการปักครั้งใหม่ใหม่โดยให้ความคุ้มครองเครื่องหมายวรรคตอนที่เพิ่มขึ้นและความสอดคล้องการผลิตเสียงที่เพิ่มขึ้น นอกจากนี้เราได้เสริมสร้างความสามารถของส่วนหน้าข้อความและเพิ่มความเสถียรของการสังเคราะห์
[2024/09/26] โมเดลของเรามีอยู่แล้วในพื้นที่ HuggingFace， ลองผ่านอินเตอร์เฟสแบบโต้ตอบ
[2024/09/20] เราเปิดตัวจุดตรวจสอบและรหัสการอนุมานที่ผ่านการฝึกอบรมมาแล้ว
[2024/09/06] เราปล่อยรายงานทางเทคนิคและหน้าโครงการ

แผนงาน

2024/09
- ปล่อยจุดตรวจสอบก่อนที่ได้รับการฝึกอบรมและรหัสการอนุมาน
- ชุดทดสอบปล่อย
2024/10
- ปล่อยวรรคตอนที่สมบูรณ์
- ปล่อยจุดตรวจ Finetuned สำหรับการสร้างเสียงพูดเหมือนมนุษย์ที่ควบคุมได้

การใช้งาน

โคลนและติดตั้ง

โคลน repo

https://github.com/FireRedTeam/FireRedTTS.git
cd FireRedTTS

สร้าง conda env

 # step1.create env
conda create --name redtts python=3.10

# stpe2.install torch （pytorch should match the cuda-version on your machine）
# CUDA 11.8
conda install pytorch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 pytorch-cuda=11.8 -c pytorch -c nvidia
# CUDA 12.1
conda install pytorch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 pytorch-cuda=12.1 -c pytorch -c nvidia

# step3.install fireredtts form source
pip install -e . 

# step4.install other requirements
pip install -r requirements.txt

ดาวน์โหลดรุ่น

ดาวน์โหลดไฟล์โมเดลที่ต้องการจาก model_lists และวางไว้ในโฟลเดอร์ pretrained_models

การใช้งานขั้นพื้นฐาน

 import os
import torchaudio
from fireredtts . fireredtts import FireRedTTS

tts = FireRedTTS (
    config_path = "configs/config_24k.json" ,
    pretrained_path = < pretrained_models_dir > ,
)

#same language
rec_wavs = tts . synthesize (
        prompt_wav = "examples/prompt_1.wav" ,
        text = "小红书，是中国大陆的网络购物和社交平台，成立于二零一三年六月。" ,
        lang = "zh" ,
)

rec_wavs = rec_wavs . detach (). cpu ()
out_wav_path = os . path . join ( "./example.wav" )
torchaudio . save ( out_wav_path , rec_wavs , 24000 )

เคล็ดลับ

การลบความเงียบระยะยาว (> 1S) ในช่วงกลางของ PROMPTION_WAV อาจทำให้เกิดความมั่นคงที่ดีขึ้น หากมีความเงียบยาวเกินไปใน PROMPTION_WAV ของคุณและทำให้เกิดปัญหาความมั่นคงขอแนะนำให้ใช้เครื่องมือของเรา ( tools/process_prompts.py ) เพื่อลบความเงียบ

กิตติกรรมประกาศ

Tortoise-TTS และ XTTS-V2 นำเสนอข้อมูลเชิงลึกที่มีค่าสำหรับการสร้างระบบสไตล์อัตโนมัติ
matcha-tts และ cosyvoice แสดงให้เห็นถึงความสามารถที่ยอดเยี่ยมของการจับคู่การไหลในการแปลงรหัสเสียงเป็น Mel
Bigvgan-V2 ใช้สำหรับการร้อง
เราอ้างถึงโซลูชัน Tokenizer ข้อความ ของ Whisper

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-08-20
ขนาด 1.98MB
มาจาก Github

แอปที่เกี่ยวข้อง

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด