ตอนนี้โครงการมีเวอร์ชันพกพาดังนั้นคุณไม่จำเป็นต้องไปที่ปัญหาในการติดตั้งการพึ่งพาทั้งหมด
คลิกที่นี่เพื่อดาวน์โหลด
คุณไม่ต้องการอะไรเลยนอกจาก Windows และการ์ดกราฟิก Nvidia ที่มีหน่วยความจำวิดีโอ 6 GB เพื่อเรียกใช้
ภาษาอังกฤษ
ชาวรัสเซีย
โปรตุเกส
XTTS-WEBUI เป็นเว็บอินเตอร์เฟสที่ให้คุณใช้ประโยชน์สูงสุดจาก XTT มีเครือข่ายประสาทอื่น ๆ รอบอินเทอร์เฟซนี้ที่จะปรับปรุงผลลัพธ์ของคุณ นอกจากนี้คุณยังสามารถปรับแต่งโมเดลและรับแบบจำลองเสียงคุณภาพสูง

ใช้เว็บ UI นี้ผ่าน Google Colab
โปรดตรวจสอบให้แน่ใจว่าคุณมี Python 3.10.x หรือ Python 3.11, Cuda 11.8 หรือ Cuda 12.1, Microsoft Builder Tools 2019 พร้อมแพ็คเกจ C ++ และ FFMPEG ติดตั้ง
เพื่อเริ่มต้น:
เพื่อเริ่มต้น:
ทำตามขั้นตอนเหล่านี้สำหรับการติดตั้ง:
ตรวจสอบให้แน่ใจว่ามีการติดตั้ง CUDA
โคลนที่เก็บ: git clone https://github.com/daswer123/xtts-webui
นำทางไปยังไดเรกทอรี: cd xtts-webui
สร้างสภาพแวดล้อมเสมือนจริง: python -m venv venv
เปิดใช้งานสภาพแวดล้อมเสมือนจริง:
venvscriptsactivatesource venvbinactivateติดตั้ง Pytorch และ Torchaudio ด้วยคำสั่ง PIP:
pip install torch==2.1.1+cu118 torchaudio==2.1.1+cu118 --index-url https://download.pytorch.org/whl/cu118
ติดตั้งการพึ่งพาทั้งหมดจากข้อกำหนด. txt:
pip install -r requirements.txt
หากต้องการเปิดอินเทอร์เฟซโปรดทำตามขั้นตอนเหล่านี้:
เปิดใช้งานสภาพแวดล้อมเสมือนจริงของคุณ:
venv/scripts/activateหรือถ้าคุณอยู่ใน Linux
source venv/bin/activateจากนั้นเริ่ม WebUI สำหรับ XTTS โดยเรียกใช้คำสั่งนี้:
python app.pyนี่คืออาร์กิวเมนต์รันไทม์บางส่วนที่สามารถใช้เมื่อเริ่มแอปพลิเคชัน:
| การโต้แย้ง | ค่าเริ่มต้น | คำอธิบาย |
|---|---|---|
| -HS, -โฮสต์ | 127.0.0.1 | โฮสต์ที่จะผูกกับ |
| -p, -พอร์ต | 8010 | หมายเลขพอร์ตที่จะฟัง |
| -d, -อุปกรณ์ | คนขี้เกียจ | อุปกรณ์ใดที่จะใช้ (CPU หรือ CUDA) |
| -SF,-Speaker_Folder | ลำโพง/ | ไดเรกทอรีที่มีตัวอย่าง TTS |
| -O,-เอาต์พุต | "เอาท์พุท/" | ไดเรกทอรีเอาต์พุต |
| -l,-ภาษา | "อัตโนมัติ" | ภาษา Webui คุณสามารถดูการแปลที่มีอยู่ในโฟลเดอร์ I18N/Locale |
| -ms,-model-source | "ท้องถิ่น" | กำหนดแหล่งที่มาของโมเดล: 'API' สำหรับเวอร์ชันล่าสุดจากที่เก็บการอนุมาน API หรือ 'ท้องถิ่น' สำหรับการใช้การอนุมานในท้องถิ่นและโมเดล v2.0.2 |
| -v, -version | "v2.0.2" | คุณสามารถระบุ XTT รุ่นที่จะใช้ คุณสามารถระบุชื่อของโมเดลที่กำหนดเองเพื่อจุดประสงค์นี้ใส่โฟลเดอร์ในรุ่นและระบุชื่อของโฟลเดอร์ในแฟล็กนี้ |
| -Lowvram | เปิดใช้งานโหมด VRAM ต่ำซึ่งสลับโมเดลเป็น RAM เมื่อไม่ประมวลผลอย่างแข็งขัน | |
| -ความเร็วลึก | เปิดใช้งานการเร่งความเร็ว DeepSpeed ทำงานบน Windows บน Python 3.10 และ 3.11 | |
| --แบ่งปัน | อนุญาตให้แชร์อินเทอร์เฟซนอกคอมพิวเตอร์ท้องถิ่น | |
| -RVC | เปิดใช้งาน RVC หลังการประมวลผลทุกรุ่นควรค้นหาในโฟลเดอร์ RVC |
โมดูลสำหรับ RVC คุณสามารถเปิดใช้งานโมดูล RVC เป็น postprocess เสียงที่ได้รับสำหรับสิ่งนี้คุณต้องเพิ่ม -RVC Flag หากคุณทำงานในคอนโซลหรือเขียนลงในไฟล์เริ่มต้น
เพื่อให้โมเดลทำงานในการตั้งค่า RVC คุณต้องเลือกรุ่นที่คุณต้องอัปโหลดไปยังโฟลเดอร์ Voice2Voice/RVC ก่อนรุ่นโมเดลและดัชนีจะต้องอยู่ด้วยกันไฟล์ดัชนีเป็นตัวเลือกแต่ละรุ่นจะต้องอยู่ในโฟลเดอร์แยกต่างหาก