xtts webui Download - xtts webui Source Source Download

xtts webui

โค้ดแหล่งที่มา AI

Deepspeed wheels for Windows

ดาวน์โหลด

xtts-webui

เวอร์ชันพกพา

ตอนนี้โครงการมีเวอร์ชันพกพาดังนั้นคุณไม่จำเป็นต้องไปที่ปัญหาในการติดตั้งการพึ่งพาทั้งหมด

คลิกที่นี่เพื่อดาวน์โหลด

คุณไม่ต้องการอะไรเลยนอกจาก Windows และการ์ดกราฟิก Nvidia ที่มีหน่วยความจำวิดีโอ 6 GB เพื่อเรียกใช้

แท็บรถไฟเสียหากคุณต้องการฝึกอบรมแบบจำลองให้ใช้ webui แยกต่างหาก

XTTS-FINETUNE-WEBUI

ReadMe มีให้บริการในภาษาต่อไปนี้

ภาษาอังกฤษ

ชาวรัสเซีย

โปรตุเกส

เกี่ยวกับโครงการ

XTTS-WEBUI เป็นเว็บอินเตอร์เฟสที่ให้คุณใช้ประโยชน์สูงสุดจาก XTT มีเครือข่ายประสาทอื่น ๆ รอบอินเทอร์เฟซนี้ที่จะปรับปรุงผลลัพธ์ของคุณ นอกจากนี้คุณยังสามารถปรับแต่งโมเดลและรับแบบจำลองเสียงคุณภาพสูง

ภาพ

คุณสมบัติที่สำคัญ

ใช้งานง่ายกับ xttsv2
การประมวลผลแบบแบทช์สำหรับการพากย์ไฟล์จำนวนมาก
ความสามารถในการแปลเสียงใด ๆ ด้วยการประหยัดเสียง
ความสามารถในการปรับปรุงผลลัพธ์โดยใช้เครือข่ายประสาทและเครื่องมือเสียงโดยอัตโนมัติ
ความสามารถในการปรับแต่งโมเดลและใช้งานทันที
ความสามารถในการใช้เครื่องมือเช่น: RVC , OpenVoice , มีลักษณะคล้ายกับการปรับปรุง ทั้งกันและแยกกัน
ความสามารถในการปรับแต่งการสร้าง XTTS พารามิเตอร์ทั้งหมดตัวอย่างการพูดหลายตัวอย่าง

สิ่งที่ต้องทำ

เพิ่มแถบสถานะพร้อมข้อมูลความคืบหน้าและข้อผิดพลาด
รวมการฝึกอบรมเข้ากับอินเทอร์เฟซมาตรฐาน
เพิ่มความสามารถในการสตรีมเพื่อตรวจสอบผลลัพธ์
เพิ่มวิธีการใหม่ในการประมวลผลข้อความสำหรับการพากย์เสียง
เพิ่มความสามารถในการปรับแต่งลำโพงเมื่อการประมวลผลแบบแบทช์
เพิ่ม API

การติดตั้ง

ใช้เว็บ UI นี้ผ่าน Google Colab

โปรดตรวจสอบให้แน่ใจว่าคุณมี Python 3.10.x หรือ Python 3.11, Cuda 11.8 หรือ Cuda 12.1, Microsoft Builder Tools 2019 พร้อมแพ็คเกจ C ++ และ FFMPEG ติดตั้ง

1 วิธีผ่านสคริปต์

หน้าต่าง

เพื่อเริ่มต้น:

เรียกใช้ไฟล์ 'install.bat'
ในการเริ่มต้นเว็บ UI ให้เรียกใช้ 'start_xtts_webui.bat'
เปิดเบราว์เซอร์ที่คุณต้องการและไปที่ที่อยู่ท้องถิ่นที่แสดงในคอนโซล

ลินเวกซ์

เพื่อเริ่มต้น:

เรียกใช้ไฟล์ 'install.sh'
ในการเริ่มต้นเว็บ UI ให้เรียกใช้ 'start_xtts_webui.sh'
เปิดเบราว์เซอร์ที่คุณต้องการและไปที่ที่อยู่ท้องถิ่นที่แสดงในคอนโซล

2 วิธีคู่มือ

ทำตามขั้นตอนเหล่านี้สำหรับการติดตั้ง:

ตรวจสอบให้แน่ใจว่ามีการติดตั้ง CUDA
โคลนที่เก็บ: git clone https://github.com/daswer123/xtts-webui
นำทางไปยังไดเรกทอรี: cd xtts-webui
สร้างสภาพแวดล้อมเสมือนจริง: python -m venv venv
เปิดใช้งานสภาพแวดล้อมเสมือนจริง:
- บน Windows Use: venvscriptsactivate
- On Linux Use: source venvbinactivate
ติดตั้ง Pytorch และ Torchaudio ด้วยคำสั่ง PIP:
pip install torch==2.1.1+cu118 torchaudio==2.1.1+cu118 --index-url https://download.pytorch.org/whl/cu118
ติดตั้งการพึ่งพาทั้งหมดจากข้อกำหนด. txt:
pip install -r requirements.txt

การรันแอปพลิเคชัน

หากต้องการเปิดอินเทอร์เฟซโปรดทำตามขั้นตอนเหล่านี้:

เริ่มต้น xtts webui:

เปิดใช้งานสภาพแวดล้อมเสมือนจริงของคุณ:

venv/scripts/activate

หรือถ้าคุณอยู่ใน Linux

 source venv/bin/activate

จากนั้นเริ่ม WebUI สำหรับ XTTS โดยเรียกใช้คำสั่งนี้:

python app.py

นี่คืออาร์กิวเมนต์รันไทม์บางส่วนที่สามารถใช้เมื่อเริ่มแอปพลิเคชัน:

การโต้แย้ง	ค่าเริ่มต้น	คำอธิบาย
-HS, -โฮสต์	127.0.0.1	โฮสต์ที่จะผูกกับ
-p, -พอร์ต	8010	หมายเลขพอร์ตที่จะฟัง
-d, -อุปกรณ์	คนขี้เกียจ	อุปกรณ์ใดที่จะใช้ (CPU หรือ CUDA)
-SF,-Speaker_Folder	ลำโพง/	ไดเรกทอรีที่มีตัวอย่าง TTS
-O,-เอาต์พุต	"เอาท์พุท/"	ไดเรกทอรีเอาต์พุต
-l,-ภาษา	"อัตโนมัติ"	ภาษา Webui คุณสามารถดูการแปลที่มีอยู่ในโฟลเดอร์ I18N/Locale
-ms,-model-source	"ท้องถิ่น"	กำหนดแหล่งที่มาของโมเดล: 'API' สำหรับเวอร์ชันล่าสุดจากที่เก็บการอนุมาน API หรือ 'ท้องถิ่น' สำหรับการใช้การอนุมานในท้องถิ่นและโมเดล v2.0.2
-v, -version	"v2.0.2"	คุณสามารถระบุ XTT รุ่นที่จะใช้ คุณสามารถระบุชื่อของโมเดลที่กำหนดเองเพื่อจุดประสงค์นี้ใส่โฟลเดอร์ในรุ่นและระบุชื่อของโฟลเดอร์ในแฟล็กนี้
-Lowvram		เปิดใช้งานโหมด VRAM ต่ำซึ่งสลับโมเดลเป็น RAM เมื่อไม่ประมวลผลอย่างแข็งขัน
-ความเร็วลึก		เปิดใช้งานการเร่งความเร็ว DeepSpeed ทำงานบน Windows บน Python 3.10 และ 3.11
--แบ่งปัน		อนุญาตให้แชร์อินเทอร์เฟซนอกคอมพิวเตอร์ท้องถิ่น
-RVC		เปิดใช้งาน RVC หลังการประมวลผลทุกรุ่นควรค้นหาในโฟลเดอร์ RVC

tts -> rvc

โมดูลสำหรับ RVC คุณสามารถเปิดใช้งานโมดูล RVC เป็น postprocess เสียงที่ได้รับสำหรับสิ่งนี้คุณต้องเพิ่ม -RVC Flag หากคุณทำงานในคอนโซลหรือเขียนลงในไฟล์เริ่มต้น

เพื่อให้โมเดลทำงานในการตั้งค่า RVC คุณต้องเลือกรุ่นที่คุณต้องอัปโหลดไปยังโฟลเดอร์ Voice2Voice/RVC ก่อนรุ่นโมเดลและดัชนีจะต้องอยู่ด้วยกันไฟล์ดัชนีเป็นตัวเลือกแต่ละรุ่นจะต้องอยู่ในโฟลเดอร์แยกต่างหาก

ความแตกต่างระหว่าง XTTS-WEBUI และ WebUI อย่างเป็นทางการ

การประมวลผลข้อมูล

อัปเดตเร็วขึ้นเร็วขึ้นเป็น 0.10.0 ด้วยความสามารถในการเลือกรุ่นที่ใหญ่กว่า V3
เปลี่ยนโฟลเดอร์เอาต์พุตเป็นโฟลเดอร์เอาต์พุตภายในโฟลเดอร์หลัก
หากมีชุดข้อมูลอยู่แล้วในโฟลเดอร์เอาต์พุตและคุณต้องการเพิ่มข้อมูลใหม่คุณสามารถทำได้โดยเพียงแค่เพิ่มเสียงใหม่สิ่งที่จะไม่ถูกประมวลผลอีกครั้งและข้อมูลใหม่จะถูกเพิ่มโดยอัตโนมัติ
เปิดตัวกรอง VAD
หลังจากสร้างชุดข้อมูลไฟล์จะถูกสร้างขึ้นที่ระบุภาษาของชุดข้อมูล ไฟล์นี้อ่านก่อนการฝึกอบรมเพื่อให้ภาษาจับคู่เสมอ สะดวกเมื่อคุณรีสตาร์ทอินเทอร์เฟซ

การปรับแต่ง XTTS อย่างละเอียด

เพิ่มความสามารถในการเลือกโมเดลพื้นฐานสำหรับ XTTS รวมถึงเมื่อคุณฝึกอบรมอีกครั้งไม่จำเป็นต้องดาวน์โหลดโมเดลอีกครั้ง
เพิ่มความสามารถในการเลือกโมเดลที่กำหนดเองเป็นแบบจำลองพื้นฐานระหว่างการฝึกอบรมซึ่งจะช่วยให้ Finetune รุ่น Finetune อยู่แล้ว
เพิ่มความเป็นไปได้ในการรับรุ่นที่ปรับให้เหมาะสมสำหรับ 1 คลิก (ขั้นตอนที่ 2.5 ใส่เวอร์ชันที่ดีที่สุดในโฟลเดอร์เอาต์พุต)
คุณสามารถเลือกได้ว่าจะลบโฟลเดอร์การฝึกอบรมหรือไม่หลังจากที่คุณได้ปรับปรุงโมเดล
เมื่อคุณเพิ่มประสิทธิภาพโมเดลเสียงอ้างอิงตัวอย่างจะถูกย้ายไปยังโฟลเดอร์เอาต์พุต
การตรวจสอบความถูกต้องของภาษาและภาษาชุดข้อมูลที่ระบุ

การอนุมาน

เพิ่มความเป็นไปได้ในการปรับแต่งการตั้งค่าที่อนุมานระหว่างการตรวจสอบแบบจำลอง

อื่น

หากคุณรีสตาร์ทอินเทอร์เฟซโดยไม่ได้ตั้งใจระหว่างขั้นตอนใดขั้นหนึ่งคุณสามารถโหลดข้อมูลไปยังปุ่มเพิ่มเติมได้
ลบการแสดงผลของบันทึกเนื่องจากเป็นสาเหตุของปัญหาเมื่อรีสตาร์ท
ผลลัพธ์ที่เสร็จสมบูรณ์จะถูกคัดลอกไปยังโฟลเดอร์พร้อมไฟล์เหล่านี้เป็นไฟล์เสร็จสมบูรณ์คุณสามารถเลื่อนได้ทุกที่และใช้เป็นรุ่นมาตรฐาน
เพิ่มการสนับสนุนสำหรับญี่ปุ่นที่นี่

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน Deepspeed wheels for Windows
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-14
ขนาด 1.83MB
มาจาก Github

แอปที่เกี่ยวข้อง

webui_bfm

2024-11-13
JableTVDownload WebUI

2024-11-12
flux webui

2024-11-09
open webui

2024-11-03
webui

2024-11-02
stable diffusion webui

2024-11-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด