Głosik
Głosik (ออกเสียงว่า "gwoh-seek") เป็นแอพตัวอย่างสำหรับแสดงระบบ F5-TTS to-to-speech โดยใช้ MLX Swift ชื่อมาจากคำภาษาโปแลนด์ "głos" (เสียง) พร้อมคำต่อท้ายจิ๋ว "-IK"
นี่คือที่เก็บเดิมของการใช้งาน: https://github.com/lucasnewman/f5-tts-swift
f5tts_demo.mp4
ดูการสาธิตด้านบนเพื่อดูGłosikในการดำเนินการ!
ความต้องการ
- macos 14.0 หรือใหม่กว่า
- iOS 16.0 หรือใหม่กว่า
- Visionos 1.0 หรือใหม่กว่า
- xcode 15.0 หรือใหม่กว่า
- Swift 5.9 หรือใหม่กว่า
การติดตั้ง
- โคลนที่เก็บ
- เปิด
Glosik.xcodeproj ใน xcode - สร้างและเรียกใช้โครงการ
การใช้งาน
- ป้อนข้อความที่คุณต้องการแปลงเป็นคำพูด
- (ไม่บังคับ) บันทึกหรือเลือกตัวอย่างเสียงอ้างอิง:
- ไปที่แท็บ "อ้างอิง"
- บันทึกตัวอย่างเสียงใหม่และให้ข้อความอ้างอิง
- บันทึกเป็นตัวอย่างอ้างอิง
- เลือกจากตัวเลือกอ้างอิงในแท็บ "สร้าง"
- คลิก "สร้างคำพูด" เพื่อสร้างเสียง
- ใช้ตัวควบคุมการเล่นเพื่อฟังคำพูดที่สร้างขึ้น
- บันทึกเสียงที่สร้างขึ้นเป็นไฟล์ WAV
คุณสมบัติ
การสร้างข้อความเป็นคำพูด
- การสังเคราะห์คำพูดที่มีคุณภาพสูงโดยใช้โมเดล F5-TTS
- การติดตามความคืบหน้าการสร้างแบบเรียลไทม์
- สถิติการสร้างเวลา
- การตรวจสอบการใช้หน่วยความจำ GPU
การสนับสนุนเสียงอ้างอิง
- บันทึกตัวอย่างอ้างอิงใหม่พร้อมข้อความประกอบ
- จัดการตัวอย่างอ้างอิงที่บันทึกไว้
- เลือกตัวอย่างอ้างอิงสำหรับการสร้างคำพูด
- เล่นตัวอย่างอ้างอิง
- สนับสนุนรูปแบบ Mono, 24kHz WAV
UI ที่ทันสมัย
- อินเทอร์เฟซ Swiftui ดั้งเดิม
- การนำทางมุมมองแบบแยก
- รองรับโหมดมืด
- การสนับสนุนข้ามแพลตฟอร์ม (macOS, iOS, VisionOS)
- คุณสมบัติการเข้าถึง
โครงสร้างโครงการ
โครงการแบ่งออกเป็นสองส่วนหลัก:
-
Glosik : แอปพลิเคชันหลัก -
GlosikUI : แพ็คเกจส่วนประกอบ Swiftui ที่ใช้ซ้ำได้
ใบอนุญาต
โครงการนี้ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT ดูไฟล์ใบอนุญาตสำหรับรายละเอียด