Minimania เป็นเว็บแอปพลิเคชันที่ให้ความสามารถในการพูดแบบข้อความ (TTS) และความสามารถในการโคลนด้วยเสียง แอปพลิเคชันใช้โมเดลการเรียนรู้อย่างลึกซึ้งเพื่อสร้างผลลัพธ์การพูดที่มีคุณภาพสูงในหลายภาษาพร้อมตัวเลือกในการปรับแต่งระดับเสียงความเร็วและปริมาณของเสียงที่สร้างขึ้น เครื่องยนต์ TTS ของ Minimania ถูกสร้างขึ้นที่ด้านบนของรุ่น Tacotron 2 และ Waveglow ในขณะที่ความสามารถในการโคลนเสียงนั้นขึ้นอยู่กับรุ่น Fastspeech และ Melgan
คลิกลิงก์ mega เพื่อดูการสาธิต: ลิงก์สำหรับวิดีโอ
ก่อนที่คุณจะสามารถติดตั้งและใช้ MimicMania คุณจะต้องดาวน์โหลดและติดตั้งสิ่งต่อไปนี้:
apt-get install ffmpeg ในเทอร์มินัลของคุณsudo apt-get install espeak-ng ในเทอร์มินัลของคุณsudo apt-get install espeak ในเทอร์มินัลของคุณนอกจากนี้คุณจะต้องดาวน์โหลดโมดูลที่จำเป็นและการพึ่งพา Python ตามที่อธิบายไว้ในส่วนถัดไป
ในการติดตั้งและเรียกใช้ MimicMania ให้ทำตามขั้นตอนเหล่านี้:
git clone https://github.com/everydaycodings/MimicMania.gitcd MimicManiapython setup.py เพื่อดาวน์โหลดโมดูลที่ต้องการ กระบวนการนี้อาจใช้เวลาพอสมควรเนื่องจากโมดูลที่ต้องการอยู่ที่ประมาณ 6 GBpip install -r requirements.txt เพื่อดาวน์โหลดการพึ่งพา Python ทั้งหมดstreamlit run app.py เพื่อเริ่มเว็บแอปพลิเคชัน หากคุณต้องการมีส่วนร่วมใน MimicMania โปรดแยกที่เก็บและสร้างคำขอดึง เรายินดีต้อนรับการมีส่วนร่วมทุกชนิดรวมถึงการแก้ไขข้อผิดพลาดคุณสมบัติใหม่และการปรับปรุงเอกสาร
Mimicmania ได้รับการพัฒนาโดย Kumar Saksham (EverydayCodings) ด้วยความช่วยเหลือของแหล่งข้อมูลโอเพ่นซอร์สต่างๆ
เราขอขอบคุณเป็นพิเศษสำหรับ Coqui-AI/TTS สำหรับการจัดทำโมเดลข้อความเป็นคำพูดของพวกเขาเป็นทรัพยากรสำหรับโครงการของเรา
Mimicmania ได้รับใบอนุญาตภายใต้ใบอนุญาต MIT
หากคุณมีคำถามหรือปัญหาใด ๆ กับ MimicMania โปรดติดต่อเราที่ [email protected] หรือติดต่อเราทาง Twitter @EveryDayCodings หรือ Medium @EveryDayCodings
เรายินดีที่จะช่วยเหลือเสมอ!