ในฟิลด์พอดคาสต์แพลตฟอร์มพอดคาสเซิลเพิ่งประกาศเปิดตัว AsyncFlow V1.0 รุ่น Text-to-Speech รุ่นใหม่ รูปแบบที่เป็นนวัตกรรมนี้ช่วยให้ผู้ใช้มีเสียง AI ที่แตกต่างกันมากกว่า 450 เสียงครอบคลุมหลายภาษาและเสียงสูงด้วยเสียงที่เพิ่มขึ้นอย่างมาก นอกจากนี้พอดคาสเซิลยังเปิดอินเทอร์เฟซ API ให้กับนักพัฒนาช่วยให้พวกเขาสามารถรวมคุณลักษณะข้อความนี้เข้ากับแอปพลิเคชันของพวกเขาได้อย่างง่ายดายซึ่งจะช่วยเพิ่มประสบการณ์ผู้ใช้

Arto Yeritsyan ผู้ก่อตั้ง Podcastle กล่าวว่า บริษัท ต้องการพัฒนารูปแบบข้อความเป็นคำพูดที่มีคุณภาพสูงมานาน แต่เป้าหมายนี้ยังไม่ประสบความสำเร็จเนื่องจากค่าใช้จ่ายในการฝึกอบรมที่สูงและข้อกำหนดด้านข้อมูลในอดีต อย่างไรก็ตามด้วยการพัฒนาอย่างรวดเร็วของเทคโนโลยีโมเดลภาษาขนาดใหญ่ในช่วงไม่กี่ปีที่ผ่านมาพอดคาสเซิลได้สร้างความก้าวหน้าครั้งสำคัญเมื่อปีที่แล้วและสามารถสร้างแบบจำลองเสียงที่มีคุณภาพสูงโดยไม่ต้องใช้ข้อมูลจำนวนมาก Yeritsyan ยังกล่าวอีกว่าการวิจัยและพัฒนาของพอดคาสเซิลได้รับการสนับสนุนจากการจัดหาเงินทุนซีรี่ส์ A 13.5 ล้านดอลลาร์เมื่อปีที่แล้วซึ่งให้การสนับสนุนทางการเงินที่แข็งแกร่งสำหรับนวัตกรรมทางเทคโนโลยี
ในแง่ของราคาบริการข้อความเป็นข้อความของพอดคาสเซิลมีราคาอยู่ที่ประมาณ $ 40 ต่อ 500 นาทีซึ่งมีการแข่งขันมากกว่า $ 99 จากคู่แข่งสิบเอ็ดคน นอกเหนือจากโมเดลข้อความเป็นคำพูดแล้วฟังก์ชั่นการโคลนเสียงของพอดคาสเซิลยังได้รับการอัพเกรดอย่างมีนัยสำคัญ ในอดีตผู้ใช้ต้องอ่านประโยคที่แตกต่างกัน 70 ประโยคเพื่อฝึกอบรมรูปแบบการออกเสียง แต่ตอนนี้กระบวนการนี้สั้นลงอย่างมากในการบันทึกที่ใช้เวลาเพียงไม่กี่วินาที การปรับปรุงนี้ต้องขอบคุณเทคโนโลยี Magic Dust AI ของพอดคาสเซิลที่เปิดตัวเมื่อปีที่แล้วซึ่งช่วยปรับปรุงคุณภาพการบันทึกเสียงอย่างมีนัยสำคัญและทำให้การโคลนเสียงมีประสิทธิภาพและแม่นยำยิ่งขึ้น
ในการทดสอบจริงแม้ว่าเสียงที่สร้างขึ้นใหม่จะฟังดูหุ่นยนต์เล็กน้อย แต่ก็ยังเลียนแบบเสียงและจังหวะของลำโพงได้ดี พอดคาสเซิลกล่าวว่าด้วยความก้าวหน้าของเทคโนโลยีอย่างต่อเนื่องคุณลักษณะนี้จะค่อยๆดีขึ้นและผู้ใช้ยังสามารถฝึกอบรมเอฟเฟกต์เสียงที่เป็นธรรมชาติและหลากหลายมากขึ้นโดยการจัดทำตัวอย่างการบันทึกที่แตกต่างกัน
Yeritsyan ตั้งข้อสังเกตว่านอกเหนือจากข้อได้เปรียบด้านค่าใช้จ่ายพอดคาสเซิลยังรวมเสียงวิดีโอพอดคาสต์และเครื่องมือเล่าเรื่องที่ขับเคลื่อนด้วย AI ลงในเว็บไซต์ที่ออกแบบใหม่ เขากล่าวว่าแม้ว่าผู้ใช้ส่วนใหญ่จะยังคงใช้พอดคาสต์สำหรับการสร้างเนื้อหาเสียง แต่ความต้องการการผลิตวิดีโอก็ค่อยๆเพิ่มขึ้นเรื่อย ๆ แสดงให้เห็นว่าพอดคาสเซิลกำลังขยายขอบเขตการบริการไปยังหลายสาขา
ทางเข้า: https://podcastle.ai/ai-voices
ประเด็นสำคัญ:
Podcastle เปิดตัว AsyncFlow v1.0 รุ่นให้เสียง AI มากกว่า 450 เสียง
แพลตฟอร์มคิดค่าใช้จ่าย $ 40 ต่อ 500 นาทีของข้อความต่อเสียงซึ่งต่ำกว่าราคาของคู่แข่ง
ฟังก์ชั่นการโคลนเสียงได้รับการอัพเกรดเวลาการฝึกอบรมได้สั้นลงอย่างมากและประสบการณ์การใช้งานได้รับการปรับให้เหมาะสมอย่างต่อเนื่อง