Lightning แบบจำลองข้อความพูดคุยแบบเร็วเป็นพิเศษ: เวลาแฝงต่ำสุด, 100 มิลลิวินาทีจาก 10 วินาทีของบทความ AI-AI

ผู้เขียน：Eve Cole เวลาอัปเดต：2025-02-13 02:16:02

Smallest.ai ซึ่งเป็น American AI Startup ได้เปิดตัวผลิตภัณฑ์ล่าสุด Lightning รุ่น Text-to-Speech (TTS) ด้วยความเร็วที่น่าทึ่ง Lightning สร้างเสียงได้มากถึง 10 วินาทีใน 100 มิลลิวินาทีรองรับสำเนียงหลายรายการเป็นภาษาอังกฤษและภาษาฮินดีและวางแผนที่จะสนับสนุนภาษาเพิ่มเติม ต้นทุนต่ำ (เพียง $ 0.02 ต่อนาที) และการออกแบบ REST API อย่างง่ายทำให้เหมาะสำหรับนักพัฒนาหุ่นยนต์เสียงลดค่าใช้จ่ายในการพัฒนาและการดำเนินงานอย่างมากและปรับปรุงประสิทธิภาพการสังเคราะห์เสียงและการเข้าถึงแอพพลิเคชั่น บทความนี้จะวิเคราะห์ลักษณะการทำงานที่หลากหลายการวางตำแหน่งตลาดและวิสัยทัศน์ขององค์กรที่เล็กที่สุดในรายละเอียด

เมื่อเร็ว ๆ นี้เล็กที่สุดในการเริ่มต้น AI ซึ่งตั้งอยู่ในซานฟรานซิสโกรัฐแคลิฟอร์เนียได้เปิดตัว Lightning ผลิตภัณฑ์ใหม่ซึ่งเป็นรุ่น Text-to-Speech (TTS) ที่สามารถสร้างเสียงได้สูงสุด 10 วินาทีใน 100 มิลลิวินาที ความก้าวหน้าของเทคโนโลยีนี้ทำให้นักพัฒนาทั่วโลกสามารถสร้างแอปพลิเคชันหุ่นยนต์เสียงที่จำลองขึ้นมาสูงด้วยเวลาหน่วงเวลาที่สั้นมากลดต้นทุนการใช้งานและปรับปรุงการเข้าถึงแอปพลิเคชัน

ปัจจุบันสายฟ้ารองรับสำเนียงหลายภาษาเป็นภาษาอังกฤษและภาษาฮินดีและทีมยังวางแผนที่จะเพิ่มภาษาเพิ่มเติมเพื่อตอบสนองความต้องการของตลาดอย่างรวดเร็ว การกำหนดราคาที่เพียง 0.02 ดอลลาร์สหรัฐต่อนาที (ประมาณ 1.6 รูปี) รุ่นนี้ให้บริการโซลูชันที่คุ้มค่าสำหรับนักพัฒนาหุ่นยนต์เสียงโดยมีค่าใช้จ่ายในการใช้งานแอปพลิเคชันที่ควบคุมต่ำกว่า 1 ต่อนาทีลดค่าใช้จ่ายในการสร้างหุ่นยนต์เสียงและขยายการเข้าถึงตลาด

ซึ่งแตกต่างจากรุ่น TTS แบบดั้งเดิมที่อาศัยการสตรีมและซ็อกเก็ตเครือข่ายเพื่อเพิ่มภาระเซิร์ฟเวอร์และความสามารถในการปรับขนาดที่ซับซ้อน Lightning ใช้การออกแบบ REST API อย่างง่ายเพื่อให้เสียงส่งมอบในประมาณ 100 มิลลิวินาทีหลีกเลี่ยงการสตรีมอย่างต่อเนื่อง พลังการประมวลผลที่รวดเร็วและประสิทธิภาพด้านต้นทุนทำให้เป็นทางเลือกสำคัญในอุตสาหกรรมหุ่นยนต์เสียง

คุณสมบัติผลิตภัณฑ์ของ Lightning สามารถสรุปได้ดังนี้

1. ความเร็วและประสิทธิภาพ เป็นที่รู้จักกันในนามข้อความที่เร็วที่สุดในโลกรูปแบบสายฟ้าสร้างเสียงเซอร์เรียล 10 วินาทีใน 100 มิลลิวินาทีการสังเคราะห์เสียงแบบเรียลไทม์ตอบสนองความต้องการของการตอบสนองที่รวดเร็ว

2. ขนาดเล็กและเข้ากันได้ ด้วยความต้องการหน่วยความจำวิดีโอน้อยกว่า 1GB รุ่นมีขนาดเล็กและสามารถทำงานกับผู้บริโภคและอุปกรณ์ขอบส่วนใหญ่ได้อย่างง่ายดายลดความต้องการฮาร์ดแวร์

3. การสนับสนุนหลายภาษา การสนับสนุนหลายภาษาและสำเนียงปัจจุบันรองรับสำเนียงหลายภาษาเป็นภาษาอังกฤษและภาษาฮินดีและวางแผนที่จะเพิ่มภาษาเพิ่มเติมอย่างรวดเร็วเพื่อตอบสนองความต้องการของผู้ใช้ทั่วโลก

4. ปรับแต่งได้สูง สไตล์ diffuser โดยใช้ diffuser สไตล์พิเศษปรับสไตล์เสียงตามความต้องการของผู้ใช้ทำให้เสียงที่สร้างขึ้นเป็นธรรมชาติและอารมณ์มากขึ้น

5. การรวมง่าย REST API Integration ให้อินเทอร์เฟซ REST API อย่างง่ายซึ่งนักพัฒนาสามารถรวมรุ่น Lightning เข้ากับระบบที่มีอยู่ได้อย่างรวดเร็วโดยกำจัดการเชื่อมต่อ WebSocket ที่ซับซ้อน

6. ราคาที่ไม่แพงเริ่มต้นที่ US $ 0.04 ต่อนาทีซึ่งเหมาะสำหรับองค์กรทุกประเภท

เล็กที่สุดเท่าที่จะก่อตั้งโดยสถาบันเทคโนโลยีแห่งอินเดียศิษย์เก่า Guwahati Sudarshan Kamath และ Akshat Mandloi Kamath กล่าวว่ากลยุทธ์ที่มีราคาต่ำที่สุดของ AI นั้นเกิดจากการมุ่งเน้นคุณภาพข้อมูลและประสิทธิภาพของโมเดล “ โมเดลของเรามีขนาดเล็กกว่าคู่แข่งอย่าง Elevenlabs มาก แต่เราได้รับเสียงที่มีคุณภาพสูงด้วยข้อมูลที่ได้รับการกลั่นสูง” เขาอธิบาย

นักพัฒนาหุ่นยนต์เสียงที่สามารถเข้าถึงสายฟ้าได้ก่อนรายงานว่าค่าใช้จ่ายในการดำเนินงานของพวกเขาลดลง 8 ครั้งในขณะที่คุณภาพเสียงดีขึ้น นอกเหนือจากแอพหุ่นยนต์เสียงแบบเรียลไทม์สายฟ้ายังสามารถใช้เพื่อสร้างเสียงพากย์สำหรับหนังสือเสียงและเนื้อหาโซเชียลมีเดียเช่นแพลตฟอร์มเช่น Instagram และ YouTube ผู้ที่ไม่ใช่นักพัฒนายังสามารถเข้าถึง Lightning ผ่านแพลตฟอร์มคำพูดของ Waves เพื่อสัมผัสกับคุณสมบัติรวมถึงการโคลนเสียงและการแปลงสำเนียงซึ่งปัจจุบันอยู่ในเบต้า

Kamath กล่าวในการมีปฏิสัมพันธ์กับวารสารการวิเคราะห์อินเดีย:“ เมื่อเราเริ่มสร้างมันเราตระหนักว่าแบบจำลองที่จำเป็นสำหรับหุ่นยนต์เสียงที่มีอยู่นั้นไม่เติบโตพอสำหรับภาษาอินเดีย การผลิต” ต้องการ "

ในเดือนมิถุนายนปีนี้มีขนาดเล็กที่สุดในรุ่น Awaaz ซึ่งรองรับการโคลนเสียงผ่านคลิปเสียงสั้น ๆ และมีราคาในราคาที่แข่งขันได้ แบบจำลองนี้ได้รับการออกแบบมาเพื่อตอบสนองแอพพลิเคชั่นที่ปรับขนาดได้ในตลาดภาษาระดับภูมิภาคและเพื่อให้ความปลอดภัยระดับองค์กรและการปฏิบัติตามกฎระเบียบ เมื่อถามถึงภารกิจของมัน Kamath กล่าวว่า“ ทำไมคนพันล้านคนไม่ได้สื่อสารกับ AI Voice ทุกวันแม้จะมีความก้าวหน้าอย่างมากในเทคโนโลยี AI?

ทางเข้าโครงการ: https://smallest.ai/blog/lightning-fast-text-to-peech

ประเด็นสำคัญ:

รุ่น Lightning Text-to-Speech สร้างเสียงใน 100 มิลลิวินาทีรองรับสำเนียงหลายรายการเป็นภาษาอังกฤษและภาษาฮินดีและจะขยายภาษามากขึ้นในอนาคต

ด้วยค่าใช้จ่ายต่ำเพียง $ 0.02 ต่อนาทีจึงช่วยลดค่าใช้จ่ายในการดำเนินงานของนักพัฒนาหุ่นยนต์เสียงได้อย่างมีนัยสำคัญ

สายฟ้าไม่เพียง แต่เหมาะสำหรับหุ่นยนต์เสียงเท่านั้น แต่ยังรวมถึงหนังสือเสียงและสื่อสังคมออนไลน์ทำให้ง่ายขึ้นสำหรับนักพัฒนาและนักพัฒนาที่จะใช้

ในระยะสั้นรูปแบบฟ้าผ่าของ Lightning คาดว่าจะปฏิวัติสาขาการสังเคราะห์การพูดด้วยความเร็วประสิทธิภาพประสิทธิภาพต่ำและใช้งานง่ายทำให้นักพัฒนาทั่วโลกและผู้ใช้มีบริการ AI ที่สะดวกและประหยัดมากขึ้น วิสัยทัศน์ของมันในการแก้ปัญหาความละม้ายคล้ายคลึงของเทคโนโลยีเสียง AI ก็มีค่าควรแก่ความสนใจเช่นกัน