في حقل البودكاست ، أعلنت منصة Podcastle مؤخرًا عن إطلاق طراز Text-to-the AI الجديد ، Asyncflow V1.0. يوفر هذا النموذج المبتكر للمستخدمين أكثر من 450 صوتًا مختلفًا من الذكاء الاصطناعي ، ويغطي اللغات والتجويدات المتعددة ، واختيار الصوت بشكل كبير. بالإضافة إلى ذلك ، يفتح Podcastle أيضًا واجهة API للمطورين ، مما يسمح لهم بدمج ميزة النص إلى كلام هذه بسهولة في تطبيقاتهم ، وبالتالي تعزيز تجربة المستخدم.

قال أرتو يريتسسيان ، مؤسس بودكاسل ، إن الشركة أرادت منذ فترة طويلة تطوير نموذج نص إلى كلام عالي الجودة ، لكن هذا الهدف لم يتحقق بسبب ارتفاع تكاليف التدريب ومتطلبات البيانات في الماضي. ومع ذلك ، مع التطور السريع لتكنولوجيا نموذج اللغة الواسعة النطاق في السنوات الأخيرة ، حققت Podcastle أخيرًا اختراقًا كبيرًا العام الماضي ، وتمكنت من بناء نماذج صوتية عالية الجودة دون الحاجة إلى كمية كبيرة من البيانات. ذكرت Yeritsyan أيضًا أن البحث والتطوير في Podcastle كان مدعومًا بتمويل من سلسلة A بقيمة 13.5 مليون دولار في العام الماضي ، والذي يوفر دعمًا ماليًا قويًا لابتكارها التكنولوجي.
من حيث السعر ، يتم تسعير خدمة Podcastle Text-To-Voice بحوالي 40 دولارًا لكل 500 دقيقة ، وهو أكثر تنافسية من 99 دولارًا من Elevenlabs المنافسة. بالإضافة إلى نموذج النص إلى كلام ، تمت ترقية وظيفة استنساخ صوتي بودكاسل بشكل كبير. في الماضي ، كان على المستخدمين قراءة 70 جملة مختلفة لتدريب نموذج النطق ، ولكن الآن ، تم تقصير هذه العملية بشكل كبير إلى التسجيلات التي تستغرق بضع ثوانٍ فقط. هذا التحسن بفضل تقنية Magic Dust AI في Podcastle التي تم إطلاقها العام الماضي ، مما يحسن بشكل كبير جودة تسجيل الصوت ويجعل الاستنساخ الصوتي أكثر كفاءة ودقة.
في الاختبار الفعلي ، على الرغم من أن الصوت الذي تم إنشاؤه حديثًا يبدو روبوتيًا بعض الشيء ، إلا أنه لا يزال يحاكي نغمة المتحدث وإيقاعها جيدًا. وقال بودكاسل إنه مع التقدم المستمر للتكنولوجيا ، سيتم تحسين هذه الميزة تدريجياً ، ويمكن للمستخدمين أيضًا تدريب المزيد من المؤثرات الصوتية الطبيعية والمتنوعة من خلال توفير عينات تسجيل مختلفة.
يلاحظ Yeritsyan أنه بالإضافة إلى مزايا التكلفة ، يدمج Podcastle أيضًا أدوات الصوت والفيديو والبودكاست والأدوات السردية التي تعمل بمنظمة العفو الدولية في موقع ويب تم إعادة تصميمه ، وهي خطوة ستضع بودكاستل عن مسابقة السوق الشرسة. وذكر أنه على الرغم من أن معظم المستخدمين لا يزالون يستخدمون بشكل أساسي Podcastle لإنشاء محتوى الصوت ، إلا أن الطلب على إنتاج الفيديو يزداد تدريجياً ، مما يشير إلى أن Podcastle تعمل على توسيع نطاق الخدمة إلى حقول متعددة.
المدخل: https://podcastle.ai/ai-voices
النقاط الرئيسية:
يطلق Podcastle طراز Asyncflow V1.0 ، مما يوفر أكثر من 450 صوت AI.
يتقاضى المنصة 40 دولارًا لكل 500 دقيقة من النص إلى الصوت ، وهو أقل من أسعار المنافس.
تمت ترقية وظيفة الاستنساخ الصوتي ، وتم اختصار وقت التدريب بشكل كبير ، وتم تحسين تجربة المستخدم بشكل مستمر.