イレブンラボは、新しい音声合成モデルである Flash をリリースしました。これは、わずか 75 ミリ秒という超低遅延を備えた現在最速のテキスト読み上げ (TTS) ソリューションです。この画期的な開発は、リアルタイムの対話を必要とする会話型 AI アプリケーションに特に適しており、人間とコンピューターの対話のスムーズさと自然さが大幅に向上します。 Flash モデルには、Flash v2 (英語をサポート) と Flash v2.5 (32 の言語をサポート) の 2 つのバージョンがあり、ユーザーは Celebrities の会話型 AI プラットフォームと API を通じて直接体験できます。音質や感情表現の点ではTurboモデルに若干劣るものの、スピードの点ではFlashが明らかに上回り、ブラインドテストではトップに立った。

Flash モデルは 2 つのバージョンに分かれており、Flash v2 は英語のみをサポートし、Flash v2.5 は 32 の言語をサポートします。両方のモデルを使用する場合、ユーザーは生成するキャラクター 2 人ごとに 1 ポイントを消費します。 Flash モデルは、音質と感情の深さの点で Turbo モデルよりわずかに劣りますが、その低遅延パフォーマンスにより、ブラインド テストで他のクラスを飛び越えることができ、このクラスで最速のオプションとなりました。
イレブンラボの技術チームは、Flashモデルの発売により、人間とコンピュータの対話のスムーズさと自然さが大幅に促進されるだろうと述べた。開発者は、API を通じてモデル ID「eleven_flash_v2」および「eleven_flash_v2_5」を直接呼び出すことができます。具体的な API リファレンス資料は、イレブンラボの公式 Web サイトにあります。このイノベーションを通じて、イレブンラボは、より低遅延で人間らしい対話と対話のシナリオを開拓したいと考えています。

イレブンラボは、カスタマイズされた音声アシスタント、オーディオ制作ツール、ダビングスタジオなど、さまざまな分野のユーザーや開発者が高品質の AI オーディオ作成を実現できるように設計されたさまざまな製品とソリューションも提供しています。さらに、イレブンラボは研究開発も積極的に行っており、ユーザーの高まるニーズに応えるために製品の技術レベルの向上を続けています。
ハイライト:
Flash モデルの音声生成の遅延はわずか 75 ミリ秒であり、低遅延の会話型音声アシスタントに適しています。
Flash v2.5 は 32 の言語をサポートしており、ユーザーが生成した 2 文字ごとに 1 ポイントのコストがかかります。
ブラインド テストでは、Flash モデルは他の同様の製品を上回り、最速のテキスト読み上げソリューションとなりました。
全体として、イレブンラボの Flash モデルは、超低遅延と多言語サポートにより、会話型 AI アプリケーションに新たな可能性をもたらし、将来的には人間とコンピューターの対話がよりスムーズかつ自然になることを示しています。速度の面での利点により、市場で主要なテキスト読み上げソリューションの 1 つとなっており、開発者とユーザーの注目に値します。