大規模音声モデル SpeechGPT-Gen: 8B パラメータ、ゼロサンプル音声生成
Webmaster Home は、復丹大学の研究者が、意味論的および知覚情報モデリングにおいて高い効率を備えた 8B パラメータの音声大規模言語モデルである SpeechGPT-Gen を立ち上げたと報告しました。このモデルは、ゼロショット テキスト読み上げ、音声変換、音声対話などの複数のアプリケーションで優れたパフォーマンスとスケーラビリティを実証します。情報チェーン生成 (CoIG) の使用
2025-02-01














