UTAUTAI下载 - UTAUTAI源代码下载

UTAUTAI

Ai源码

1.0.0

下载

UTAUTAI：无限制的自动化技术人工间

读书我

快速索引

模型架构
？什么是Utautai？
？方法
？
欣赏
展示您的支持
欢迎捐款

模型架构

Utautai主要建筑对不起，手工绘制

？什么是Utautai？

一个开源存储库，旨在从歌词中产生匹配的人声和乐器曲目，类似于Suno Ai的chir和riffusion。

？方法

Utautai的方法主要是受长矛TT的启发

在培训期间，输入包括从“歌词2semantic AR”获得的语义令牌，该语义令牌从歌词中提取语义令牌以及声学令牌。此外，从音乐中得出的MERT表示受到K均值量化以获得进一步的语义令牌。

但是，在推断期间，不可能从音乐中获得MERT表示。因此，我们按照提示TTS2的方法来训练样式模块，以从推理过程中从提示中获取目标MERT表示。样式模块由基于变压器的扩散模型组成。

我认为使用这种方法，我们可以成功完成目标任务。你怎么认为？

？

我们如何获得与裁剪音频相匹配的歌词？还是我们首先应该裁剪音频？代码
检查对音节化和特殊令牌的处理，并进行必要的代码修改。代码
更正数据集中的碰撞器。代码
完成StyleModule推理代码。代码
其他次要代码修复，例如掩盖策略。
消除扩散模型并调整一致性模型。

欣赏

长矛TTS纸
VALL-E纸
自动点盒纸
Soundstorm纸
Musiclm纸
audiolm纸
Musicgen Paper
提示纸
Lucidrains的Soundstorm Repo
Soundstorm SpeechTokenizer
Lifeititeng的Vall-e
Plachtaa的Vall-ex
吠

展示您的支持

如果您发现Utautai有趣且有用，请在Github上给我们一颗星星！测试仪鼓励我们不断改进模型并添加令人兴奋的功能。

欢迎捐款

总是欢迎捐款。

展开

附加信息

版本 1.0.0
类型 Ai源码
更新时间 2025-08-23
大小 383.12KB
来自于 Github

UTAUTAI

UTAUTAI：无限制的自动化技术人工间

读书我

快速索引

模型架构

？什么是Utautai？

？方法

？

欣赏

展示您的支持

欢迎捐款

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express