Скачать SoCodec - Скачать исходный код SoCodec

SoCodec

AI Исходный код

1.0.0

Скачать

SOCODEC: речевой кодек с несколькими потоками для эффективного языкового речи на основе модели на основе речи.

Хаохан Го , Фенглонг Се, Кун Се, Дунчао Ян, Даке Го, Скюсин Ву, Хелен Мэн

Этот репозиторий содержит сценарии вывода для SocoDec, ультра-низко-битратного речевого кодека, посвященного моделям речевого языка, представленного в статье под названием SoCodec: многообороченный многопоточный кодек речевого речи для эффективного синтеза текста в рече .

Бумага
? Демо -сайт
⚙ Веса модели

С SoCodec вы можете сжать аудио в дискретные коды на ультра низком уровне 0,47 кбит / с битрейта и короткого съемки на 120 мс .
? Его можно использовать в качестве замены замены для ENCODEC или других многопоточных кодеков для приложений моделирования речевого языка.
Выпущенный контрольно -пропускной пункт теперь поддерживает только китайский . Обучение многоязычной версии ведется.

Новости

Сентябрь 2024 (v1.0):
- Мы выпустили контрольно -пропускной пункт и код вывода SOCODEC

Установка

Клонировать хранилище и установить зависимости:

git clone https://github.com/hhguo/SoCodec
cd SoCodec
mkdir ckpts && cd ckpts
wget https://huggingface.co/TencentGameMate/chinese-hubert-large/resolve/main/chinese-hubert-large-fairseq-ckpt.pt
wget https://huggingface.co/hhguo/SoCodec/resolve/main/socodec_16384x4_120ms_16khz_chinese.safetensors
wget https://huggingface.co/hhguo/SoCodec/resolve/main/mel_vocoder_80dim_10ms_16khz.safetensors

Использование

 # For analysis-synthesis
python example.py -i ground_truth.wav -o synthesis.wav
# For speech analysis
python example.py -i ground_truth.wav -o features.pt
# For token-to-audio synthesis
python example.py -i features.pt -o synthesis.wav