speech synthesis ngngngan

VC/VC++ 2025-08-09

语音合成Ngngngan

python脚本下载和处理数据以训练越南MC Nguyen Ngoc ngan的语音合成模型

下载和处理音频以训练神经网络以模仿Ngan叔叔的声音

出于版权原因,这里只有代码,没有人愿意阅读下面的说明以运行自我训练的音频拉动代码

RVC检查点:https://hhggverface.co/doof-ferb/rvc-ngngan

Matcha-TTS检查点:https://hhgggingface.co/doof-ferb/matcha_ngngngan

演示:Matcha-tts?https://*h*uggin*gface.co/spaces/doof-ferb/matchatts_ngngan

要求

需要NVIDIA GPU

安装ffmpeg

git clone这个仓库

准备新的Python Env( venvconda
pip install torch torchaudio --find-links=https://download.p**yt*orch.org/whl/torch_stable.html
可选: pip install jupyter-lab tensorboard用于可视化
例如张量 - logdir <通往包含事件的文件夹localhost:6006 tensorboard --logdir <path to folder containing events.out.tfevents.*>

或直接运行pip install -r requirements.txt ,但可能不是最新的

工作流程

第1部分:准备RVC的数据

第2部分:例如RVC培训 +推理

第3部分:准备文本到语音的数据

第4.1部分:例如VITS 2培训(放弃Becse培训太长)

第4.2部分:例如Matcha-TTS培训

各种各样的

 git update-index --skip-worktree data/vits2_ngngngan_nosdp.json
git update-index --skip-worktree tensorboard/export_tensorboard_RVC.py
git update-index --skip-worktree tensorboard/export_tensorboard_MatchaTTS.py
下载源码

通过命令行克隆项目:

git clone https://github.com/phineas-pta/speech-synthesis-ngngngan.git