RVC MAKER

VC/VC++ 2025-08-09

终极RVC MAKER ?

高质量的语音转换工具的重点是易于使用和性能。

描述

该项目全部是一个易于使用的语音转换工具。为了创建高质量和高性能的语音转换产品,该项目允许用户平稳,自然地改变声音。

项目功能

特征描述
音乐分离利用MDX-NET将音轨分开。
语音转换支持文件转换,批处理转换,低语转换以及文本到语音转换。
背景音乐编辑启用对背景音乐曲目的编辑和操纵。
对音频应用效果允许应用各种效果来增强或修改音频输出。
生成培训数据从链接的路径中创建培训数据以进行模型培训。
模型培训支持具有高质量编码器的V1和V2模型。
模型融合促进结合多个模型以增强性能。
阅读模型信息提供访问和显示模型元数据的功能。
导出到ONNX使训练有素的模型启用到ONNX格式以兼容。
从现有模型存储库中下载允许从已建立的存储库中下载模型。
在网上搜索模型支持在线搜索模型以便访问。
沥青提取从音频输入中提取音调信息。
支持使用ONNX模型的音频转换推理使用与ONNX兼容的模型来推断音频转换。
具有索引的ONNX RVC模型支持具有索引的ONNX RVC模型,以提高推理。
多个模型选项
F0pm, dio, mangio-crepe-tiny, mangio-crepe-small, mangio-crepe-medium, mangio-crepe-large, mangio-crepe-full, crepe-tiny, crepe-small, crepe-medium, crepe-large, crepe-full, fcpe, fcpe-legacy, rmvpe, rmvpe-legacy, harvest, yin, pyin, swipe
F0_ONNX :一些模型转换为ONNX进行加速螺距提取。
F0_HINBRID :结合了多种选项,例如, hybrid[rmvpe+harvest]或所有选项在一起。
嵌入式contentvec_base, hubert_base, japanese_hubert_base, korean_hubert_base, chinese_hubert_base, portuguese_hubert_base
Embedders_Onnx :预先转换的ONNX版本的嵌入式模型,用于提取。
Embedders_transformers :预先转换的嵌入模型的拥抱面部版本作为FairSeq的替代方案。
Spin_embedders :一种新的嵌入式提取模型,其潜在的质量比旧方法更高。

安装和用法

  • 步骤1 :从官方网站或Python安装Python(需要Python 3.10.x或Python 3.11.x
  • 步骤2 :从FFMPEG安装FFMPEG,提取它,然后将其添加到路径
  • 步骤3 :下载并提取源代码
  • 步骤4 :导航到源代码目录和打开命令提示或终端
  • 步骤5 :运行命令以安装所需的库
安装:您可以使用运行“ run_install.bat”安装URVC

或依次运行pip install -r requirements.txt

步骤6:运行`run_app`文件以打开用户界面(注意:请勿关闭接口的命令提示或终端)

另外,请在源代码目录中使用命令提示符或终端,以允许接口访问项目外部的文件,添加--allow_all_disk到命令:

 env\Scripts\python.exe main\app\app.py --open

使用张板进行训练监视

运行文件:张板或命令

 env\Scripts\python.exe main\app\tensorboard.py

命令行的用法

 python main\app\parser.py --help

笔记

  • 该项目仅支持NVIDIA GPU
  • 目前,像MRF Hifigan这样的新编码器尚未完成完整的预培训数据集
  • MRF Hifigan和Refinegan编码器不支持训练,而没有俯仰训练
  • URVC存储库中的模型是从AI Hub,HuggingFace和其他存储库中收集的。他们可能会携带不同的许可证(例如,AudiOldM2具有带有“非商业”条款的模型权重)。
  • 该源代码包含根据“非商业”条款许可的第三方软件组件。任何商业用途,包括征集捐赠或衍生品金融化,都可能侵犯许可证,并承担适当的法律责任。

使用条款

  • 您必须确保您上传的音频内容并通过此项目转换不会侵犯第三方的知识产权。

  • 该项目不得用于任何非法活动,包括但不限于欺诈,骚扰或对他人造成伤害。

  • 对于不当使用产品而造成的任何损害,您都是负责的。

  • 对于使用该项目而引起的任何直接或间接损害,我将不承担任何责任。

该项目是根据以下项目构建的

项目作者/组织执照
越南-RVC phạmhuỳnhanh麻省理工学院许可证
申请Iahispano麻省理工学院许可证
python-audio-separator Nomad Karaoke麻省理工学院许可证
基于检索的voice-conversion-webui RVC项目麻省理工学院许可证
rvc-onnx-y-anh phạmhuỳnhanh麻省理工学院许可证
火炬 - onnx-crepe-by-anh phạmhuỳnhanh麻省理工学院许可证
Hubert-No-Fairseq phạmhuỳnhanh麻省理工学院许可证
本地注意力菲尔·王麻省理工学院许可证
Torchfcpe cn_chitu麻省理工学院许可证
fcponnx尤里麻省理工学院许可证
ContentVec Kaizhi Qian麻省理工学院许可证
Mediafiredl圣地亚哥·阿里尔·曼西拉(Santiago Ariel Mansilla)麻省理工学院许可证
噪声蒂姆·塞恩堡麻省理工学院许可证
by-anh phạmhuỳnhanh麻省理工学院许可证
mega.py Marco Trevisan没有许可证
gdown肯塔罗·瓦达(Kentaro Wada)麻省理工学院许可证
耳语Openai麻省理工学院许可证
pyannoteaudio pyannote麻省理工学院许可证
AudioEditing Code希拉庄园麻省理工学院许可证
stftpitchshift JürgenHock麻省理工学院许可证
代号-rvc-fork-3代号; 0麻省理工学院许可证

模型搜索工具的模型存储库

  • Voice-Models.com

RVC中的音高提取方法

本文档提供了有关使用的音高提取方法的详细信息,包括基于个人经验的优点,局限性,优势和可靠性。

方法类型优势限制力量可靠性
下午Praat快速地较少准确低的低的
dio pyworld适用于说唱高频较差中等的中等的
收成pyworld比Dio更准确处理较慢高的很高
深度学习高精度需要GPU很高很高
Mangio-Crepe可丽饼的芬特针对RVC进行了优化有时不如原始可丽饼准确中至高中至高
fcpe深度学习准确,实时需要强大的GPU好的中等的
fcpe-eggacy老的准确,实时年龄较大好的中等的
rmvpe深度学习有效唱歌资源密集型很高出色的
RMVPE-LEGAICY老的支持较旧的系统年龄较大高的好的
天秤座简单,高效容易出现八度错误中等的低的
pyin天秤座比阴更稳定更复杂的计算好的好的
滑动世界高精度对噪声敏感高的好的

错误报告

  • 如果您在使用此源代码时遇到错误,我真诚地为经验不佳的经历道歉。您可以使用以下方法报告错误。

  • 您可以通过问题向我们报告错误。

下载源码

通过命令行克隆项目:

git clone https://github.com/unchCrew/RVC-MAKER.git