用另一种语言克隆语音和输出语音。
建议使用Python 3.7。由于该项目中使用了TensorFlow的版本,因此需要Python 3.7。
python3 -m venv pyvenv
激活虚拟环境:Windows: ./pyvenv/Scripts/activate scripts/activate macos/linux: source pyvenv/bin/activate
停用虚拟环境: deactivate
注意:运行UI时,您的Python虚拟环境可能会引起问题。
安装后,提取文件夹,然后将<ffmpeg folder path>/bin添加到路径。
pip3 install -r requirements.txt
下载后,将模型(*.pt)添加到CogNative/CogNative/models/RTVC/saved_models/default
需要下载taco_pretrented文件夹(包括文件夹本身),并添加到CogNative/CogNative/models/RTVCSwedish/synthesizer/saved_models/swedish
credentials.json 。当前有一个名为credentials.json.template的文件,您的credentials.json应该匹配那里显示的键/值对。 从认知根目录开始。
要启动GUI,请运行python -m CogNative.testUI.UI
未指定的任何必要标志将导致生成提示,这些提示必须在继续之前回答。如下。
python -m CogNative.main -help CogNative CLI FLags:
-sampleAudio <PATH>: audio file of voice to clone
-synType <text, audio>: synthesis mode either given input text or by transcribing audio file
[-dialogueAudio] <PATH>: for audio synType, audio file of dialogue to speak
[-dialogueText] <PATH>: for text synType, text string of dialogue to speak
-out <PATH>: output audio file path
-useExistingEmbed <y/yes/n/no>: Uses saved embedding of previously used voice samples if enabled and present.
python -m CogNative.main -sampleAudio CogNative/examples/MatthewM66.wav -synType text -dialogueText "The turbo-encabulator has now reached a high level of development, and it's being successfully used in the operation of novertrunnions." -out cmdExampleText.wav -useExistingEmbed y Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Synthesizing...
Clone output to cmdExampleText.wav
python -m CogNative.main -sampleAudio CogNativeexamplesMatthewM66.wav -synType audio -dialogueAudio CogNativeexamplesBillMaher22.wav -out cmdExampleAudio.wav -useExistingEmbed n Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Loading requested file...
Synthesizing...
Clone output to cmdExampleAudio.wav
该脚本将将音频从受支持的语言转换为英语。要使用Windows上的自动转换脚本,请将音频文件拖放到脚本上,或将快捷方式放在%AppData%MicrosoftWindowsSendTo中,并使用“发送到“发送到”上下文菜单函数在音频文件上。在这两种情况下,一个带有原始文件名的新的.WAV文件,然后将“ _ +目标语言”放置在同一文件夹中。对于其他平台,应使用相同的CLI标志,但上下文菜单集成上的详细信息将因安装哪些软件包而有所不同。
git branch yourname-feature-name此样式指南对于确保整个项目中的所有样式匹配非常重要。要设计您的代码,请使用黑色Python Styler。
单文件: black <python-file-name>所有文件: black .
这个GitHub存储库是我们语音克隆模块的基础。
实时派遣
请参阅此处的许可证。
这个GitHub存储库训练了瑞典合成器。
实时混合瑞典语