Клонировать голосовую и выходную речь на другом языке с оригинальным голосом.
Python 3.7 рекомендуется. Требуется Python 3.7 из -за версии Tensorflow, используемой в этом проекте.
python3 -m venv pyvenv
Активировать виртуальную среду: Windows: ./pyvenv/Scripts/activate macos/linux: source pyvenv/bin/activate
Деактивирование виртуальной среды: deactivate
Примечание. Ваша виртуальная среда Python может вызвать проблемы при запуске пользовательского интерфейса.
После установки извлеките папку и добавьте <ffmpeg folder path>/bin в путь.
pip3 install -r requirements.txt
После загрузки добавьте модели (*.pt) в CogNative/CogNative/models/RTVC/saved_models/default
Папка TACO_PRETRINGINE (включая саму папку) должна быть загружена и добавлена в CogNative/CogNative/models/RTVCSwedish/synthesizer/saved_models/swedish
credentials.json . В настоящее время существует файл с именем credentials.json.template , ваши credentials.json . Начните с познавательного корневого каталога.
Чтобы запустить графический интерфейс, запустите python -m CogNative.testUI.UI
Любые необходимые флаги, которые не указаны, приведут к сгенерированию подсказки, на которую необходимо ответить до продолжения. Примеры следуют.
python -m CogNative.main -help CogNative CLI FLags:
-sampleAudio <PATH>: audio file of voice to clone
-synType <text, audio>: synthesis mode either given input text or by transcribing audio file
[-dialogueAudio] <PATH>: for audio synType, audio file of dialogue to speak
[-dialogueText] <PATH>: for text synType, text string of dialogue to speak
-out <PATH>: output audio file path
-useExistingEmbed <y/yes/n/no>: Uses saved embedding of previously used voice samples if enabled and present.
python -m CogNative.main -sampleAudio CogNative/examples/MatthewM66.wav -synType text -dialogueText "The turbo-encabulator has now reached a high level of development, and it's being successfully used in the operation of novertrunnions." -out cmdExampleText.wav -useExistingEmbed y Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Synthesizing...
Clone output to cmdExampleText.wav
python -m CogNative.main -sampleAudio CogNativeexamplesMatthewM66.wav -synType audio -dialogueAudio CogNativeexamplesBillMaher22.wav -out cmdExampleAudio.wav -useExistingEmbed n Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Loading requested file...
Synthesizing...
Clone output to cmdExampleAudio.wav
Этот сценарий переведет аудио с поддерживаемого языка на английский. Чтобы использовать скрипт AutotransLate в Windows, перетащите аудиофайл на скрипт или поместите ярлык в скрипт в %AppData%MicrosoftWindowsSendTo и используйте функцию «Отправить в контекстное меню на аудиофайл». В обоих случаях новый файл .wav с оргментаром файла, за которым следует «_ + назначенный язык», будет помещен в одну и ту же папку. Для других платформ следует использовать те же флаги CLI, но подробности об интеграции контекстных меню будут варьироваться в зависимости от того, какие пакеты установлены.
git branch yourname-feature-nameЭто руководство по стилю важно, чтобы убедиться, что все стиль совпадают на протяжении всего проекта. Чтобы уколоть свой код, используйте Black Python Styler.
Одиночный файл: black <python-file-name> Все файлы: black .
Этот репозиторий GitHub служит основой нашего модуля голосового клонирования.
Клонирование в реальном времени
Смотрите лицензию здесь.
Этот репозиторий GitHub обучил шведский синтезатор.
В реальном времени голос клонирует шведский