Kloning suara dan output ucapan dalam bahasa lain dengan suara asli.
Python 3.7 direkomendasikan. Diperlukan Python 3.7, karena versi TensorFlow yang digunakan dalam proyek ini.
python3 -m venv pyvenv
Aktifkan lingkungan virtual: windows: ./pyvenv/Scripts/activate macOS/linux: source pyvenv/bin/activate
Menonaktifkan Lingkungan Virtual: deactivate
Catatan: Lingkungan virtual Python Anda dapat menyebabkan masalah saat menjalankan UI.
Setelah diinstal, ekstrak folder dan tambahkan <ffmpeg folder path>/bin ke jalur.
pip3 install -r requirements.txt
Setelah diunduh, tambahkan model (*.pt) ke CogNative/CogNative/models/RTVC/saved_models/default
Folder Taco_Pretrained (termasuk folder itu sendiri) perlu diunduh dan ditambahkan ke CogNative/CogNative/models/RTVCSwedish/synthesizer/saved_models/swedish
credentials.json di direktori tingkat atas. Saat ini ada file bernama credentials.json.template , credentials.json Anda harus mencocokkan pasangan kunci/nilai yang ditunjukkan di sana. Mulai dari direktori root kognitif.
Untuk meluncurkan GUI, jalankan python -m CogNative.testUI.UI
Bendera yang diperlukan yang tidak ditentukan akan menyebabkan prompt dihasilkan yang harus dijawab sebelum melanjutkan. Contoh mengikuti.
python -m CogNative.main -help CogNative CLI FLags:
-sampleAudio <PATH>: audio file of voice to clone
-synType <text, audio>: synthesis mode either given input text or by transcribing audio file
[-dialogueAudio] <PATH>: for audio synType, audio file of dialogue to speak
[-dialogueText] <PATH>: for text synType, text string of dialogue to speak
-out <PATH>: output audio file path
-useExistingEmbed <y/yes/n/no>: Uses saved embedding of previously used voice samples if enabled and present.
python -m CogNative.main -sampleAudio CogNative/examples/MatthewM66.wav -synType text -dialogueText "The turbo-encabulator has now reached a high level of development, and it's being successfully used in the operation of novertrunnions." -out cmdExampleText.wav -useExistingEmbed y Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Synthesizing...
Clone output to cmdExampleText.wav
python -m CogNative.main -sampleAudio CogNativeexamplesMatthewM66.wav -synType audio -dialogueAudio CogNativeexamplesBillMaher22.wav -out cmdExampleAudio.wav -useExistingEmbed n Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Loading requested file...
Synthesizing...
Clone output to cmdExampleAudio.wav
Skrip ini akan menerjemahkan audio dari bahasa yang didukung ke bahasa Inggris. Untuk menggunakan skrip AutoTranslate pada Windows, seret dan letakkan file audio ke skrip atau letakkan pintasan ke skrip di %AppData%MicrosoftWindowsSendTo dan gunakan fungsi menu "kirim ke" konteks pada file audio yang akan diterjemahkan. Dalam kedua kasus, file .wav baru dengan nama file orginal diikuti oleh "_ + bahasa tujuan" akan ditempatkan di folder yang sama. Untuk platform lain, bendera CLI yang sama harus digunakan tetapi detail tentang integrasi menu konteks akan bervariasi dengan paket apa yang diinstal.
git branch yourname-feature-namePanduan gaya ini penting untuk memastikan bahwa semua gaya cocok di seluruh proyek. Untuk menata kode Anda, silakan gunakan styler Python hitam.
File Tunggal: black <python-file-name> Semua file: black .
Repositori GitHub ini berfungsi sebagai fondasi modul kloning suara kami.
Cloning voice-time-real-time
Lihat lisensi di sini.
Repositori GitHub ini melatih synthesizer Swedia.
Swedia-real-time-cloning Swedia