Unduh CogNative - Unduh Kode Sumber CogNative

CogNative

Kode Sumber AI

1.0.0

Unduh

Kognitif

Sintesis suara yang diterjemahkan

Kloning suara dan output ucapan dalam bahasa lain dengan suara asli.

Instalasi

1. Pasang Python:

Python 3.7 direkomendasikan. Diperlukan Python 3.7, karena versi TensorFlow yang digunakan dalam proyek ini.

2. Buat lingkungan virtual (opsional):

python3 -m venv pyvenv

Aktifkan lingkungan virtual: windows: ./pyvenv/Scripts/activate macOS/linux: source pyvenv/bin/activate

Menonaktifkan Lingkungan Virtual: deactivate

Catatan: Lingkungan virtual Python Anda dapat menyebabkan masalah saat menjalankan UI.

3. Instal FFMPEG.

Setelah diinstal, ekstrak folder dan tambahkan <ffmpeg folder path>/bin ke jalur.

4. Instal Pytorch:

Pytorch Build: Stabil (1.11.0).
OS Anda: Pilih OS lingkungan Anda berjalan kognitif di (Windows atau Linux yang disarankan).
Paket: Pilih penginstal paket apa yang Anda gunakan (PIP direkomendasikan).
Bahasa: Python.
Platform Hitung: CUDA 11.3 Direkomendasikan. Jika Anda tidak memiliki CPU pilihan GPU.

5. Pasang paket Python yang diperlukan:

pip3 install -r requirements.txt

6. Instal model.

Setelah diunduh, tambahkan model (*.pt) ke CogNative/CogNative/models/RTVC/saved_models/default

Folder Taco_Pretrained (termasuk folder itu sendiri) perlu diunduh dan ditambahkan ke CogNative/CogNative/models/RTVCSwedish/synthesizer/saved_models/swedish

7. Buat kredensial Google Cloud:

Ikuti langkah -langkah untuk mengatur kredensial Google Cloud.
Tambahkan kredensial Google ke credentials.json di direktori tingkat atas. Saat ini ada file bernama credentials.json.template , credentials.json Anda harus mencocokkan pasangan kunci/nilai yang ditunjukkan di sana.

Penggunaan

Mulai dari direktori root kognitif.

GUI

Untuk meluncurkan GUI, jalankan python -m CogNative.testUI.UI

Cli

Bendera yang diperlukan yang tidak ditentukan akan menyebabkan prompt dihasilkan yang harus dijawab sebelum melanjutkan. Contoh mengikuti.

Tampilkan Pesan Bantuan: python -m CogNative.main -help

 CogNative CLI FLags:
    -sampleAudio <PATH>: audio file of voice to clone
    -synType <text, audio>: synthesis mode either given input text or by transcribing audio file
    [-dialogueAudio] <PATH>: for audio synType, audio file of dialogue to speak
    [-dialogueText] <PATH>: for text synType, text string of dialogue to speak
    -out <PATH>: output audio file path
    -useExistingEmbed <y/yes/n/no>: Uses saved embedding of previously used voice samples if enabled and present.

Menghasilkan suara kloning dari sampel suara dan input teks: python -m CogNative.main -sampleAudio CogNative/examples/MatthewM66.wav -synType text -dialogueText "The turbo-encabulator has now reached a high level of development, and it's being successfully used in the operation of novertrunnions." -out cmdExampleText.wav -useExistingEmbed y

 Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Synthesizing...
Clone output to cmdExampleText.wav

Menghasilkan suara yang dikloning dari sampel suara dan audio file input: python -m CogNative.main -sampleAudio CogNativeexamplesMatthewM66.wav -synType audio -dialogueAudio CogNativeexamplesBillMaher22.wav -out cmdExampleAudio.wav -useExistingEmbed n

 Loaded encoder "english_encoder.pt" trained to step 1564501
Synthesizer using device: cuda
Building Wave-RNN
Trainable Parameters: 4.481M
Loading model weights at CogNativemodelsRTVCsaved_modelsdefaultvocoder.pt
Loading requested file...
Synthesizing...
Clone output to cmdExampleAudio.wav

Autotranslate Script

Skrip ini akan menerjemahkan audio dari bahasa yang didukung ke bahasa Inggris. Untuk menggunakan skrip AutoTranslate pada Windows, seret dan letakkan file audio ke skrip atau letakkan pintasan ke skrip di %AppData%MicrosoftWindowsSendTo dan gunakan fungsi menu "kirim ke" konteks pada file audio yang akan diterjemahkan. Dalam kedua kasus, file .wav baru dengan nama file orginal diikuti oleh "_ + bahasa tujuan" akan ditempatkan di folder yang sama. Untuk platform lain, bendera CLI yang sama harus digunakan tetapi detail tentang integrasi menu konteks akan bervariasi dengan paket apa yang diinstal.