vall e Unduh - vall e Sumber Code Unduh

vall e

Kode Sumber AI

1.0.0

Unduh

Vall-e

Implementasi Pytorch tidak resmi dari Vall-E, berdasarkan tokenizer Encodec.

Mulai

Contoh mainan Google Colab :. Harap dicatat bahwa contoh ini menguasai satu ucapan di bawah data/test dan tidak dapat digunakan. Model pretrained belum datang.

Persyaratan

Karena pelatih didasarkan pada kecepatan, Anda harus memiliki GPU yang telah dikembangkan dan diuji oleh Deepspeed, serta kompiler CUDA atau ROCM yang telah diinstal untuk menginstal paket ini.

Memasang

 pip install git+https://github.com/enhuiz/vall-e

Atau Anda dapat dikloning oleh:

 git clone --recurse-submodules https://github.com/enhuiz/vall-e.git

Perhatikan bahwa kode hanya diuji di bawah Python 3.10.7 .

Kereta

Masukkan data Anda ke dalam folder, misalnya data/your_data . File audio harus dinamai dengan akhiran .wav dan file teks dengan .normalized.txt .
Menghitung data:

 python -m vall_e.emb.qnt data/your_data

Menghasilkan fonem berdasarkan teks:

 python -m vall_e.emb.g2p data/your_data

Kustomisasi konfigurasi Anda dengan membuat config/your_data/ar.yml dan config/your_data/nar.yml . Lihat Contoh Konfigurasi di config/test dan vall_e/config.py untuk detailnya. Anda dapat memilih preset model yang berbeda, periksa vall_e/vall_e/__init__.py .
Latih model AR atau NAR menggunakan skrip berikut:

 python -m vall_e.train yaml=config/your_data/ar_or_nar.yml

Anda dapat berhenti dari pelatihan Anda kapan saja dengan hanya mengetik quit di CLI Anda. Pos pemeriksaan terbaru akan disimpan secara otomatis.

Ekspor

Kedua model yang terlatih perlu diekspor ke jalur tertentu. Untuk mengekspor keduanya, jalankan:

 python -m vall_e.export zoo/ar_or_nar.pt yaml=config/your_data/ar_or_nar.yml

Ini akan mengekspor pos pemeriksaan terbaru.

Sintesis

 python -m vall_e <text> <ref_path> <out_path> --ar-ckpt zoo/ar.pt --nar-ckpt zoo/nar.pt

Todo

Model AR untuk quantizer pertama
Decoding audio dari token
Model NAR untuk kuantisasi sisanya
Pelatih untuk kedua model
Menerapkan Adaln untuk model NAR.
Pengambilan sampel tingkat kuantisasi sampel untuk pelatihan NAR.
Pos pemeriksaan dan demo pra-terlatih di libritts
Sintesis CLI

Melihat

EncodeC dilisensikan di bawah CC-BY-NC 4.0. Jika Anda menggunakan kode untuk menghasilkan kuantisasi audio atau melakukan decoding, penting untuk mematuhi ketentuan lisensi mereka.

Kutipan

 @article { wang2023neural ,
  title = { Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers } ,
  author = { Wang, Chengyi and Chen, Sanyuan and Wu, Yu and Zhang, Ziqiang and Zhou, Long and Liu, Shujie and Chen, Zhuo and Liu, Yanqing and Wang, Huaming and Li, Jinyu and others } ,
  journal = { arXiv preprint arXiv:2301.02111 } ,
  year = { 2023 }
}

 @article { defossez2022highfi ,
  title = { High Fidelity Neural Audio Compression } ,
  author = { Défossez, Alexandre and Copet, Jade and Synnaeve, Gabriel and Adi, Yossi } ,
  journal = { arXiv preprint arXiv:2210.13438 } ,
  year = { 2022 }
}

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-08-20
ukuran 796.54KB
Berasal dari Github

Aplikasi Terkait

Serangga E

2024-02-17
E

2022-09-04
Semua E

2022-09-02
Untuk E

2022-08-31
Dapatkan E

2022-08-30
Peretas E

2022-08-25

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua