Unduh parrots - Unduh Kode Sumber parrots

parrots

Kode Sumber AI

1.0.1

Unduh

?? Cina | Bahasa Inggris | Dokumen/dokumen | ? Model/model

Demo online

Parrots: Asr dan TTS Toolkit

Perkenalan

Burung beo, pengenalan ucapan otomatis ( ASR ), toolkit Text-to-Speech ( TTS ), Dukungan Cina, Inggris, Jepang, dll.

Burung beo mengimplementasikan panggilan satu klik untuk pengenalan suara dan model sintesis ucapan, yang berada di luar kotak dan mendukung bahasa Mandarin dan Inggris.

Fitur

ASR: Model pengenalan ucapan Cina (ASR) berdasarkan distilwhisper , mendukung berbagai bahasa seperti Cina dan Inggris.
TTS: model sintesis suara (TTS) berdasarkan pelatihan GPT-SoVITS , mendukung bahasa Cina, Inggris, Jepang, dan bahasa lainnya

Memasang

pip install torch # or conda install pytorch
pip install -r requirements.txt
pip install parrots

atau

pip install torch # or conda install pytorch
git clone https://github.com/shibing624/parrots.git
cd parrots
python setup.py install

Demo

Demo resmi: https://www.mulanai.com/product/tts/
Demo HuggingFace: https://huggingface.co/spaces/shibing624/parrots

Jalankan Contoh: Contoh/tts_gradio_demo.py untuk melihat demo:

python examples/tts_gradio_demo.py

Penggunaan

ASR (pengakuan ucapan)

Contoh: Contoh/demo_asr.py

 import os
import sys

sys . path . append ( '..' )
from parrots import SpeechRecognition

pwd_path = os . path . abspath ( os . path . dirname ( __file__ ))

if __name__ == '__main__' :
    m = SpeechRecognition ()
    r = m . recognize_speech_from_file ( os . path . join ( pwd_path , 'tushuguan.wav' ))
    print ( '[提示] 语音识别结果：' , r )

keluaran:

 {'text': '北京图书馆'}

TTS (sintesis bicara)

Contoh: Contoh/demo_tts.py

 import sys
sys . path . append ( '..' )
import parrots
from parrots . tts import TextToSpeech
parrots_path = parrots . __path__ [ 0 ]
sys . path . append ( parrots_path )

m = TextToSpeech (
    speaker_model_path = "shibing624/parrots-gpt-sovits-speaker-maimai" ,
    speaker_name = "MaiMai" ,
)
m . predict (
    text = "你好，欢迎来北京。welcome to the city." ,
    text_language = "auto" ,
    output_path = "output_audio.wav"
)

keluaran:

 Save audio to output_audio.wav

Command Line Mode (CLI)

Dukungan eksekusi tugas ARS dan TTS melalui baris perintah, kode: cli.py

 > parrots -h                                    

NAME
    parrots

SYNOPSIS
    parrots COMMAND

COMMANDS
    COMMAND is one of the following:

     asr
       Entry point of asr, recognize speech from file

     tts
       Entry point of tts, generate speech audio from text

berlari:

pip install parrots -U
# asr example
parrots asr -h
parrots asr examples/tushuguan.wav

# tts example
parrots tts -h
parrots tts "你好，欢迎来北京。welcome to the city. " output_audio.wav

asr dan tts adalah perintah sekunder, ASR adalah pengenalan suara, TTS adalah sintesis ucapan, dan model default adalah model Cina
Lihat parrots asr -h untuk penggunaan setiap perintah sekunder
Dalam examples/tushuguan.wav adalah parameter audio_file_path dari metode asr , dan file audio input (diperlukan)

Model rilis

Asr

Belle-2/Belle-Distilwhisper-Large-V2-ZH

Tts

Shibing624/Parrots-Gpt-Sovits-speaker

nama pembicara	Nama pembicara	karakter	Karakteristik	bahasa	bahasa
Kuileblanc	Kwai LeBron	wanita	Suara Wanita Amerika Standar	en	Britania
Longshouren	Shouren panjang	pria	Suara Pria Amerika Standar	en	Britania
Maimai	Jual dan jual	menyanyikan jangkar wanita	Menyanyikan suara jangkar wanita	ZH	tengah
Xingtong	Mata bintang	Sing Air Girl	Suara wanita yang hidup	ZH	tengah
Xuanshen	Pamerkan Tuhan	Game Pria Anchor	Suara jangkar pria dari permainan	ZH	tengah
Kusanaginene	Kusanagi Ning	Loli	Loli Siswa Wanita	ja	hari

Shibing624/Parrots-Gpt-Sovits-speaker-Maimai

nama pembicara	Nama pembicara	karakter	Karakteristik	bahasa	bahasa
Maimai	Jual dan jual	menyanyikan jangkar wanita	Menyanyikan suara jangkar wanita	ZH	tengah

Kontak

Masalah (saran):
Email saya: xuming: [email protected]
WeChat ME: Tambahkan saya ID WeChat: Xuming624 , masukkan grup komunikasi Python-NLP, Catatan: Nama-perusahaan-perusahaan-NLP

Kutipan

Jika Anda menggunakan burung beo dalam penelitian Anda, silakan kutip dalam format berikut:

@misc{parrots,
  title={parrots: ASR and TTS Tool},
  author={Ming Xu},
  year={2024},
  howpublished={ url {https://github.com/shibing624/parrots}},
}

Lisensi

Perjanjian lisensi adalah Lisensi Apache 2.0, yang dapat digunakan untuk tujuan komersial secara gratis. Harap lampirkan tautan burung beo dan perjanjian otorisasi ke deskripsi produk.

Menyumbang

Kode proyek masih sangat kasar. Jika Anda telah meningkatkan kode, Anda dipersilakan untuk mengirimkannya kembali ke proyek ini. Sebelum mengirimkan, perhatikan dua poin berikut:

Tambahkan tes unit yang sesuai dalam tests
Gunakan python -m pytest untuk menjalankan semua tes unit untuk memastikan bahwa semua tes tunggal dilewatkan

Anda dapat mengirimkan PR Anda nanti.