?? Cina | Bahasa Inggris | Dokumen/dokumen | ? Model/model


Burung beo, pengenalan ucapan otomatis ( ASR ), toolkit Text-to-Speech ( TTS ), Dukungan Cina, Inggris, Jepang, dll.
Burung beo mengimplementasikan panggilan satu klik untuk pengenalan suara dan model sintesis ucapan, yang berada di luar kotak dan mendukung bahasa Mandarin dan Inggris.
distilwhisper , mendukung berbagai bahasa seperti Cina dan Inggris.GPT-SoVITS , mendukung bahasa Cina, Inggris, Jepang, dan bahasa lainnya pip install torch # or conda install pytorch
pip install -r requirements.txt
pip install parrotsatau
pip install torch # or conda install pytorch
git clone https://github.com/shibing624/parrots.git
cd parrots
python setup.py install
Jalankan Contoh: Contoh/tts_gradio_demo.py untuk melihat demo:
python examples/tts_gradio_demo.pyContoh: Contoh/demo_asr.py
import os
import sys
sys . path . append ( '..' )
from parrots import SpeechRecognition
pwd_path = os . path . abspath ( os . path . dirname ( __file__ ))
if __name__ == '__main__' :
m = SpeechRecognition ()
r = m . recognize_speech_from_file ( os . path . join ( pwd_path , 'tushuguan.wav' ))
print ( '[提示] 语音识别结果:' , r )keluaran:
{'text': '北京图书馆'}
Contoh: Contoh/demo_tts.py
import sys
sys . path . append ( '..' )
import parrots
from parrots . tts import TextToSpeech
parrots_path = parrots . __path__ [ 0 ]
sys . path . append ( parrots_path )
m = TextToSpeech (
speaker_model_path = "shibing624/parrots-gpt-sovits-speaker-maimai" ,
speaker_name = "MaiMai" ,
)
m . predict (
text = "你好,欢迎来北京。welcome to the city." ,
text_language = "auto" ,
output_path = "output_audio.wav"
)keluaran:
Save audio to output_audio.wav
Dukungan eksekusi tugas ARS dan TTS melalui baris perintah, kode: cli.py
> parrots -h
NAME
parrots
SYNOPSIS
parrots COMMAND
COMMANDS
COMMAND is one of the following:
asr
Entry point of asr, recognize speech from file
tts
Entry point of tts, generate speech audio from text
berlari:
pip install parrots -U
# asr example
parrots asr -h
parrots asr examples/tushuguan.wav
# tts example
parrots tts -h
parrots tts "你好,欢迎来北京。welcome to the city. " output_audio.wavasr dan tts adalah perintah sekunder, ASR adalah pengenalan suara, TTS adalah sintesis ucapan, dan model default adalah model Cinaparrots asr -h untuk penggunaan setiap perintah sekunderexamples/tushuguan.wav adalah parameter audio_file_path dari metode asr , dan file audio input (diperlukan) | nama pembicara | Nama pembicara | karakter | Karakteristik | bahasa | bahasa |
|---|---|---|---|---|---|
| Kuileblanc | Kwai LeBron | wanita | Suara Wanita Amerika Standar | en | Britania |
| Longshouren | Shouren panjang | pria | Suara Pria Amerika Standar | en | Britania |
| Maimai | Jual dan jual | menyanyikan jangkar wanita | Menyanyikan suara jangkar wanita | ZH | tengah |
| Xingtong | Mata bintang | Sing Air Girl | Suara wanita yang hidup | ZH | tengah |
| Xuanshen | Pamerkan Tuhan | Game Pria Anchor | Suara jangkar pria dari permainan | ZH | tengah |
| Kusanaginene | Kusanagi Ning | Loli | Loli Siswa Wanita | ja | hari |
| nama pembicara | Nama pembicara | karakter | Karakteristik | bahasa | bahasa |
|---|---|---|---|---|---|
| Maimai | Jual dan jual | menyanyikan jangkar wanita | Menyanyikan suara jangkar wanita | ZH | tengah |

Jika Anda menggunakan burung beo dalam penelitian Anda, silakan kutip dalam format berikut:
@misc{parrots,
title={parrots: ASR and TTS Tool},
author={Ming Xu},
year={2024},
howpublished={ url {https://github.com/shibing624/parrots}},
}Perjanjian lisensi adalah Lisensi Apache 2.0, yang dapat digunakan untuk tujuan komersial secara gratis. Harap lampirkan tautan burung beo dan perjanjian otorisasi ke deskripsi produk.
Kode proyek masih sangat kasar. Jika Anda telah meningkatkan kode, Anda dipersilakan untuk mengirimkannya kembali ke proyek ini. Sebelum mengirimkan, perhatikan dua poin berikut:
testspython -m pytest untuk menjalankan semua tes unit untuk memastikan bahwa semua tes tunggal dilewatkanAnda dapat mengirimkan PR Anda nanti.