Китайский | Английский | Документы/документы | ? Модели/Модели


Попугаи, автоматическое распознавание речи ( ASR ), инструментарий текста-речь ( TTS ), поддержка китайского, английского, японского языка и т. Д.
Попугаки реализуют модели распознавания речи и синтеза речи, которые находятся вне коробки и поддерживают китайский и английский.
distilwhisper , поддерживает несколько языков, таких как китайский и английский.GPT-SoVITS , поддерживает китайский, английский, японский и другие языки pip install torch # or conda install pytorch
pip install -r requirements.txt
pip install parrotsили
pip install torch # or conda install pytorch
git clone https://github.com/shibing624/parrots.git
cd parrots
python setup.py install
Запустите пример: примеры/tts_gradio_demo.py, чтобы увидеть демонстрацию:
python examples/tts_gradio_demo.pyПример: примеры/demo_asr.py
import os
import sys
sys . path . append ( '..' )
from parrots import SpeechRecognition
pwd_path = os . path . abspath ( os . path . dirname ( __file__ ))
if __name__ == '__main__' :
m = SpeechRecognition ()
r = m . recognize_speech_from_file ( os . path . join ( pwd_path , 'tushuguan.wav' ))
print ( '[提示] 语音识别结果:' , r )выход:
{'text': '北京图书馆'}
Пример: примеры/demo_tts.py
import sys
sys . path . append ( '..' )
import parrots
from parrots . tts import TextToSpeech
parrots_path = parrots . __path__ [ 0 ]
sys . path . append ( parrots_path )
m = TextToSpeech (
speaker_model_path = "shibing624/parrots-gpt-sovits-speaker-maimai" ,
speaker_name = "MaiMai" ,
)
m . predict (
text = "你好,欢迎来北京。welcome to the city." ,
text_language = "auto" ,
output_path = "output_audio.wav"
)выход:
Save audio to output_audio.wav
Поддержка выполнения задач ARS и TTS через командную строку, код: cli.py
> parrots -h
NAME
parrots
SYNOPSIS
parrots COMMAND
COMMANDS
COMMAND is one of the following:
asr
Entry point of asr, recognize speech from file
tts
Entry point of tts, generate speech audio from text
бегать:
pip install parrots -U
# asr example
parrots asr -h
parrots asr examples/tushuguan.wav
# tts example
parrots tts -h
parrots tts "你好,欢迎来北京。welcome to the city. " output_audio.wavasr и tts являются вторичными командами, ASR - это распознавание речи, TTS - это синтез речи, а модель по умолчанию - китайская модельparrots asr -h для использования каждой второстепенной командыexamples/tushuguan.wav - параметр audio_file_path метода asr и входной аудиофайл (требуется) | Название спикера | Имя спикера | характер | Характеристики | язык | язык |
|---|---|---|---|---|---|
| Kuileblanc | Кваи Леброн | леди | Стандартный американский женский голос | поступка | Британия |
| Longshouren | Длинный Шурен | джентльмен | Стандартный американский мужской голос | поступка | Британия |
| Маймай | Продавать и продавать | петь женский якорь | Пение женского якоря голос | ZH | середина |
| Синтонг | Звездный глаз | петь воздушную девушку | Живой женский голос | ZH | середина |
| Сюансен | Покажите Богу | Игра мужской якорь | Голос мужского якоря игры | ZH | середина |
| Кусанагинен | Кусанаги Нин | лоли | Лоли женский студенческий голос | JA | день |
| Название спикера | Имя спикера | характер | Характеристики | язык | язык |
|---|---|---|---|---|---|
| Маймай | Продавать и продавать | петь женский якорь | Пение женского якоря голос | ZH | середина |

Если вы используете попугаи в своем исследовании, укажите его в следующем формате:
@misc{parrots,
title={parrots: ASR and TTS Tool},
author={Ming Xu},
year={2024},
howpublished={ url {https://github.com/shibing624/parrots}},
}Лицензионное соглашение - это лицензия Apache 2.0, которая может использоваться в коммерческих целях бесплатно. Пожалуйста, прикрепите ссылку и соглашение о авторизации к описанию продукта.
Код проекта все еще очень грубый. Если вы улучшили код, вы можете отправить его обратно в этот проект. Перед отправкой обратите внимание на следующие два балла:
testspython -m pytest , чтобы запустить все модульные тесты, чтобы убедиться, что все отдельные тесты проходятВы можете отправить свой PR позже.