Скачать parrots - скачать parrots

parrots

AI Исходный код

1.0.1

Скачать

Китайский | Английский | Документы/документы | ? Модели/Модели

Онлайн демо

Попуски: ASR и TTS Toolkit

Введение

Попугаи, автоматическое распознавание речи ( ASR ), инструментарий текста-речь ( TTS ), поддержка китайского, английского, японского языка и т. Д.

Попугаки реализуют модели распознавания речи и синтеза речи, которые находятся вне коробки и поддерживают китайский и английский.

Функции

ASR: модель китайского распознавания речи (ASR), основанная на distilwhisper , поддерживает несколько языков, таких как китайский и английский.
TTS: модель синтеза голоса (TTS), основанная на обучении GPT-SoVITS , поддерживает китайский, английский, японский и другие языки

Установить

pip install torch # or conda install pytorch
pip install -r requirements.txt
pip install parrots

или

pip install torch # or conda install pytorch
git clone https://github.com/shibing624/parrots.git
cd parrots
python setup.py install

Демо

Официальная демонстрация: https://www.mulanai.com/product/tts/
Demo GuggingFace: https://huggingface.co/spaces/shibing624/parrots

Запустите пример: примеры/tts_gradio_demo.py, чтобы увидеть демонстрацию:

python examples/tts_gradio_demo.py

Использование

ASR (распознавание речи)

Пример: примеры/demo_asr.py

 import os
import sys

sys . path . append ( '..' )
from parrots import SpeechRecognition

pwd_path = os . path . abspath ( os . path . dirname ( __file__ ))

if __name__ == '__main__' :
    m = SpeechRecognition ()
    r = m . recognize_speech_from_file ( os . path . join ( pwd_path , 'tushuguan.wav' ))
    print ( '[提示] 语音识别结果：' , r )

выход:

 {'text': '北京图书馆'}

ТТ (синтез речи)

Пример: примеры/demo_tts.py

 import sys
sys . path . append ( '..' )
import parrots
from parrots . tts import TextToSpeech
parrots_path = parrots . __path__ [ 0 ]
sys . path . append ( parrots_path )

m = TextToSpeech (
    speaker_model_path = "shibing624/parrots-gpt-sovits-speaker-maimai" ,
    speaker_name = "MaiMai" ,
)
m . predict (
    text = "你好，欢迎来北京。welcome to the city." ,
    text_language = "auto" ,
    output_path = "output_audio.wav"
)

выход:

 Save audio to output_audio.wav

Режим командной строки (CLI)

Поддержка выполнения задач ARS и TTS через командную строку, код: cli.py

 > parrots -h                                    

NAME
    parrots

SYNOPSIS
    parrots COMMAND

COMMANDS
    COMMAND is one of the following:

     asr
       Entry point of asr, recognize speech from file

     tts
       Entry point of tts, generate speech audio from text

бегать:

pip install parrots -U
# asr example
parrots asr -h
parrots asr examples/tushuguan.wav

# tts example
parrots tts -h
parrots tts "你好，欢迎来北京。welcome to the city. " output_audio.wav

asr и tts являются вторичными командами, ASR - это распознавание речи, TTS - это синтез речи, а модель по умолчанию - китайская модель
Смотрите parrots asr -h для использования каждой второстепенной команды
В приведенных выше examples/tushuguan.wav - параметр audio_file_path метода asr и входной аудиофайл (требуется)

Выпустить модели

Аср

Belle-2/Belle-Distilwhisper-Large-V2-ZH

ТТС

Shibing624/Parrots-GPT-Sovits-Speaker

Название спикера	Имя спикера	характер	Характеристики	язык	язык
Kuileblanc	Кваи Леброн	леди	Стандартный американский женский голос	поступка	Британия
Longshouren	Длинный Шурен	джентльмен	Стандартный американский мужской голос	поступка	Британия
Маймай	Продавать и продавать	петь женский якорь	Пение женского якоря голос	ZH	середина
Синтонг	Звездный глаз	петь воздушную девушку	Живой женский голос	ZH	середина
Сюансен	Покажите Богу	Игра мужской якорь	Голос мужского якоря игры	ZH	середина
Кусанагинен	Кусанаги Нин	лоли	Лоли женский студенческий голос	JA	день

Shibing624/Parrots-GPT-Sovits-Speaker-Maimai

Название спикера	Имя спикера	характер	Характеристики	язык	язык
Маймай	Продавать и продавать	петь женский якорь	Пение женского якоря голос	ZH	середина

Контакт

Проблема (предложения):
Напишите мне: xuming: [email protected]
WeChat Me: Добавьте меня идентификатор WeChat: Xuming624 , введите группу коммуникации Python-NLP, примечание: имя имени Имя NLP

Цитирование

Если вы используете попугаи в своем исследовании, укажите его в следующем формате:

@misc{parrots,
  title={parrots: ASR and TTS Tool},
  author={Ming Xu},
  year={2024},
  howpublished={ url {https://github.com/shibing624/parrots}},
}

Лицензия

Лицензионное соглашение - это лицензия Apache 2.0, которая может использоваться в коммерческих целях бесплатно. Пожалуйста, прикрепите ссылку и соглашение о авторизации к описанию продукта.

Способствовать

Код проекта все еще очень грубый. Если вы улучшили код, вы можете отправить его обратно в этот проект. Перед отправкой обратите внимание на следующие два балла:

Добавить соответствующие модульные тесты в tests
Используйте python -m pytest , чтобы запустить все модульные тесты, чтобы убедиться, что все отдельные тесты проходят

Вы можете отправить свой PR позже.