Descarga parrots - Descarga del código fuente parrots

parrots

Código Fuente de IA

1.0.1

Descargar

?? chino | Inglés | Documentos/documentos | ? Modelos/modelos

Demostración en línea

Parrots: kit de herramientas ASR y TTS

Introducción

Parrots, reconocimiento automático de voz ( ASR ), kit de herramientas de texto a voz ( TTS ), soporte de chino, inglés, japonés, etc.

Los loros implementan un llamado con un solo clic para el reconocimiento de voz y los modelos de síntesis de habla, que están fuera de la caja y apoyan el chino e inglés.

Características

ASR: modelo de reconocimiento de voz chino (ASR) basado en distilwhisper , admite múltiples idiomas como el chino e inglés.
TTS: Modelo de síntesis de voz (TTS) basado en la capacitación GPT-SoVITS , apoya a los idiomas chinos, inglés, japonés y otros

Instalar

pip install torch # or conda install pytorch
pip install -r requirements.txt
pip install parrots

o

pip install torch # or conda install pytorch
git clone https://github.com/shibing624/parrots.git
cd parrots
python setup.py install

Manifestación

Demostración oficial: https://www.mulanai.com/product/tts/
Demo de Huggingface: https://huggingface.co/spaces/shibing624/Parrots

Ejemplo de ejecución: ejemplos/tts_gradio_demo.py para ver la demostración:

python examples/tts_gradio_demo.py

Uso

ASR (Reconocimiento de voz)

Ejemplo: ejemplos/demo_asr.py

 import os
import sys

sys . path . append ( '..' )
from parrots import SpeechRecognition

pwd_path = os . path . abspath ( os . path . dirname ( __file__ ))

if __name__ == '__main__' :
    m = SpeechRecognition ()
    r = m . recognize_speech_from_file ( os . path . join ( pwd_path , 'tushuguan.wav' ))
    print ( '[提示] 语音识别结果：' , r )

producción:

 {'text': '北京图书馆'}

TTS (síntesis del habla)

Ejemplo: ejemplos/demo_tts.py

 import sys
sys . path . append ( '..' )
import parrots
from parrots . tts import TextToSpeech
parrots_path = parrots . __path__ [ 0 ]
sys . path . append ( parrots_path )

m = TextToSpeech (
    speaker_model_path = "shibing624/parrots-gpt-sovits-speaker-maimai" ,
    speaker_name = "MaiMai" ,
)
m . predict (
    text = "你好，欢迎来北京。welcome to the city." ,
    text_language = "auto" ,
    output_path = "output_audio.wav"
)

producción:

 Save audio to output_audio.wav

Modo de línea de comando (CLI)

Apoya la ejecución de tareas ARS y TTS a través de la línea de comandos, código: cli.py

 > parrots -h                                    

NAME
    parrots

SYNOPSIS
    parrots COMMAND

COMMANDS
    COMMAND is one of the following:

     asr
       Entry point of asr, recognize speech from file

     tts
       Entry point of tts, generate speech audio from text

correr:

pip install parrots -U
# asr example
parrots asr -h
parrots asr examples/tushuguan.wav

# tts example
parrots tts -h
parrots tts "你好，欢迎来北京。welcome to the city. " output_audio.wav

asr y tts son comandos secundarios, ASR es reconocimiento de voz, TTS es síntesis de voz y el modelo predeterminado es el modelo chino
Ver parrots asr -h para el uso de cada comando secundario
En los examples/tushuguan.wav es el parámetro audio_file_path del método asr , y el archivo de audio de entrada (requerido)

Modelos de lanzamiento

Asr

Belle-2/Belle-Distilwhisper-Large-V2-Zh

TTS

shibing624/lorots-gpt-sovits-speaker

Nombre del altavoz	Nombre del altavoz	personaje	Características	idioma	idioma
Kuileblanc	Kwai LeBron	dama	Voz femenina estadounidense estándar	interno	Gran Bretaña
Shouren	Shouren largo	hidalgo	Voz estándar masculina americana	interno	Gran Bretaña
Maimai	Vender y vender	Canta el ancla femenina	Cantando la voz de anclaje femenino	zh	medio
Xington	Ojo estrella	Canta a la chica de aire	Voz femenina animada	zh	medio
Xuanshen	Muestra a Dios	Anchor masculino del juego	La voz del ancla masculina del juego	zh	medio
Kusanagineno	Kusanagi ning	loli	Voz de estudiante de loli	ja	día

shibing624/parrots-gpt-sovits-speaker-maimai

Nombre del altavoz	Nombre del altavoz	personaje	Características	idioma	idioma
Maimai	Vender y vender	Canta el ancla femenina	Cantando la voz de anclaje femenino	zh	medio

Contacto

Problema (sugerencias):
Envíeme un correo electrónico: Xuming: [email protected]
WeChat Me: Agregame WeChat ID: Xuming624 , ingrese el grupo de comunicación Python-NLP, Nota: Nombre Nombre-NLP-NLP

Citación

Si usa loros en su investigación, cite en el siguiente formato:

@misc{parrots,
  title={parrots: ASR and TTS Tool},
  author={Ming Xu},
  year={2024},
  howpublished={ url {https://github.com/shibing624/parrots}},
}

Licencia

El Acuerdo de Licencia es la Licencia APACHE 2.0, que puede usarse con fines comerciales de forma gratuita. Adjunte el enlace de loros y el acuerdo de autorización a la descripción del producto.

Contribuir

El código del proyecto sigue siendo muy duro. Si ha mejorado el código, puede enviarlo a este proyecto. Antes de enviar, preste atención a los siguientes dos puntos:

Agregar pruebas unitarias correspondientes en tests
Use python -m pytest para ejecutar todas las pruebas unitarias para garantizar que se pasen todas las pruebas individuales

Puede enviar su PR más tarde.