?? chino | Inglés | Documentos/documentos | ? Modelos/modelos


Parrots, reconocimiento automático de voz ( ASR ), kit de herramientas de texto a voz ( TTS ), soporte de chino, inglés, japonés, etc.
Los loros implementan un llamado con un solo clic para el reconocimiento de voz y los modelos de síntesis de habla, que están fuera de la caja y apoyan el chino e inglés.
distilwhisper , admite múltiples idiomas como el chino e inglés.GPT-SoVITS , apoya a los idiomas chinos, inglés, japonés y otros pip install torch # or conda install pytorch
pip install -r requirements.txt
pip install parrotso
pip install torch # or conda install pytorch
git clone https://github.com/shibing624/parrots.git
cd parrots
python setup.py install
Ejemplo de ejecución: ejemplos/tts_gradio_demo.py para ver la demostración:
python examples/tts_gradio_demo.pyEjemplo: ejemplos/demo_asr.py
import os
import sys
sys . path . append ( '..' )
from parrots import SpeechRecognition
pwd_path = os . path . abspath ( os . path . dirname ( __file__ ))
if __name__ == '__main__' :
m = SpeechRecognition ()
r = m . recognize_speech_from_file ( os . path . join ( pwd_path , 'tushuguan.wav' ))
print ( '[提示] 语音识别结果:' , r )producción:
{'text': '北京图书馆'}
Ejemplo: ejemplos/demo_tts.py
import sys
sys . path . append ( '..' )
import parrots
from parrots . tts import TextToSpeech
parrots_path = parrots . __path__ [ 0 ]
sys . path . append ( parrots_path )
m = TextToSpeech (
speaker_model_path = "shibing624/parrots-gpt-sovits-speaker-maimai" ,
speaker_name = "MaiMai" ,
)
m . predict (
text = "你好,欢迎来北京。welcome to the city." ,
text_language = "auto" ,
output_path = "output_audio.wav"
)producción:
Save audio to output_audio.wav
Apoya la ejecución de tareas ARS y TTS a través de la línea de comandos, código: cli.py
> parrots -h
NAME
parrots
SYNOPSIS
parrots COMMAND
COMMANDS
COMMAND is one of the following:
asr
Entry point of asr, recognize speech from file
tts
Entry point of tts, generate speech audio from text
correr:
pip install parrots -U
# asr example
parrots asr -h
parrots asr examples/tushuguan.wav
# tts example
parrots tts -h
parrots tts "你好,欢迎来北京。welcome to the city. " output_audio.wavasr y tts son comandos secundarios, ASR es reconocimiento de voz, TTS es síntesis de voz y el modelo predeterminado es el modelo chinoparrots asr -h para el uso de cada comando secundarioexamples/tushuguan.wav es el parámetro audio_file_path del método asr , y el archivo de audio de entrada (requerido) | Nombre del altavoz | Nombre del altavoz | personaje | Características | idioma | idioma |
|---|---|---|---|---|---|
| Kuileblanc | Kwai LeBron | dama | Voz femenina estadounidense estándar | interno | Gran Bretaña |
| Shouren | Shouren largo | hidalgo | Voz estándar masculina americana | interno | Gran Bretaña |
| Maimai | Vender y vender | Canta el ancla femenina | Cantando la voz de anclaje femenino | zh | medio |
| Xington | Ojo estrella | Canta a la chica de aire | Voz femenina animada | zh | medio |
| Xuanshen | Muestra a Dios | Anchor masculino del juego | La voz del ancla masculina del juego | zh | medio |
| Kusanagineno | Kusanagi ning | loli | Voz de estudiante de loli | ja | día |
| Nombre del altavoz | Nombre del altavoz | personaje | Características | idioma | idioma |
|---|---|---|---|---|---|
| Maimai | Vender y vender | Canta el ancla femenina | Cantando la voz de anclaje femenino | zh | medio |

Si usa loros en su investigación, cite en el siguiente formato:
@misc{parrots,
title={parrots: ASR and TTS Tool},
author={Ming Xu},
year={2024},
howpublished={ url {https://github.com/shibing624/parrots}},
}El Acuerdo de Licencia es la Licencia APACHE 2.0, que puede usarse con fines comerciales de forma gratuita. Adjunte el enlace de loros y el acuerdo de autorización a la descripción del producto.
El código del proyecto sigue siendo muy duro. Si ha mejorado el código, puede enviarlo a este proyecto. Antes de enviar, preste atención a los siguientes dos puntos:
testspython -m pytest para ejecutar todas las pruebas unitarias para garantizar que se pasen todas las pruebas individualesPuede enviar su PR más tarde.