? Chinesisch | Englisch | Dokumente/Dokumente | Modelle/Modelle


Papageien, automatische Spracherkennung ( ASR ), Text-to-Speech-Toolkit ( TTS ), Unterstützung Chinesisch, Englisch, Japanisch usw. unterstützen.
Papageien implementiert One-Click-Aufruf zu Spracherkennung und Sprachsynthesemodellen, die nicht in die Box sind und Chinesisch und Englisch unterstützen.
distilwhisper basiert, unterstützt mehrere Sprachen wie Chinesisch und Englisch.GPT-SoVITS Training basiert, unterstützt Chinesisch, Englisch, Japanisch und andere Sprachen pip install torch # or conda install pytorch
pip install -r requirements.txt
pip install parrotsoder
pip install torch # or conda install pytorch
git clone https://github.com/shibing624/parrots.git
cd parrots
python setup.py install
Beispiel ausführen: Beispiele/tts_gradio_demo.py, um die Demo zu sehen:
python examples/tts_gradio_demo.pyBeispiel: Beispiele/Demo_asr.py
import os
import sys
sys . path . append ( '..' )
from parrots import SpeechRecognition
pwd_path = os . path . abspath ( os . path . dirname ( __file__ ))
if __name__ == '__main__' :
m = SpeechRecognition ()
r = m . recognize_speech_from_file ( os . path . join ( pwd_path , 'tushuguan.wav' ))
print ( '[提示] 语音识别结果:' , r )Ausgabe:
{'text': '北京图书馆'}
Beispiel: Beispiele/Demo_Tts.py
import sys
sys . path . append ( '..' )
import parrots
from parrots . tts import TextToSpeech
parrots_path = parrots . __path__ [ 0 ]
sys . path . append ( parrots_path )
m = TextToSpeech (
speaker_model_path = "shibing624/parrots-gpt-sovits-speaker-maimai" ,
speaker_name = "MaiMai" ,
)
m . predict (
text = "你好,欢迎来北京。welcome to the city." ,
text_language = "auto" ,
output_path = "output_audio.wav"
)Ausgabe:
Save audio to output_audio.wav
Unterstützen Sie die Ausführung von ARS- und TTS -Aufgaben über die Befehlszeile, Code: cli.py
> parrots -h
NAME
parrots
SYNOPSIS
parrots COMMAND
COMMANDS
COMMAND is one of the following:
asr
Entry point of asr, recognize speech from file
tts
Entry point of tts, generate speech audio from text
laufen:
pip install parrots -U
# asr example
parrots asr -h
parrots asr examples/tushuguan.wav
# tts example
parrots tts -h
parrots tts "你好,欢迎来北京。welcome to the city. " output_audio.wavasr und tts sind sekundäre Befehle, ASR ist Spracherkennung, TTS ist die Sprachsynthese und das Standardmodell ist chinesisches Modellparrots asr -h für die Verwendung jedes sekundären Befehlsexamples/tushuguan.wav ist der Parameter audio_file_path asr -Methode und die Eingabe -Audiodatei (erforderlich) | Sprechername | Name des Sprechers | Charakter | Eigenschaften | Sprache | Sprache |
|---|---|---|---|---|---|
| Kuileblanc | Kwai LeBron | Dame | Standard amerikanische weibliche Stimme | en | Großbritannien |
| Longshouren | Lange Schale | Gentleman | Standard amerikanische männliche Stimme | en | Großbritannien |
| Maimai | Verkaufen und verkaufen | Singen Sie einen weiblichen Anker | Singen Sie weibliche Ankerstimme | Zh | Mitte |
| Xingtong | Sternauge | SING Air Girl | Lebhafte weibliche Stimme | Zh | Mitte |
| Xuanshen | Zeigen Sie Gott | Spiel männlicher Anker | Die Stimme des männlichen Ankers des Spiels | Zh | Mitte |
| Kusanaginen | Kusanagi Ning | loli | Loli Student Stimme | Ja | Tag |
| Sprechername | Name des Sprechers | Charakter | Eigenschaften | Sprache | Sprache |
|---|---|---|---|---|---|
| Maimai | Verkaufen und verkaufen | Singen Sie einen weiblichen Anker | Singen Sie weibliche Ankerstimme | Zh | Mitte |

Wenn Sie Papageien in Ihrer Forschung verwenden, zitieren Sie diese bitte im folgenden Format:
@misc{parrots,
title={parrots: ASR and TTS Tool},
author={Ming Xu},
year={2024},
howpublished={ url {https://github.com/shibing624/parrots}},
}Die Lizenzvereinbarung ist die Apache -Lizenz 2.0, die für kommerzielle Zwecke kostenlos verwendet werden kann. Bitte fügen Sie den Link und die Autorisierungsvereinbarung der Papageien der Produktbeschreibung bei.
Der Projektcode ist immer noch sehr rau. Wenn Sie den Code verbessert haben, können Sie ihn gerne an dieses Projekt einreichen. Achten Sie vor der Einreichung auf die folgenden zwei Punkte:
testspython -m pytest um alle Einheitstests durchzuführen, um sicherzustellen, dass alle einzelnen Tests bestanden werdenSie können Ihre PR später einreichen.