Nonebot2 기반 온라인 Fish-Audio 또는 오프라인 Fish-Steech API 텍스트 생성 음성 tts 플러그인에 대한 통화

중국어 단순화 | 영어
5 초의 음성 자료 만 사용하여 원래 사운드를 완벽하게 복제 할 수 있습니다! 복제하고 음성 파일 이름 (아래 참조)을 신속하게 생성하려는 캐릭터 음성을 준비하십시오.
또는 공식 온라인 API-> Fish -Audio를 사용하여 빠른 클라우드 음성 생성을 즐기십시오.
주의
이 플러그인은 학습 및 연구 목적으로 만 사용되며 사용자는 자신의 위험에 따라 플러그인을 사용할 위험이 있어야합니다. 저자는 플러그인 사용으로 인한 손실이나 문제에 대해 책임을지지 않습니다. 플러그인을 합리적으로 사용하고 관련 법률 및 규정을 준수하십시오. 이 플러그인을 사용하면 위의 면책 조항을 읽고 읽고 동의했습니다 . 위의 진술에 동의하거나 준수하지 않으면이 플러그인을 사용하지 마십시오.
pipx 설치
pipx install nonebot-plugin-fishspeech-tts -U[! 참고] Nonebot의 Pyproject.toml 에이 플러그인을 추가하십시오
nb-cli 설치
nb plugin install nonebot-plugin-fishspeech-tts -U git clone 설치 (권장되지 않음)
cmd 아래에서 실행됩니다 git clone https://github.com/Cvandia/nonebot-plugin-fishspeech-ttsnonebot-plugin-fishspeech-tts 봇의 루트 디렉토리에서 src/plugins 으로 실행하십시오 (또는 봇을 만들 때 xxx/plugins ).권장 거울 사이트 다운로드
Tsinghua 소스 https://pypi.tuna.tsinghua.edu.cn/simple
알리바바 소스 https://mirrors.aliyun.com/pypi/simple/
.env에 다음 구성을 추가하십시오
| 기본 구성 | 유형 | 필수의 | 기본값 | 설명 |
|---|---|---|---|---|
| tts_is_online | 부 | 예 | 진실 | 클라우드 API 사용 여부 |
| tts_chunk_length | 오자 | 아니요 | "정상" | 오디오 샤드 길이는 요청시 정상입니다. 선택 사항 : 짧고 정상, 긴 |
| tts_max_new_tokens | int | 아니요 | 800 | 최대 오디오 길이, 기본값은 800이고 설정은 0으로 설정되지 않습니다. |
| tts_audio_path | str | 아니요 | "./data/reference 오디오" | 음성 자료 경로, 기본값은 "./data/reference Audio" |
| tts_prefix | str | 아니요 | 없음 | 접두사를 트리거, 기본값으로하지 않습니다 |
참고 : 참조 오디오의 파일 이름 형식은 다음과 같습니다. [역할 이름] 오디오에 해당하는 텍스트 레이블입니다. [오디오 접미사 이름]
권장 참조 오디오 reference_audio.zip 다운로드하려면 여기를 클릭하여 BOT 파일 디렉토리의 data/参考音频에 오디오를 담그고 오디오를 넣으십시오.
! 같은 캐릭터의 다른 목소리를 지원하십시오!
오디오 접미사 지원에 대한 자세한 내용은 files.py의 AUDIO_FILE_SUFFIX 를 참조하십시오.
공식 API를 사용하려면 구성 항목 tts_is_online True 로 설정하고 다음을 구성하십시오.
| 구성 항목 | 유형 | 필수의 | 기본값 | 설명 |
|---|---|---|---|---|
| online_api_url | str | 아니요 | "https://api.fish-audio.cn" | 공식 웹 사이트 API 주소는 https://api.fish.audio (Walled) 또는 기본값에서 선택할 수 있습니다. |
| online_authorization | str | 예 | "xxxxx" | 공식 API 인증 키, 자세한 내용은 링크를 참조하십시오. |
| online_model_first | 부 | 아니요 | 진실 | 공식 모델을 호출하려면 자신의 참조 오디오를 통해 캐릭터 톤을 사용자 정의하고이를 False 로 설정하십시오. 물론 참조 오디오를 준비하지 않으면 공식 웹 사이트에서 이미 사용 가능한 톤도 호출됩니다. 자세한 내용은 링크를 참조하십시오 |
| online_api_proxy | str | 아니요 | 없음 | 다음과 같은 프록시 주소 : http://127.0.0.1:7890 |
자신의 또는 다른 Fish-Speech 프로젝트의 API를 사용하려면 구성 항목 tts_is_online Fasle 로 설정하고 다음을 구성하십시오.
| 구성 항목 | 유형 | 필수의 | 기본값 | 설명 |
|---|---|---|---|---|
| offline_api_url offline_api_url | str | 예 | "http://127.0.0.1:8080" | fish-speech API 주소 |
메모
COMMAND_START 및 위 구성 항목에 주목하십시오.
| 지침 | 필요@ | 범위 | 설명 | 권한 |
|---|---|---|---|---|
| xxx는 xxxx라고 말합니다 | 구성에 따르면 | 모두 | TTS 음성 생성 | 모두 |
| 음성 목록 | 예 | 모두 | 모든 역할 목록을 얻으십시오 | 모두 |
| 음성 균형 | 예 | 모두 | 쿼리 API 균형 | 모두 |
사용하기 전에
fish-speech 준비하십시오
fish-speech Repository release 코드 ( Source code (zip) )를 로컬에 다운로드하십시오.fish-speech 루트 디렉토리를 엽니 다install_env.bat 실행하려면 가상 환경 및 필요한 종속성을 설치합니다.start.batAPI_FLAGS.txt 수정하고 다시 시작하십시오API 서비스를 시작하십시오
API_FLAGS.txt 대략 다음 내용으로 수정하십시오. 즉, api 앞의 # 번호를 취소하십시오. # --infer
--api
--listen 0.0.0.0:8080 #监听接口
... API_FLAGS.txt 에서 추가 할 수있는 추가 매개 변수
--complie -> 컴파일 된 모델을 시작할지 여부--workers 数字->数字멀티 코 루틴 시작 (기본값은 차단하기 쉽기 때문에 설정하십시오).--device cpu > CPU를 사용하여 TTS를 생성합니다 (GPU를 사용하는 경우 무시하십시오).--half > TTS를 생성하기 위해 반 정밀도를 사용하십시오--max-text-length > 최대 텍스트 길이를 입력하십시오