Descarga de nonebot plugin fishspeech tts - nonebot plugin fishspeech tts Código fuente de descarga

nonebot plugin fishspeech tts

Código Fuente de IA

v2024.12.09-07.43.52

Descargar

No Bot-Plugin-Fishspeech-TTS

Llamada basada en nobot2 al Audio de pescado en línea o el complemento tts de la generación de texto de la expresión de texto de la voz de pescado fuera de línea

Chino simplificado | Inglés

introducir

¡Solo se puede usar un material de voz de 5 segundos ~~para clonar perfectamente~~ el sonido original! Simplemente prepare la voz del personaje que desea clonar y etiquetar su nombre de archivo de voz (ver más abajo) para generar rápidamente la voz.

O use la API oficial en línea -> Audio de pescado para disfrutar de la generación de voz rápida en la nube.

Descargo de responsabilidad

Precaución

Este complemento es solo para fines de aprendizaje e investigación , y los usuarios deben asumir el riesgo de usar el complemento bajo su propio riesgo. El autor no es responsable de ninguna pérdida o problema causado por el uso del complemento. Utilice el complemento razonablemente y cumpla con las leyes y regulaciones relevantes. Al usar este complemento, ha leído y acepta cumplir con el descargo de responsabilidad anterior . Si no está de acuerdo o no cumple con la declaración anterior, no use este complemento.

? Instalar

Instalar

Instalación pipx

pipx install nonebot-plugin-fishspeech-tts -U

[! Nota] Agregue este complemento en pyproject.toml de nobot

Instalación de nb-cli

nb plugin install nonebot-plugin-fishspeech-tts -U

Instalación git clone (no recomendado)

Ejecutar debajo de la ventana de comando cmd

git clone https://github.com/Cvandia/nonebot-plugin-fishspeech-tts

Copie la carpeta nonebot-plugin-fishspeech-tts en la ventana Ejecutado a src/plugins en el directorio raíz del bot (u otro nombre xxx/plugins al crear el bot)

Aviso

Descarga del sitio de espejo recomendado

Fuente de Tsinghua https://pypi.tuna.tsinghua.edu.cn/simple

Fuente de Alibaba https://mirrors.aliyun.com/pypi/simple/

Configuración

Agregue la siguiente configuración en .env

Configuración básica	tipo	Requerido	valor predeterminado	ilustrar
tts_is_online	bool	Sí	Verdadero	Si usar la API de la nube
tts_chunk_length	literal	No	"normal"	La longitud del fragmento de audio es normal cuando se solicita, opcional: corto, normal, largo
TTS_MAX_NEW_TOKENS	intencionalmente	No	800	Longitud máxima de audio, el valor predeterminado es 800, la configuración en 0 es ilimitada
tts_audio_path	stri	No	"./data/reference audio"	Ruta del material de voz, predeterminado es "./data/reference audio"
tts_prefix	stri	No	Ninguno	Activar prefijo, predeterminado a ninguno

Nota: El formato del nombre del archivo del audio de referencia es: [Nombre de rol] La etiqueta de texto correspondiente al audio. [Nombre de sufijo de audio]

Haga clic aquí para seleccionar para descargar la referencia de referencia recomendada reference_audio.zip , descompresión y colocar el audio en data/参考音频en el directorio de archivos BOT.

! ¡Apoya diferentes voces del mismo personaje!

Para obtener detalles sobre el soporte de sufijo de audio, consulte AUDIO_FILE_SUFFIX en files.py

Si desea utilizar la API oficial, configure el elemento de configuración tts_is_online en True y configure lo siguiente

Elementos de configuración	tipo	Requerido	valor predeterminado	ilustrar
en línea_api_url	stri	No	"https://api.fish-audio.cn"	La dirección API oficial del sitio web se puede seleccionar entre https://api.fish.audio (amurallado) o valor predeterminado
en línea_autorización	stri	Sí	"xxxxx"	Clave de autenticación de API oficial, consulte el enlace para más detalles
en línea_model_first	bool	No	Verdadero	Si desea llamar al modelo oficial, personalice el tono de caracteres a través de su propio audio de referencia, establezca esto en `False` . Por supuesto, si no prepara audio de referencia, también llamará al tono ya disponible en el sitio web oficial. Para más detalles, consulte el enlace
en línea_api_proxy	stri	No	Ninguno	Dirección proxy, como: http://127.0.0.1:7890

Si desea utilizar la API de su propia u otro proyecto de voz de pescado, establezca el elemento de configuración tts_is_online en Fasle y configure lo siguiente

Elementos de configuración	tipo	Requerido	valor predeterminado	ilustrar
Offline_api_url Offline_api_url	stri	Sí	"http://127.0.0.1:8080"	Su dirección de la API `fish-speech`

usar

Nota

Tenga en cuenta su COMMAND_START y los elementos de configuración anteriores.

instrucción:

instrucción	necesidad@	alcance	ilustrar	Permisos
xxx dice xxxx	Según la configuración	todo	Generación de voz TTS	todo
Lista de voz	Sí	todo	Obtenga una lista de todos los roles	todo
Equilibrio de voz	Sí	todo	Consulta API Balance	todo

? Hacer

Agregar más elementos de configuración
No hay planes todavía

Si te gusta, recuerda hacer clic en una estrella

? Agradecimiento especial

NoBOT2: Los conceptos básicos de este proyecto, un marco de robot de chat muy fácil de usar.
discurso de pescado: muestra cero y tts de muestra pequeña: ingrese una muestra de sonido de 10 a 30 segundos para generar salida de TTS de alta calidad

Ayuda adicional

Breve tutorial sobre la construcción de ventanas sin conexión

Antes de usar

CUDA Toolkit asegura que la versión correcta de CUDA esté instalada antes de usar

Preparar fish-speech

1. Descargue el Código release del repositorio de fish-speech ( Source code (zip) ) al local
2. Descomprimir al local
3. Abra el directorio de la raíz fish-speech
4. Ejecute install_env.bat para instalar el entorno virtual y las dependencias requeridas
5. Ejecute start.bat por primera vez
6. Modifique API_FLAGS.txt y comience de nuevo

Iniciar servicio API

1. Modificar API_FLAGS.txt para ser aproximadamente el siguiente contenido, es decir, cancelar # frente a api

 # --infer
--api
--listen 0.0.0.0:8080  #监听接口
...

Parámetros adicionales que se pueden agregar en API_FLAGS.txt

1. --complie -> si se debe iniciar el modelo compilado (generación más rápida de TTS, pero un inicio más lento)
2. --workers 数字> Iniciar multi-coroutines数字(asegúrese de configurarlo, porque el predeterminado es fácil de bloquear)
3. --device cpu -> Use CPU para generar TTS (si usa GPU, ignore)
4. --half -> Use la mitad de precisión para generar TTS
5. --max-text-length > Ingrese la longitud máxima del texto