Archivos de audio de diálogo de generación automática utilizando la API de réplica de 'Voices AI' de los estudios utilizando el formato de archivo respuestas.yml de RASA.
Desea generar archivos de audio para el diálogo de texto que está utilizando en su proyecto de chatbot creativo, para que su código pueda 'hablar', en una voz 'realista', quizás incluso única, al usuario final.
Puede usar esta utilidad independiente o dentro de una carpeta de proyecto RASA.
Para citar su sitio web:
Actores de voz de IA para juegos + películas
Todo comienza con un actor de voz talentoso que pasa horas entrenando a nuestra IA cómo realizar. Nuestro modelo de IA aprende cómo realizar copiando los actores de voz reales, patrones de habla únicos, pronunciación y rango emocional. El resultado final es un actor de voz de IA que puedes usar en tus juegos o películas.
Para citar su sitio web:
Rasa es la principal plataforma de IA conversacional, para conversaciones personalizadas a escala.
Rasa Open Source es un marco para la comprensión del lenguaje natural, la gestión del diálogo e integraciones. Rasa X es un conjunto de herramientas gratuito utilizado para mejorar los asistentes virtuales construidos con el código abierto RASA. Juntos, incluyen todas las características para crear potentes asistentes y chatbots basados en texto y voz.
Esta utilidad se distribuye bajo GNU General Public License v3.0, que se puede encontrar en el archivo Licence.txt. En resumen:
Los permisos de esta fuerte licencia de Copyleft están condicionados a poner a disposición el código fuente completo de obras y modificaciones con licencia, que incluyen trabajos más grandes utilizando un trabajo con licencia, bajo la misma licencia. Se deben preservar los avisos de derechos de autor y licencia. Los contribuyentes proporcionan una subvención expresa de derechos de patente.
Primero necesitará una cuenta con réplicas de estudios. A partir de julio de 2021, obtienes 30 minutos de crédito gratuito cuando te registras. Si usa el siguiente enlace de referencia, obtiene 60 minutos:
https://replicastudios.com/account/signup?referral_code=xe07evdx
Una vez que tenga una cuenta activa, coloque sus credenciales en un archivo local para que el script de generación de diálogo pueda autenticarlo contra la API:
# replica_api_credentials.json
{
"client_id" : "<your replica username>",
"secret" : "<your replica password>"
}
(NOTA: replica_api_credentials.json no debe agregarse ni empujar a un repositorio de GIT y se ignora en .gitignore de forma predeterminada).
A continuación, deberá especificar el nombre y la réplica de una voz para generar archivos de audio. Aquí hay un ejemplo:
# replica_config.json
{
"replica_voice_uids" : {
"amber" : "4807ea95-5b17-43b7-b25d-e409736a099f",
"thomas" : "c7c81053-7ac3-4b2f-9809-0be6fae07ca5"
}
}
Al momento de escribir este artículo (julio de 2021), solo parece posible obtener el UID viendo la fuente de la fuente de la página del proyecto del sitio web de réplica al seleccionar una voz.
Necesitará una carpeta dialog y un archivo responses.yml en su carpeta actual/proyecto, definiendo el cuadro de diálogo que se generará:
mkdir dialog
Aquí hay un ejemplo responses.yml de ejemplo.
# ./dialog/responses.yml
---
version: "2.0"
responses:
utter_greet:
- text: "Hi there!"
utter_bye:
- text: "See you!"
Ahora cree un entorno virtual de Python (VENV) e instale las dependencias del paquete definidas en requirements.txt :
python3 -m venv ./venv
source ./venv/bin/activate
pip3 install -r requirements.txt
Si ha llegado tan lejos, ahora debería poder ejecutar generate_dialog.py , que funcionará a través de todo el cuadro de diálogo en ./dialog/responses.yml e intentar generar archivos de audio OGG para cada uno (usando la primera voz que especifica en replica_config.json ):
python generate_dialog.py
Problema: ModuleNotFoundError , por ejemplo, para 'solicitudes':
% python generate_dialog.py
Traceback (most recent call last):
File "generate_dialog.py", line 1, in <module>
import requests
ModuleNotFoundError: No module named 'requests'
Solución: asegúrese de instalar las dependencias utilizando PIP3 (como arriba), luego (re) activó su venv antes de ejecutar:
source ./venv/bin/activate
python generate_dialog.py
Encontrado un error? Considere plantear un problema:
Esto debería notificar a los contribuyentes que puedan investigar y generalmente responderán sobre el problema, notificándole en el proceso.
Si desea agregar una nueva función o arreglar un error existente, ¡no dude!
Aquí hay un resumen del proceso que debe seguir:
Asegúrese de que exista un problema que describa en qué trabajará y por qué; Si no, envíe un nuevo problema y etiquételo con 'error' o similar;
Cree una nueva rama de este repositorio (Repo) que contenga la implementación de su contribución, con el número de problema en el nombre de la rama, por ejemplo:
git checkout -b 123-name-of-your-new-branch
(donde '123' es el número de problema);
git add .
git commit -m "fixed a bug"
git push origin 123-name-of-your-new-branch
Esto debería notificar al propietario del proyecto que pueda iniciar una revisión y comunicarse con usted a través de GitHub.