Descarga de replica_dialog_generator - Descargar el código fuente replica_dialog

replica_dialog_generator

Código Fuente de IA

1.0.0

Descargar

réplica_dialog_generator

Archivos de audio de diálogo de generación automática utilizando la API de réplica de 'Voices AI' de los estudios utilizando el formato de archivo respuestas.yml de RASA.

¿Qué hace esto? ¿Por qué querrías usarlo?

Desea generar archivos de audio para el diálogo de texto que está utilizando en su proyecto de chatbot creativo, para que su código pueda 'hablar', en una voz 'realista', quizás incluso única, al usuario final.

Puede usar esta utilidad independiente o dentro de una carpeta de proyecto RASA.

¿Qué son los estudios de réplica?

Para citar su sitio web:

Actores de voz de IA para juegos + películas

Todo comienza con un actor de voz talentoso que pasa horas entrenando a nuestra IA cómo realizar. Nuestro modelo de IA aprende cómo realizar copiando los actores de voz reales, patrones de habla únicos, pronunciación y rango emocional. El resultado final es un actor de voz de IA que puedes usar en tus juegos o películas.

¿Qué es Rasa?

Para citar su sitio web:

Rasa es la principal plataforma de IA conversacional, para conversaciones personalizadas a escala.

Rasa Open Source es un marco para la comprensión del lenguaje natural, la gestión del diálogo e integraciones. Rasa X es un conjunto de herramientas gratuito utilizado para mejorar los asistentes virtuales construidos con el código abierto RASA. Juntos, incluyen todas las características para crear potentes asistentes y chatbots basados en texto y voz.

Licencia

Esta utilidad se distribuye bajo GNU General Public License v3.0, que se puede encontrar en el archivo Licence.txt. En resumen:

Los permisos de esta fuerte licencia de Copyleft están condicionados a poner a disposición el código fuente completo de obras y modificaciones con licencia, que incluyen trabajos más grandes utilizando un trabajo con licencia, bajo la misma licencia. Se deben preservar los avisos de derechos de autor y licencia. Los contribuyentes proporcionan una subvención expresa de derechos de patente.

Configurar réplica de los estudios API

Primero necesitará una cuenta con réplicas de estudios. A partir de julio de 2021, obtienes 30 minutos de crédito gratuito cuando te registras. Si usa el siguiente enlace de referencia, obtiene 60 minutos:

https://replicastudios.com/account/signup?referral_code=xe07evdx

Una vez que tenga una cuenta activa, coloque sus credenciales en un archivo local para que el script de generación de diálogo pueda autenticarlo contra la API:

 # replica_api_credentials.json
{
  "client_id" : "<your replica username>",
  "secret" : "<your replica password>"
}

(NOTA: replica_api_credentials.json no debe agregarse ni empujar a un repositorio de GIT y se ignora en .gitignore de forma predeterminada).

A continuación, deberá especificar el nombre y la réplica de una voz para generar archivos de audio. Aquí hay un ejemplo:

 # replica_config.json
{
  "replica_voice_uids" : {
    "amber" : "4807ea95-5b17-43b7-b25d-e409736a099f",
    "thomas" : "c7c81053-7ac3-4b2f-9809-0be6fae07ca5"
  }
}

Al momento de escribir este artículo (julio de 2021), solo parece posible obtener el UID viendo la fuente de la fuente de la página del proyecto del sitio web de réplica al seleccionar una voz.

Prepara tu diálogo

Necesitará una carpeta dialog y un archivo responses.yml en su carpeta actual/proyecto, definiendo el cuadro de diálogo que se generará:

 mkdir dialog

Aquí hay un ejemplo responses.yml de ejemplo.

 # ./dialog/responses.yml
---
version: "2.0"

responses:
  utter_greet:
  - text: "Hi there!"
  utter_bye:
  - text: "See you!"

Configurar el entorno Python

Ahora cree un entorno virtual de Python (VENV) e instale las dependencias del paquete definidas en requirements.txt :

 python3 -m venv ./venv
source ./venv/bin/activate
pip3 install -r requirements.txt

Generar audio usando una voz de IA

Si ha llegado tan lejos, ahora debería poder ejecutar generate_dialog.py , que funcionará a través de todo el cuadro de diálogo en ./dialog/responses.yml e intentar generar archivos de audio OGG para cada uno (usando la primera voz que especifica en replica_config.json ):

 python generate_dialog.py

Solución de problemas

Problema: ModuleNotFoundError , por ejemplo, para 'solicitudes':

 % python generate_dialog.py
Traceback (most recent call last):
  File "generate_dialog.py", line 1, in <module>
    import requests
ModuleNotFoundError: No module named 'requests'

Solución: asegúrese de instalar las dependencias utilizando PIP3 (como arriba), luego (re) activó su venv antes de ejecutar:

 source ./venv/bin/activate
python generate_dialog.py

Encontrado un error? Considere plantear un problema:

Verifique si se ha informado el mismo problema o similar en la pestaña Problemas de GitHub
Si no, envíe un nuevo problema y etiquételo con 'error' o similar.

Esto debería notificar a los contribuyentes que puedan investigar y generalmente responderán sobre el problema, notificándole en el proceso.

Contribuir

Si desea agregar una nueva función o arreglar un error existente, ¡no dude!

Aquí hay un resumen del proceso que debe seguir:

Asegúrese de que exista un problema que describa en qué trabajará y por qué; Si no, envíe un nuevo problema y etiquételo con 'error' o similar;
Cree una nueva rama de este repositorio (Repo) que contenga la implementación de su contribución, con el número de problema en el nombre de la rama, por ejemplo:

git checkout -b 123-name-of-your-new-branch

(donde '123' es el número de problema);

Una vez que esté satisfecho con los cambios que realizó en su base de código local , empújalos al repositorio de GitHub:

 git add .
git commit -m "fixed a bug"
git push origin 123-name-of-your-new-branch

Abra una solicitud de extracción en GitHub para su nueva rama usando el botón "nueva solicitud de extracción"; Agregue un título y un comentario que describe lo que ha hecho, luego presione el botón "Crear solicitud de extracción".

Esto debería notificar al propietario del proyecto que pueda iniciar una revisión y comunicarse con usted a través de GitHub.

Expandir

Información adicional