RASA의 응답을 사용하여 Replica Studios 'AI Voices'API를 사용하여 자동 생성 대화 상자 오디오 파일.
Creative Chatbot 프로젝트에서 사용중인 텍스트 대화 상자에 대한 오디오 파일을 생성하여 코드가 최종 사용자에게 '현실적인', 심지어 고유 한 음성으로 '말할 수 있습니다.
이 유틸리티 독립형 또는 RASA 프로젝트 폴더 내에서 사용할 수 있습니다.
그들의 웹 사이트를 인용하기 위해 :
게임 + 영화의 AI 음성 배우
그것은 모두 재능있는 음성 배우가 우리의 공연 방법을 훈련시키는 시간을 소비하는 것으로 시작합니다. 우리의 AI 모델은 실제 음성 행위자 독특한 음성 패턴, 발음 및 감정적 범위를 복사하여 수행하는 방법을 배웁니다. 최종 결과는 게임이나 영화에서 사용할 수있는 AI 음성 배우입니다.
그들의 웹 사이트를 인용하기 위해 :
RASA는 개인화 된 대화를위한 주요 대화 AI 플랫폼입니다.
RASA 오픈 소스는 자연어 이해, 대화 관리 및 통합을위한 프레임 워크입니다. RASA X는 RASA 오픈 소스를 사용하여 구축 된 가상 어시스턴트를 개선하는 데 사용되는 무료 도구 세트입니다. 함께 강력한 텍스트 및 음성 기반 비서 및 챗봇을 만들기위한 모든 기능이 포함되어 있습니다.
이 유틸리티는 GNU General Public License v3.0에 따라 배포되며 File Licence.txt에서 찾을 수 있습니다. 요약 :
이 강력한 Copyleft 라이센스의 권한은 동일한 라이센스에 따라 라이센스 작업을 사용하는 대규모 작업을 포함하여 라이센스 작업 및 수정을 가능한 완전한 소스 코드로 만들 수 있습니다. 저작권 및 라이센스 통지는 보존되어야합니다. 기고자는 특허권의 명시적인 보조금을 제공합니다.
먼저 복제 스튜디오와 계정이 필요합니다. 2021 년 7 월 현재 가입하면 30 분의 무료 학점을받습니다. 다음 추천 링크를 사용하면 60 분이 걸립니다.
https://replicastudios.com/account/signup?referral_code=xe07evdx
활성 계정이 있으면 자격 증명을 로컬 파일에 넣어 대화 생성 스크립트가 API에 대해 귀하를 인증 할 수 있도록하십시오.
# replica_api_credentials.json
{
"client_id" : "<your replica username>",
"secret" : "<your replica password>"
}
(참고 : replica_api_credentials.json GIT Repo에 추가하거나 푸시해서는 안되며 기본적으로 .gitignore 에서 무시됩니다.)
다음으로 오디오 파일을 생성하려면 음성의 이름과 복제 UID를 지정해야합니다. 예는 다음과 같습니다.
# replica_config.json
{
"replica_voice_uids" : {
"amber" : "4807ea95-5b17-43b7-b25d-e409736a099f",
"thomas" : "c7c81053-7ac3-4b2f-9809-0be6fae07ca5"
}
}
글을 쓰는 시점 (2021 년 7 월)에서 음성을 선택할 때 Replica 웹 사이트 프로젝트 페이지의 출처를 볼 때 UID를 얻는 것이 가능해 보입니다.
생성 할 대화 상자를 정의하는 현재/프로젝트 폴더에 dialog 폴더와 responses.yml 파일이 필요합니다.
mkdir dialog
RASA V2 문서에서 가져온 간단한 예제 responses.yml 다음과 같습니다.
# ./dialog/responses.yml
---
version: "2.0"
responses:
utter_greet:
- text: "Hi there!"
utter_bye:
- text: "See you!"
이제 Python Virtual Environment (VEYNV)를 작성하고 requirements.txt 에 정의 된 패키지 종속성을 설치하십시오.
python3 -m venv ./venv
source ./venv/bin/activate
pip3 install -r requirements.txt
지금까지 그것을 만들었다면 이제 ./dialog/responses.yml 의 모든 대화 상자를 통해 작동하고 각각의 OGG 오디오 파일을 생성하려고 시도하는 generate_dialog.py 실행할 수 있어야합니다 ( replica_config.json 에 지정할 첫 번째 음성 사용) :
python generate_dialog.py
문제 : ModuleNotFoundError , 예를 들어 '요청':
% python generate_dialog.py
Traceback (most recent call last):
File "generate_dialog.py", line 1, in <module>
import requests
ModuleNotFoundError: No module named 'requests'
솔루션 : PIP3 (위와 같이)을 사용하여 Depdendencies를 설치 한 다음 실행하기 전에 Venv를 활성화했습니다.
source ./venv/bin/activate
python generate_dialog.py
버그를 찾았습니까? 문제를 제기하는 것을 고려하십시오.
이것은 조사 할 수 있고 일반적으로 문제에 대해 응답 할 기고자에게 알리고 프로세스에서 귀하에게 알립니다.
새 기능을 추가하거나 기존 버그를 수정하려면 자유롭게 느끼십시오!
다음은 따라야 할 프로세스의 요약입니다.
작업 할 작업과 이유를 설명하는 문제가 있는지 확인하십시오. 그렇지 않은 경우 새 문제를 제출하여 '버그'또는 이와 유사한 라벨을 붙입니다.
이 리포지토리의 새 지점 (Repo)을 작성하여 기여도의 구현을 포함하고 문제 번호가 분기 이름으로 표시됩니다.
git checkout -b 123-name-of-your-new-branch
(여기서 '123'은 문제 번호입니다);
git add .
git commit -m "fixed a bug"
git push origin 123-name-of-your-new-branch
이것은 검토를 시작하고 GitHub를 통해 귀하와 의사 소통 할 수있는 프로젝트 소유자에게 알려야합니다.