스피커 분리 (일기)로 Google Speech를 통해 텍스트 API로 오디오를 전사하십시오. 오디오 및 관련 텍스트를 사용하여 TTS 데이터 세트를 자동으로 생성합니다. Google API를 사용하여 최대 침묵 휴식 (권장)에 의해 분할 된 컷을 전사합니다. 또는 aeneas를 사용하여 텍스트를 오디오에 맞춰야합니다. 빠르게 교정하고 컷을 편집합니다.
Google Speech to Text API의 경우 Google Cloud 플랫폼 계정이 필요합니다. 귀하의 $ Google_Application_credentials Env ariable은 자격 증명 JSON 파일 경로를 가리켜 야합니다. Google은 300 달러 상당의 서비스와 3 개월 무료 새로운 계정을 제공합니다.
GUI 도구 용 도구를 실행하십시오.
현재 제한 사항은 교정 섹션의 열 너비를 조정해야하며 항목을 탐색 할 때는 현재 및 다음 입력 텍스트 상자에서 초점을 맞추어야합니다. 그렇지 않으면 텍스트 상자가 업데이트되지 않습니다. Dearpy Gui의 다음 버전은 이러한 문제를 해결합니다.
VPN을 사용하면 긴 Google Speech to Text API 요청을 방해합니다.


The Moment에서 Dearpygui의 이전 버전을 사용하여 결국 마이그레이션 할 것입니다.
PIP는 Numpy -user를 설치합니다
PIP Pydub -user를 설치하십시오
PIP 설치 dearpygui == 0.6.415 -user
PIP는 Google-Cloud-Speech -user를 설치합니다
PIP는 Google-Cloud-Storage -user를 설치합니다
PIP SimpleAudio -user를 설치하십시오
*SimpleAudio를 구축 할 수없는 경우 GCC가 설치되어 있는지 확인하십시오 : Sudo apt-Get Update, Sudo apt-Get Build-Estentials
PIP 설치 SOX -USER
Aeneas 옵션에는 Linux 환경이 권장되며 Windows Aeneas는 메모리 문제로 인해 더 긴 컷을 만들 수 없습니다.
wget https://raw.githubusercontent.com/readbeyond/aeneas/master/install_dependencies.sh
bash install_dependencies.sh
PIP는 Numpy -user를 설치합니다
PIP 설치 AENEAS-USER
테스트 설치 : Python -m aeneas.diagnostics
PIP Pydub -user를 설치하십시오
PIP 설치 dearpygui == 0.6.415 -user
PIP는 Google-Cloud-Speech -user를 설치합니다
PIP는 Google-Cloud-Storage -user를 설치합니다
PIP SimpleAudio -user를 설치하십시오
PIP 설치 SOX -USER
libpython 오류가 발생하면 :
sudo apt 설치 libasound2-dev
입력 : Sudo nano ~/.bashrc를 통해 bashrc 파일을 편집하십시오
그런 다음 패키지가 설치된 위치에 따라 정보와 함께 끝에 라인을 추가하십시오.
내보내기 ld_library_path = "/[yourhomepath]/anaconda3/envs/[Yourenv]/lib/"
또는
내보내기 ld_library_path = "/[yourhomepath]/. conda/envs/[Yourenv]/lib/"
또는 기본 환경 인 경우
내보내기 ld_library_path = "/[yourhomepath]/anaconda3/lib/"
CTRL+O를 눌러 업데이트 된 파일을 내보내십시오. 그런 다음 ctrl+x를 종료합니다.
새 경로를 활성화하려면 소스 ~/.bashrc를 입력하십시오.
비디오 자습서 : https://www.youtube.com/watch?v=te7pui2xeje
훈련 전에 항상 교정해야하지만 몇 가지가 상처의 품질을 향상시킬 것입니다. 영어 이외의 언어의 경우 Aeneas 명령 줄 및 문자 교체를 귀하의 필요에 따라 쉽게 편집하고 Google EN-US 언어 코드를 언어 코드 (https://cloud.google.com/speech-text/docs/languages)로 바꿀 수 있습니다. 챕터 제목과 같은 것들이 포함되어 있는지 확인하십시오. 느리고 속도가 느리고 연설을하는 스피커는 가장 깨끗한 컷을 만들어내는 반면, 빠르게 진행되는 스피커는 단어를 함께 실행하는 경향이 있으며 단어, 단어 조각을 다음 컷으로 편집 해야하는 곳으로 이동시킬 수 있습니다. 가능하면 모든 음악을 제거하십시오.