Minimania는 TTS (Text-To-Steeech) 및 음성 복제 기능을 제공하는 웹 응용 프로그램입니다. 이 응용 프로그램은 딥 러닝 모델을 사용하여 생성 된 오디오의 피치, 속도 및 볼륨을 사용자 정의하는 옵션을 통해 여러 언어로 고품질의 음성 출력을 생성합니다. Minimania의 TTS 엔진은 Tacotron 2 및 WaveGlow 모델 위에 구축되었으며 음성 복제 기능은 FastSpeech 및 Melgan 모델을 기반으로합니다.
데모를 보려면 메가 링크를 클릭하십시오 : 비디오 링크
Mimicmania를 설치하고 사용하기 전에 다음을 다운로드하여 설치해야합니다.
apt-get install ffmpeg 실행하십시오.sudo apt-get install espeak-ng 명령을 실행하십시오.sudo apt-get install espeak 명령을 실행하십시오.또한 다음 섹션에 설명 된대로 필요한 모듈 및 파이썬 종속성을 다운로드해야합니다.
Mimicmania를 설치하고 실행하려면 다음을 수행하십시오.
git clone https://github.com/everydaycodings/MimicMania.git 사용 하여이 저장소를 로컬 컴퓨터로 복제하십시오.cd MimicMania 사용하여 프로젝트 디렉토리로 이동하십시오python setup.py 실행하십시오. 필요한 모듈은 약 6GB 이므로이 프로세스는 시간이 걸릴 수 있습니다.pip install -r requirements.txt 실행하십시오.streamlit run app.py 명령을 입력하십시오. Mimicmania에 기여하려면 저장소를 포크하고 풀 요청을 작성하십시오. 우리는 버그 수정, 새로운 기능 및 문서 개선을 포함한 모든 종류의 기여를 환영합니다.
Mimicmania는 다양한 오픈 소스 리소스의 도움으로 Kumar Saksham (Everydaycodings) 에 의해 개발되었습니다.
우리는 프로젝트의 리소스로 텍스트 음성 연설 모델을 제공 한 Coqui-Ai/TTS에 특별한 감사를 전하고 싶습니다.
Mimicmania는 MIT 라이센스에 따라 라이센스가 부여됩니다.
Mimicmania와 관련하여 질문이나 문제가 있으시면 [email protected]으로 문의하거나 Twitter @EveryDayCodings 또는 Medium @EveryDayCodings로 문의하십시오.
우리는 항상 도와 드리겠습니다!