CTTS 다운로드 CTTS 소스 코드 다운로드

CTTS

AI 소스 코드

1.0.0

다운로드

광동어 TTS 프론트 엔드

Merlin Toolkit을 사용한 통계적 파라 메트릭 음성 합성을 기반으로 한 광동/중국어 텍스트

이 프로젝트는 MTTS의 영향을받습니다

재생산하는 방법

먼저 데이터가 포함되어있어 wav와 txt가 필요합니다 (Prosody Mark는 선택 사항입니다).
둘째,이 프로젝트를 사용하여 HTS 레이블을 생성하십시오
Merlin/EGS/Cantonese_voice를 사용하여 광동어 목소리를 훈련하고 생성합니다

컨텍스트 관련 주석 및 질문 세트

컨텍스트 관련 주석
질문 세트
질문 세트를 설계하는 규칙

설치하다

파이썬 : Python3.6
시스템 : Linux (Ubuntu16.04에서 테스트)

 sudo apt-get install libatlas3-base

bash tools/install_mtts.sh 실행하십시오
또는 직접 파일을 다운로드하십시오

Montreal-Forced-Aligner를 다운로드하고 디렉토리 도구로 압축을 풀어주십시오.

데모를 실행하십시오

 bash run_demo.sh

용법

1. Wav와 텍스트별로 HTS 레이블을 생성합니다

사용법 : python src/mtts.py txtfile wav_directory_path output_directory_path (절대 경로 또는 상대 경로)를 실행하면 HTS 레이블이 있으면 HTS 레이블을 얻을 수 있습니다. Month Real-Forced-Aligner에 의해 자신의 음향 모델이 훈련 된 경우 -a your_acoustic_model.zip 을 추가합니다.
주의 : 현재 중국어 만 지원하고 TXT는 아라비아 번호 나 영어 알파벳이 없어야합니다.

txtfile 예제

 A_01 这是一段文本
A_02 这是第二段文本

wav_directory 예제 (샘플링 속도는 16kHz보다 크면)

 A_01.wav  
A_02.wav

2. 정렬 파일이 있거나없는 텍스트별로 HTS 레이블 생성

사용법 : python src/mandarin_frontend.py txtfile output_directory_path 실행합니다
또는 Mandarin_frontend를 가져옵니다

 from mandarin_frontend import txt2label

result = txt2label('向香港特别行政区同胞澳门和台湾同胞海外侨胞')
[print(line) for line in result]

자세한 내용은 소스 코드를 참조하지만 정렬 파일 (SFS 파일)에주의를 기울이면 형식은 endtime phone_type start_time, phone_type (Speech Ocean의 데이터와 다름)입니다.

3. 강제 정렬

이 프로젝트는 Montreal-Forced-Aligner를 사용하여 강제 정렬을 수행합니다. 더 나은 정렬을 얻으려면 데이터를 사용하여 정렬 모델을 교육하십시오.

우리는 데이터 세트에서 음향 모델을 교육했습니다.

프로디 마크

Prosody Mark없이 HTS 레이블을 생성 할 수 있습니다. 우리는 단어 세그먼트가 prosodic Word보다 작다고 가정합니다 (코드에서 조정 됨)

향후 개선

텍스트 정규화
더 나은 중국어 단어 세그먼트
G2P : 폴리폰 문제
더 나은 레이블 형식 및 질문 세트
프로디 분석의 개선
더 나은 정렬

기부자

miRAN899

확장하다

추가 정보

버전 1.0.0
유형 AI 소스 코드
업데이트 시간 2025-08-24
크기 88.87MB
출처 Github

CTTS

광동어 TTS 프론트 엔드

재생산하는 방법

컨텍스트 관련 주석 및 질문 세트

설치하다

용법

1. Wav와 텍스트별로 HTS 레이블을 생성합니다

2. 정렬 파일이 있거나없는 텍스트별로 HTS 레이블 생성

3. 강제 정렬

프로디 마크

향후 개선

기부자

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express