Thorsten Voice 다운로드 - Thorsten Voice 소스 코드 다운로드

Thorsten Voice

AI 소스 코드

1.0.0

다운로드

Thorsten-Voice 로고

프로젝트 동기 부여
개인 메모
Thorsten 음성 데이터 세트
- Thorsten-Voice 데이터 세트 2021.02 (중립)
- Thorsten-Voice 데이터 세트 2021.06 (감정)
- Thorsten-Voice 데이터 세트 2022.10 (중립)
- Thorsten-Voice 데이터 세트 2023.09 (Hessisch)
- Thorsten-Voice 데이터 세트 전체 44khz
Thorsten tts-models
Thorsten-Voice YouTube 채널
공개 대화 및 회의 연사

Thorsten-Voice 프로젝트의 동기 부여

라이센스가없는 모든 프로젝트에 무료로 사용되는 오프라인 작업, 고품질 독일 TTS 음성을 사용할 수 있어야합니다.

Thorsten Müller의 개인적인 말

나는 모든 사람들이 평등 한 세상을 믿는 사람으로서의 목소리를 기여합니다. 성별, 성적 취향, 종교, 피부색 및 생년월일의 지구류에 관계없이. 이 지구상의 어느 곳에서나 모든 사람이 따뜻하게 환영받는 세계 세계는 모든 사람이 개방적이고 자유로운 지식과 교육을 이용할 수 있습니다. ? ( Thorsten Müller )

나는 전문적인 음성 인재가 아니라는 점을 명심하십시오. 나는 그의 목소리를 세상과 공유하는 평범한 사람 일뿐입니다.

소셜 미디어

소셜 미디어에서 저에게 연락하십시오.

플랫폼	링크
YouTube	YouTube에서 Thorstenvoice
LinkedIn	LinkedIn의 Thorsten Müller
지저귀다	트위터에서 Thorstenvoice
포옹 페이스	huggingface에 Thorstenvoice
인스 타 그램	Instagram의 Thorstenvoice

음성-다타 세트

내 "Thorsten-Voice"데이터 세트는 Zenodo에 나열되어 다운로드 할 수 있습니다. 프로젝트, 제품 또는 용지에 사용하는 경우 Qoutation에게 높이 평가됩니다.

데이터 세트	doi 링크
Thorsten-Voice 데이터 세트 2021.02 (중립)
Thorsten-Voice 데이터 세트 2021.06 (감정)
Thorsten-Voice 데이터 세트 2022.10 (중립)
Thorsten-Voice 데이터 세트 2023.09 (Hessisch)

Thorsten-Voice 데이터 세트 2021.02 (중립)

 @dataset{muller_2021_5525342,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.02},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {3.0},
  doi          = {10.5281/zenodo.5525342},
  url          = {https://doi.org/10.5281/zenodo.5525342}
}

데이터 세트 요약

Thorsten Müller가 녹음했습니다
Dominik Kreutz에 의해 최적화되었습니다
ljspeech 파일 및 디렉토리 구조
22.668 기록 된 문구 ( WAV 파일 )
23 시간 이상의 순수한 오디오
22.050Hz 샘플링
단핵증
-24dB로 정규화되었습니다
문구 길이 (최소 / AVG / MAX) : 2 / 52 / 180 숯
시작/끝에 침묵이 없습니다
AVG는 초당 숯 : 14
물음표가있는 문장 : 2.780
느낌표가있는 문장 : 1.840

데이터 세트 진화

PDF 문서 (Thorsten DataSet의 진화)에 설명 된 바와 같이이 데이터 세트는 세 가지 기록 단계로 구성됩니다.

1 단계 : 저렴한 USB 마이크로 녹음 ( 품질이 낮음 )
2 단계 : 좋은 마이크로 녹음 ( 좋은 품질 )
3 단계 : 동일한 좋은 마이크이지만 더 긴 문구 (> 100 숯 )로 기록

데이터 세트 서브 세트를 사용하려면 품질 CSV 파일을 녹화 할 때 어떤 녹화 단계에 속하는 파일이 있는지 확인할 수 있습니다.

Thorsten-Voice 데이터 세트 2021.06 (감정)

 @dataset{muller_2021_5525023,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.06 emotional},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {2.0},
  doi          = {10.5281/zenodo.5525023},
  url          = {https://doi.org/10.5281/zenodo.5525023}
}

나 자신이 기록한 모든 감정적 기록은 문구 문맥이 그 감정과 일치하지 않더라도 그 감정을 느끼고 발음하려고 노력했습니다. 예 : 나는 잠들기 직전에 졸업 한 음색으로 졸린 녹음을 발음했습니다.

데이터 세트 요약

Thorsten Müller가 녹음했습니다
Dominik Kreutz에 의해 최적화되었습니다
300 문장 * 8 감정 = 2.400 녹음
단핵증
22.050Hz 샘플링
-24dB로 정규화되었습니다
시작/끝에 침묵이 없습니다
문장 길이 : 59-148 숯

Thorsten-Voice 데이터 세트 2022.10 (중립)

이 데이터 세트의 오디오 녹음을 여기에서 듣습니다.

 @dataset{muller_2022_7265581,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2022.10},
  month        = nov,
  year         = 2022,
  publisher    = {Zenodo},
  version      = {1.0},
  doi          = {10.5281/zenodo.7265581},
  url          = {https://doi.org/10.5281/zenodo.7265581}
}

Thorsten-Voice 데이터 세트 2023.09 (Hessisch)

 @dataset{muller_2024_10511260,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2023.09 Hessisch},
  month        = jan,
  year         = 2024,
  publisher    = {Zenodo},
  doi          = {10.5281/zenodo.10511260},
  url          = {https://doi.org/10.5281/zenodo.10511260}
}

Thorsten-Voice 데이터 세트 전체 44khz

축하합니까? 5 년간의 Thorsten-Voice Project (2019 년 10 월) 나는 전체 샘플 리테이션 (44kHz)의 모든 레코딩을 올인원 데이터 세트에서? Huggingface! 분명히 CC0 라이센스로 다시!

https://huggingface.co/datasets/thorsten-voice/tv-44khz-full

 @misc {thorsten_müller_2024,
    author       = { {Thorsten Müller} },
    title        = { TV-44kHz-Full (Revision ff427ec) },
    year         = 2024,
    url          = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
    doi          = { 10.57967/hf/3290 },
    publisher    = { Hugging Face }
}

TTS 모델

이러한 OpenSource 음성 데이터 세트를 기반으로 AI / 머신 러닝 기술을 사용하여 여러 TTS (Text to Speech) 모델이 교육을 받았습니다.

프로젝트 Coqui AI , Piper TTS 및 Home Assistant 가 훈련하고 사용하는 여러 독일 모델이 있습니다. Thorsten-Voice 프로젝트 웹 사이트에서 사용 방법, 오디오 샘플 및 비디오 자습서에 대한 자세한 내용은 찾을 수 있습니다.

오디오 샘플 및 설치 / 사용 지침을 여기에서 듣습니다 (??) :

중립 TTS
정서적 tts
Hessisches tts
Smarthome / Home Assistant

또한 Silero, Monatis와 Zdisket은 모델 교육에도 음성 데이터 세트를 사용했습니다. 더 많은 샘플과 세부 사항은 Silero Thorsten-Voice 오디오 샘플에서 찾을 수 있습니다. 자세한 내용은이 Colab 노트북을 참조하십시오.

Zdisket은 Windows에 TTS 환경을 설정하기 위해 Tensorvox라는 도구를 만들었고 Monatis가 훈련 한 독일 TTS 모델을 포함했습니다. 공유해 주셔서 감사합니다. YouTube에서 실제로 확인하십시오.

지원 및 감사합니다

당신이 내 음성 기여를 좋아하고 OpenSource 음성 기술 미래에 대한 나의 노력을 지원하고 싶다면, 당신은 당신이 원하는 경우 저를 지원할 수 있습니다.

내 Thorsten-Voice YouTube 채널을 구독하고 공유하고 소셜 미디어 프로필에서 나를 팔로우하십시오.
Ko-Fi 또는 Github 스폰서를 사용하여 차를 사십시오

나는 좋은 단어, 지원 및 계산력 으로이 여정에서 나를 지원 한 위대한 사람들에게 감사합니다. El-Tocino, Eren Gölge, Gras64, Kris Gesling, Nmstoker, Othiele, Repodiac, Sanjaesc, synesthesiam.

사랑하는 동료 인 Sebastian Kraus에게 특별한 감사의 말씀을 전합니다. 오디오 녹음 장비를 통해 저를 지원하고 로고 디자인의 창의적인 마스터 마인드와 물론이 놀라운 여정에서 내 편에 너무 가까워지면서 Dear Dominik (@domcross)에게 감사드립니다.

"Thorsten-Voice"YouTube 채널

Thorsten-Voice YouTube 채널에서 OpenSource 음성 기술에 대한 단계별 (Cooking Recipes) 자습서를 찾을 수 있습니다. 관심이 있으시면 멋진 YouTube Community.ts **에 대한 새로운 가입자로서 당신을 환영합니다.

회의 연사

나는 OpenSource 음성 기술 미래의 중요성에 대해 정말로 이야기하고 싶습니다. 컨퍼런스 또는 이벤트에서 연사가되기를 원한다면 Thorsten-Voice 웹 사이트 연락처 양식을 사용하여 연락을 드리겠습니다. Thorsten-Voice 웹 사이트에서 내 스피커 참조 중 일부를 참조하십시오.

확장하다

추가 정보