
프로젝트 동기 부여
개인 메모
Thorsten 음성 데이터 세트
Thorsten tts-models
Thorsten-Voice YouTube 채널
공개 대화 및 회의 연사
라이센스가없는 모든 프로젝트에 무료로 사용되는 오프라인 작업, 고품질 독일 TTS 음성을 사용할 수 있어야합니다.
나는 모든 사람들이 평등 한 세상을 믿는 사람으로서의 목소리를 기여합니다. 성별, 성적 취향, 종교, 피부색 및 생년월일의 지구류에 관계없이. 이 지구상의 어느 곳에서나 모든 사람이 따뜻하게 환영받는 세계 세계는 모든 사람이 개방적이고 자유로운 지식과 교육을 이용할 수 있습니다. ? ( Thorsten Müller )
나는 전문적인 음성 인재가 아니라는 점을 명심하십시오. 나는 그의 목소리를 세상과 공유하는 평범한 사람 일뿐입니다.
소셜 미디어에서 저에게 연락하십시오.
| 플랫폼 | 링크 |
|---|---|
| YouTube | YouTube에서 Thorstenvoice |
| LinkedIn의 Thorsten Müller | |
| 지저귀다 | 트위터에서 Thorstenvoice |
| 포옹 페이스 | huggingface에 Thorstenvoice |
| 인스 타 그램 | Instagram의 Thorstenvoice |
내 "Thorsten-Voice"데이터 세트는 Zenodo에 나열되어 다운로드 할 수 있습니다. 프로젝트, 제품 또는 용지에 사용하는 경우 Qoutation에게 높이 평가됩니다.
| 데이터 세트 | doi 링크 |
|---|---|
| Thorsten-Voice 데이터 세트 2021.02 (중립) | |
| Thorsten-Voice 데이터 세트 2021.06 (감정) | |
| Thorsten-Voice 데이터 세트 2022.10 (중립) | |
| Thorsten-Voice 데이터 세트 2023.09 (Hessisch) |
@dataset{muller_2021_5525342,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.02},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {3.0},
doi = {10.5281/zenodo.5525342},
url = {https://doi.org/10.5281/zenodo.5525342}
}
PDF 문서 (Thorsten DataSet의 진화)에 설명 된 바와 같이이 데이터 세트는 세 가지 기록 단계로 구성됩니다.
데이터 세트 서브 세트를 사용하려면 품질 CSV 파일을 녹화 할 때 어떤 녹화 단계에 속하는 파일이 있는지 확인할 수 있습니다.
@dataset{muller_2021_5525023,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.06 emotional},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {2.0},
doi = {10.5281/zenodo.5525023},
url = {https://doi.org/10.5281/zenodo.5525023}
}
나 자신이 기록한 모든 감정적 기록은 문구 문맥이 그 감정과 일치하지 않더라도 그 감정을 느끼고 발음하려고 노력했습니다. 예 : 나는 잠들기 직전에 졸업 한 음색으로 졸린 녹음을 발음했습니다.
이 데이터 세트의 오디오 녹음을 여기에서 듣습니다.
@dataset{muller_2022_7265581,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2022.10},
month = nov,
year = 2022,
publisher = {Zenodo},
version = {1.0},
doi = {10.5281/zenodo.7265581},
url = {https://doi.org/10.5281/zenodo.7265581}
}
@dataset{muller_2024_10511260,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2023.09 Hessisch},
month = jan,
year = 2024,
publisher = {Zenodo},
doi = {10.5281/zenodo.10511260},
url = {https://doi.org/10.5281/zenodo.10511260}
}
축하합니까? 5 년간의 Thorsten-Voice Project (2019 년 10 월) 나는 전체 샘플 리테이션 (44kHz)의 모든 레코딩을 올인원 데이터 세트에서? Huggingface! 분명히 CC0 라이센스로 다시!
@misc {thorsten_müller_2024,
author = { {Thorsten Müller} },
title = { TV-44kHz-Full (Revision ff427ec) },
year = 2024,
url = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
doi = { 10.57967/hf/3290 },
publisher = { Hugging Face }
}
이러한 OpenSource 음성 데이터 세트를 기반으로 AI / 머신 러닝 기술을 사용하여 여러 TTS (Text to Speech) 모델이 교육을 받았습니다.
프로젝트 Coqui AI , Piper TTS 및 Home Assistant 가 훈련하고 사용하는 여러 독일 모델이 있습니다. Thorsten-Voice 프로젝트 웹 사이트에서 사용 방법, 오디오 샘플 및 비디오 자습서에 대한 자세한 내용은 찾을 수 있습니다.
오디오 샘플 및 설치 / 사용 지침을 여기에서 듣습니다 (??) :
또한 Silero, Monatis와 Zdisket은 모델 교육에도 음성 데이터 세트를 사용했습니다. 더 많은 샘플과 세부 사항은 Silero Thorsten-Voice 오디오 샘플에서 찾을 수 있습니다. 자세한 내용은이 Colab 노트북을 참조하십시오.
Zdisket은 Windows에 TTS 환경을 설정하기 위해 Tensorvox라는 도구를 만들었고 Monatis가 훈련 한 독일 TTS 모델을 포함했습니다. 공유해 주셔서 감사합니다. YouTube에서 실제로 확인하십시오.
당신이 내 음성 기여를 좋아하고 OpenSource 음성 기술 미래에 대한 나의 노력을 지원하고 싶다면, 당신은 당신이 원하는 경우 저를 지원할 수 있습니다.
나는 좋은 단어, 지원 및 계산력 으로이 여정에서 나를 지원 한 위대한 사람들에게 감사합니다. El-Tocino, Eren Gölge, Gras64, Kris Gesling, Nmstoker, Othiele, Repodiac, Sanjaesc, synesthesiam.
사랑하는 동료 인 Sebastian Kraus에게 특별한 감사의 말씀을 전합니다. 오디오 녹음 장비를 통해 저를 지원하고 로고 디자인의 창의적인 마스터 마인드와 물론이 놀라운 여정에서 내 편에 너무 가까워지면서 Dear Dominik (@domcross)에게 감사드립니다.
Thorsten-Voice YouTube 채널에서 OpenSource 음성 기술에 대한 단계별 (Cooking Recipes) 자습서를 찾을 수 있습니다. 관심이 있으시면 멋진 YouTube Community.ts **에 대한 새로운 가입자로서 당신을 환영합니다.
나는 OpenSource 음성 기술 미래의 중요성에 대해 정말로 이야기하고 싶습니다. 컨퍼런스 또는 이벤트에서 연사가되기를 원한다면 Thorsten-Voice 웹 사이트 연락처 양식을 사용하여 연락을 드리겠습니다. Thorsten-Voice 웹 사이트에서 내 스피커 참조 중 일부를 참조하십시오.