
Motivation du projet
Note personnelle
Ensembles de données vocales Thorsten
Thorsten tts modéliques
Channe YouTube Thorsten-Voice
Conférencier public et conférencier
Une voix TTS allemande gratuite et hors ligne et hors ligne devrait être disponible pour chaque projet sans aucune licence en difficulté.
Je contribue ma voix en tant que personne croyant en un monde où tous sont égaux. Peu importe le sexe, l'orientation sexuelle, la religion, la couleur de la peau et les géocoordonnées du lieu de naissance. Un monde mondial où tout le monde est chaleureusement accueilli sur n'importe quel endroit sur cette planète et les connaissances et l'éducation ouvertes et gratuites sont disponibles pour tous. ? ( Thorsten Müller )
Veuillez garder à l'esprit que je ne suis pas un talent de voix professionnelle . Je suis juste un gars normal partageant sa voix avec le monde.
N'hésitez pas à me contacter sur les réseaux sociaux ?.
| Plate-forme | Lien |
|---|---|
| Youtube | Thorstenvoice sur youtube |
| Liendin | Thorsten Müller sur Linkedin |
| Gazouillement | Thorstenvoice sur Twitter |
| Étreinte | Thorstenvoice sur Hugging Face |
| Thorstenvoice sur Instagram |
Tous mes ensembles de données "Thorsten-Voice" sont répertoriés et téléchargeables sur Zenodo. Qoutation est très appréciée au cas où vous les utiliseriez dans vos projets, produits ou papiers.
| Ensemble de données | Lien doi |
|---|---|
| DataSten Datasten DataSet 2021.02 (neutre) (Neutre) | |
| L'ensemble de données Thorsten-Voice 2021.06 (émotionnel) | |
| DataSten Datasten DataSt 222.10 (neutre) | |
| L'ensemble de données Thorsten-Voice 2023.09 (Hessisch) |
@dataset{muller_2021_5525342,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.02},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {3.0},
doi = {10.5281/zenodo.5525342},
url = {https://doi.org/10.5281/zenodo.5525342}
}
Comme décrit dans le document PDF (Evolution of Thorsten DataSet), cet ensemble de données se compose de trois phases d'enregistrement.
Si vous souhaitez utiliser un sous-ensemble d'ensemble de données, vous pouvez voir quels fichiers appartiennent à quelle phase d'enregistrement dans le fichier CSV de qualité d'enregistrement.
@dataset{muller_2021_5525023,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.06 emotional},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {2.0},
doi = {10.5281/zenodo.5525023},
url = {https://doi.org/10.5281/zenodo.5525023}
}
Tous les enregistrements émotionnels où sont enregistrés par moi-même et j'ai essayé de ressentir et de prononcer cette émotion même si le contexte de la phrase ne correspond pas à cette émotion. Exemple: J'ai prononcé les enregistrements endormis dans le ton que j'ai peu de temps avant de m'endormir.
Écoutez quelques enregistrements audio de cet ensemble de données ici.
@dataset{muller_2022_7265581,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2022.10},
month = nov,
year = 2022,
publisher = {Zenodo},
version = {1.0},
doi = {10.5281/zenodo.7265581},
url = {https://doi.org/10.5281/zenodo.7265581}
}
@dataset{muller_2024_10511260,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2023.09 Hessisch},
month = jan,
year = 2024,
publisher = {Zenodo},
doi = {10.5281/zenodo.10511260},
url = {https://doi.org/10.5281/zenodo.10511260}
}
Célébrer? 5 ans de projet Thorsten-Voice (est. Octobre 2019) J'ai publié tous les enregistrements en échantillonnage complet (44 kHz) dans un ensemble de données tout-en-un sur? HuggingFace! Évidemment encore une fois dans la licence CC0!
@misc {thorsten_müller_2024,
author = { {Thorsten Müller} },
title = { TV-44kHz-Full (Revision ff427ec) },
year = 2024,
url = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
doi = { 10.57967/hf/3290 },
publisher = { Hugging Face }
}
Sur la base de ces ensembles de données vocales OpenSource, plusieurs modèles TTS (texte à la parole) ont été formés à l'aide d'une technologie d'apprentissage AI / machine.
Il existe plusieurs modèles allemands disponibles formés et utilisés par les projets Coqui AI , Piper TTS et l'assistant à domicile . Vous pouvez trouver plus d'informations sur la façon de les utiliser, des échantillons audio et des tutoriels vidéo sur le site Web du projet Thorsten-Voice.
Écoutez les échantillons audio et les instructions d'installation / d'utilisation ici (??):
De plus, SILERO, Monatis et Zdisket ont également utilisé mes ensembles de données vocales pour la formation de modèle. Plus d'échantillons et de détails peuvent être trouvés sur des échantillons audio SILERO THORSTEN-VOICE. Voir ce carnet Colab pour plus de détails.
Zdisket a fait un outil appelé TensorVox pour configurer un environnement TTS sur Windows et a inclus un modèle TTS allemand formé par Monatis. Merci d'avoir partagé cela. Voyez-le en action sur YouTube.
Si vous aimez ma contribution vocale et que vous souhaitez soutenir mes efforts pour un avenir sur la technologie vocale OpenSource, vous pouvez me soutenir, si vous le souhaitez:
Je tiens à vous remercier aux gens formidables qui m'ont soutenu dans ce voyage avec de beaux mots, un soutien et un pouvoir de calcul: merci El-Tocoino, Eren Gölge, Gras64, Kris Gesling, Nmstoker, Otiele, Recodiac, Sanjaesc, Synesthesiam.
Un merci spécial à mon cher collègue, Sebastian Kraus, pour m'avoir soutenu avec des équipements d'enregistrement audio et pour être le cerveau créatif derrière la conception du logo et bien sûr au cher Dominik (@domcross) pour qu'il soit si proche à mes côtés dans ce voyage incroyable.
Sur ma chaîne YouTube Thorsten-Voice, vous pouvez trouver un didacticiel étape par étape (recettes de cuisine) sur la technologie vocale OpenSource. Si vous êtes intéressé, je serais heureux de vous accueillir en tant que nouvel abonné sur ma merveilleuse communauté YouTube.ts ** sur mon petit.
J'aime vraiment parler de l'importance d'un avenir à la technologie vocale opensource. Si vous souhaitez que je sois conférencier lors d'une conférence ou d'un événement, je suis heureux d'être contacté à l'aide du formulaire de contact du site Web Thorsten-Voice. Voir certaines de mes références de conférenciers sur le site Web Thorsten-Voice.