Téléchargement Thorsten Voice - Téléchargement du code source Thorsten Voice

Thorsten Voice

Code Source AI

1.0.0

Télécharger

Logo Thorsten-Voice

Motivation du projet
Note personnelle
Ensembles de données vocales Thorsten
- DataSten Datasten DataSet 2021.02 (neutre) (Neutre)
- L'ensemble de données Thorsten-Voice 2021.06 (émotionnel)
- DataSten Datasten DataSt 222.10 (neutre)
- L'ensemble de données Thorsten-Voice 2023.09 (Hessisch)
- Ensemble de données Thorsten-Voice Full 44KHz
Thorsten tts modéliques
Channe YouTube Thorsten-Voice
Conférencier public et conférencier

Motivation pour le projet Thorsten-Voice

Une voix TTS allemande gratuite et hors ligne et hors ligne devrait être disponible pour chaque projet sans aucune licence en difficulté.

Mots personnels de Thorsten Müller

Je contribue ma voix en tant que personne croyant en un monde où tous sont égaux. Peu importe le sexe, l'orientation sexuelle, la religion, la couleur de la peau et les géocoordonnées du lieu de naissance. Un monde mondial où tout le monde est chaleureusement accueilli sur n'importe quel endroit sur cette planète et les connaissances et l'éducation ouvertes et gratuites sont disponibles pour tous. ? ( Thorsten Müller )

Veuillez garder à l'esprit que je ne suis pas un talent de voix professionnelle . Je suis juste un gars normal partageant sa voix avec le monde.

Réseaux sociaux

N'hésitez pas à me contacter sur les réseaux sociaux ?.

Plate-forme	Lien
Youtube	Thorstenvoice sur youtube
Liendin	Thorsten Müller sur Linkedin
Gazouillement	Thorstenvoice sur Twitter
Étreinte	Thorstenvoice sur Hugging Face
Instagram	Thorstenvoice sur Instagram

Datasets vocaux

Tous mes ensembles de données "Thorsten-Voice" sont répertoriés et téléchargeables sur Zenodo. Qoutation est très appréciée au cas où vous les utiliseriez dans vos projets, produits ou papiers.

Ensemble de données	Lien doi
DataSten Datasten DataSet 2021.02 (neutre) (Neutre)
L'ensemble de données Thorsten-Voice 2021.06 (émotionnel)
DataSten Datasten DataSt 222.10 (neutre)
L'ensemble de données Thorsten-Voice 2023.09 (Hessisch)

DataSten Datasten DataSet 2021.02 (neutre) (Neutre)

 @dataset{muller_2021_5525342,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.02},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {3.0},
  doi          = {10.5281/zenodo.5525342},
  url          = {https://doi.org/10.5281/zenodo.5525342}
}

Résumé de l'ensemble de données

Enregistré par Thorsten Müller
Optimisé par Dominik Kreutz
Fichier LJSpeech et structure du répertoire
22.668 Phrases enregistrées ( fichiers WAV )
Plus de 23 heures d'audio pur
Samplérate 22.050Hz
Mono
Normalisé à -24 dB
Longueur de phrase (min / avg / max): 2/52/180 Chars
Pas de silence au début / fin
AVG parlé par seconde: 14
Phrases avec point d'interrogation: 2.780
Phrases avec exclamation: 1.840

Évolution de l'ensemble de données

Comme décrit dans le document PDF (Evolution of Thorsten DataSet), cet ensemble de données se compose de trois phases d'enregistrement.

Phase 1 : Enregistré avec un microphone USB bon marché ( basse qualité )
Phase 2 : Enregistré avec un bon microphone ( bonne qualité )
Phase 3 : Enregistré avec le même bon microphone mais des phrases plus longues (> 100 caractères) ( bonne qualité )

Si vous souhaitez utiliser un sous-ensemble d'ensemble de données, vous pouvez voir quels fichiers appartiennent à quelle phase d'enregistrement dans le fichier CSV de qualité d'enregistrement.

L'ensemble de données Thorsten-Voice 2021.06 (émotionnel)

 @dataset{muller_2021_5525023,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.06 emotional},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {2.0},
  doi          = {10.5281/zenodo.5525023},
  url          = {https://doi.org/10.5281/zenodo.5525023}
}

Tous les enregistrements émotionnels où sont enregistrés par moi-même et j'ai essayé de ressentir et de prononcer cette émotion même si le contexte de la phrase ne correspond pas à cette émotion. Exemple: J'ai prononcé les enregistrements endormis dans le ton que j'ai peu de temps avant de m'endormir.

Résumé de l'ensemble de données

Enregistré par Thorsten Müller
Optimisé par Dominik Kreutz
300 phrases * 8 émotions = 2,400 enregistrements
Mono
Samplérate 22.050Hz
Normalisé à -24 dB
Pas de silence au début / fin
Longueur de phrase: 59 - 148 Chars

DataSten Datasten DataSt 222.10 (neutre)

Écoutez quelques enregistrements audio de cet ensemble de données ici.

 @dataset{muller_2022_7265581,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2022.10},
  month        = nov,
  year         = 2022,
  publisher    = {Zenodo},
  version      = {1.0},
  doi          = {10.5281/zenodo.7265581},
  url          = {https://doi.org/10.5281/zenodo.7265581}
}

L'ensemble de données Thorsten-Voice 2023.09 (Hessisch)

 @dataset{muller_2024_10511260,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2023.09 Hessisch},
  month        = jan,
  year         = 2024,
  publisher    = {Zenodo},
  doi          = {10.5281/zenodo.10511260},
  url          = {https://doi.org/10.5281/zenodo.10511260}
}

Ensemble de données Thorsten-Voice Full 44KHz

Célébrer? 5 ans de projet Thorsten-Voice (est. Octobre 2019) J'ai publié tous les enregistrements en échantillonnage complet (44 kHz) dans un ensemble de données tout-en-un sur? HuggingFace! Évidemment encore une fois dans la licence CC0!

https://huggingface.co/datasets/thorsten-voice/tv-44khz-full

 @misc {thorsten_müller_2024,
    author       = { {Thorsten Müller} },
    title        = { TV-44kHz-Full (Revision ff427ec) },
    year         = 2024,
    url          = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
    doi          = { 10.57967/hf/3290 },
    publisher    = { Hugging Face }
}

Modèles TTS

Sur la base de ces ensembles de données vocales OpenSource, plusieurs modèles TTS (texte à la parole) ont été formés à l'aide d'une technologie d'apprentissage AI / machine.

Il existe plusieurs modèles allemands disponibles formés et utilisés par les projets Coqui AI , Piper TTS et l'assistant à domicile . Vous pouvez trouver plus d'informations sur la façon de les utiliser, des échantillons audio et des tutoriels vidéo sur le site Web du projet Thorsten-Voice.

Écoutez les échantillons audio et les instructions d'installation / d'utilisation ici (??):

TTS neutre
TTS émotionnels
HESSISCHES TTS
Smarthome / Assistant à domicile

De plus, SILERO, Monatis et Zdisket ont également utilisé mes ensembles de données vocales pour la formation de modèle. Plus d'échantillons et de détails peuvent être trouvés sur des échantillons audio SILERO THORSTEN-VOICE. Voir ce carnet Colab pour plus de détails.

Zdisket a fait un outil appelé TensorVox pour configurer un environnement TTS sur Windows et a inclus un modèle TTS allemand formé par Monatis. Merci d'avoir partagé cela. Voyez-le en action sur YouTube.

Support et merci

Si vous aimez ma contribution vocale et que vous souhaitez soutenir mes efforts pour un avenir sur la technologie vocale OpenSource, vous pouvez me soutenir, si vous le souhaitez:

Abonnez-vous et partagez ma chaîne YouTube Thorsten-Voice et suivez-moi sur mes profils de médias sociaux
Achetez-moi un thé à l'aide de sponsor Ko-Fi ou GitHub

Je tiens à vous remercier aux gens formidables qui m'ont soutenu dans ce voyage avec de beaux mots, un soutien et un pouvoir de calcul: merci El-Tocoino, Eren Gölge, Gras64, Kris Gesling, Nmstoker, Otiele, Recodiac, Sanjaesc, Synesthesiam.

Un merci spécial à mon cher collègue, Sebastian Kraus, pour m'avoir soutenu avec des équipements d'enregistrement audio et pour être le cerveau créatif derrière la conception du logo et bien sûr au cher Dominik (@domcross) pour qu'il soit si proche à mes côtés dans ce voyage incroyable.

Channel YouTube "Thorsten-Voice"

Sur ma chaîne YouTube Thorsten-Voice, vous pouvez trouver un didacticiel étape par étape (recettes de cuisine) sur la technologie vocale OpenSource. Si vous êtes intéressé, je serais heureux de vous accueillir en tant que nouvel abonné sur ma merveilleuse communauté YouTube.ts ** sur mon petit.

Conférencier

J'aime vraiment parler de l'importance d'un avenir à la technologie vocale opensource. Si vous souhaitez que je sois conférencier lors d'une conférence ou d'un événement, je suis heureux d'être contacté à l'aide du formulaire de contact du site Web Thorsten-Voice. Voir certaines de mes références de conférenciers sur le site Web Thorsten-Voice.

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-08-20
taille 7.81MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
GLM 4 Voice

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
flutter_voice_friend

2024-11-01
Retrieval based Voice Conversion WebUI

2024-11-01
Interface SMS illimitée GOOGLE VOICE

2009-11-07

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout