
دافع المشروع
ملاحظة شخصية
Thorsten صوتي مجموعات البيانات
Thorsten TTS-Models
قناة Thorsten-Voice YouTube
المحادثات العامة ومتحدث المؤتمر
يجب أن يتوفر صوت TTS مجانيًا للاستخدام ، العمل الألماني العالي الجودة ، لكل مشروع دون أي ترخيص يكافح.
أساهم بصوتي كشخص يؤمن بعالم يكون فيه جميع الناس متساوون. بغض النظر عن الجنس ، والتوجه الجنسي ، والدين ، ولون البشرة ، و geocoordinates لموقع الميلاد. عالم عالمي حيث يرحب الجميع بحرارة في أي مكان على هذا الكوكب ، ويتوفر المعرفة والتعليم المفتوحة والمجانية للجميع. ؟ ( Thorsten Müller )
من فضلك ضع في اعتبارك أنني لست موهبة صوتية احترافية . أنا مجرد رجل عادي يشارك صوته مع العالم.
لا تتردد في الاتصال بي على وسائل التواصل الاجتماعي؟
| منصة | وصلة |
|---|---|
| يوتيوب | Thorstenvoice على YouTube |
| Thorsten Müller على LinkedIn | |
| تغريد | Thorstenvoice على Twitter |
| luggingface | Thorstenvoice على Huggingface |
| Thorstenvoice على Instagram |
يتم سرد جميع مجموعات بيانات "Thorsten-Voice" الخاصة بي على Zenodo. يحظى Qoutation بتقدير كبير في حالة استخدامها في مشاريعك أو منتجاتك أو الأوراق.
| مجموعة البيانات | رابط doi |
|---|---|
| مجموعة بيانات Thorsten-Voice 2021.02 (محايدة) | |
| مجموعة بيانات Thorsten-Voice 2021.06 (عاطفية) | |
| مجموعة بيانات Thorsten-Voice 2022.10 (محايدة) | |
| Thorsten-Voice Dataset 2023.09 (Hessisch) |
@dataset{muller_2021_5525342,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.02},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {3.0},
doi = {10.5281/zenodo.5525342},
url = {https://doi.org/10.5281/zenodo.5525342}
}
كما هو موضح في وثيقة PDF (تطور مجموعة بيانات Thorsten) تتكون مجموعة البيانات هذه من ثلاث مراحل تسجيل.
إذا كنت ترغب في استخدام مجموعة فرعية لمجموعة البيانات ، فيمكنك معرفة الملفات التي تنتمي إلى مرحلة التسجيل في تسجيل ملف CSV جودة.
@dataset{muller_2021_5525023,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.06 emotional},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {2.0},
doi = {10.5281/zenodo.5525023},
url = {https://doi.org/10.5281/zenodo.5525023}
}
جميع التسجيلات العاطفية حيث سجلت بنفسي وحاولت أن أشعر ونطق تلك المشاعر حتى لو كان سياق العبارة لا يتطابق مع هذه المشاعر. مثال: أعلنت التسجيلات النائمة في النغمة التي أملكها قبل وقت قصير من النوم.
استمع إلى بعض التسجيلات الصوتية من مجموعة البيانات هذه هنا.
@dataset{muller_2022_7265581,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2022.10},
month = nov,
year = 2022,
publisher = {Zenodo},
version = {1.0},
doi = {10.5281/zenodo.7265581},
url = {https://doi.org/10.5281/zenodo.7265581}
}
@dataset{muller_2024_10511260,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2023.09 Hessisch},
month = jan,
year = 2024,
publisher = {Zenodo},
doi = {10.5281/zenodo.10511260},
url = {https://doi.org/10.5281/zenodo.10511260}
}
الاحتفال؟ 5 سنوات من مشروع Thorsten-Voice (Est. أكتوبر 2019) أصدرت جميع التسجيلات في Samplate (44 كيلو هرتز) في مجموعة بيانات الكل في واحد على Luggingface! من الواضح مرة أخرى في رخصة CC0!
@misc {thorsten_müller_2024,
author = { {Thorsten Müller} },
title = { TV-44kHz-Full (Revision ff427ec) },
year = 2024,
url = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
doi = { 10.57967/hf/3290 },
publisher = { Hugging Face }
}
استنادًا إلى مجموعات البيانات الصوتية OpenSource هذه ، تم تدريب عدة نماذج TTS (النص إلى الكلام) باستخدام تقنية التعلم الآلي.
هناك العديد من النماذج الألمانية المتاحة المدربة وتستخدمها المشاريع Coqui AI و Piper TTS ومساعد المنزل . يمكنك العثور على مزيد من المعلومات حول كيفية استخدامها وعينات الصوت ودروس الفيديو على موقع Project Thorsten-Voice.
استمع إلى عينات الصوت والتثبيت / تعليمات الاستخدام هنا (؟؟):
بالإضافة إلى ذلك ، استخدم Silero و Monatis و Zdisket مجموعات البيانات الصوتية الخاصة بي للتدريب على النماذج أيضًا. يمكن العثور على المزيد من العينات والتفاصيل على عينات صوت Silero Thorsten-Voice. انظر دفتر كولاب هذا لمزيد من التفاصيل.
قام Zdisket بعمل أداة تسمى Tensorvox لإعداد بيئة TTS على Windows وتضمنت نموذج TTS الألماني المدرب بواسطة Monatis. شكرا لتقاسم ذلك. أراها في العمل على YouTube.
إذا كنت تحب مساهمتي الصوتية وترغب في دعم جهدي لمستقبل OpenSource Voice Technology ، فيمكنك دعمني ، إذا أردت:
أريد أن أقول شكراً لأشخاص عظماء دعوني في هذه الرحلة بكلمات لطيفة ودعم وحساب القوة: شكرًا El-Tocino ، Eren Gölge ، Gras64 ، Kris Gesling ، NMStoker ، Othilee ، Repodiac ، Sanjaesc ، Synesthesiam.
شكر خاص لزميلي العزيز ، سيباستيان كراوس ، ودعمه لي مع معدات التسجيل الصوتي ولكون العقل المدبر الإبداعي وراء تصميم الشعار وبالطبع العزيزة دومينيك (@بودوروس) لكونه قريب جدا من جانبي في هذه الرحلة المذهلة.
على قناة YouTube الخاصة بـ Thorsten-Voice ، يمكنك العثور على برنامج تعليمي خطوة بخطوة (وصفات الطهي) حول تقنية صوت OpenSource. إذا كنت مهتمًا ، سأكون سعيدًا بالترحيب بك كمشترك جديد في مجتمع YouTube الرائع.
أحب حقًا التحدث عن أهمية مستقبل OpenSource Voice Technology. إذا كنت ترغب في أن أكون متحدثًا في مؤتمر أو حدث ، يسعدني الاتصال به باستخدام نموذج الاتصال على موقع Thorsten-Voice. شاهد بعض مراجع مكبر الصوت على موقع Thorsten-Voice.