Thorsten Voice Download - تنزيل رمز المصدر Thorsten Voice

Thorsten Voice

كود الذكاء الاصطناعي

1.0.0

تنزيل

شعار Thorsten-Voice

دافع المشروع
ملاحظة شخصية
Thorsten صوتي مجموعات البيانات
- مجموعة بيانات Thorsten-Voice 2021.02 (محايدة)
- مجموعة بيانات Thorsten-Voice 2021.06 (عاطفية)
- مجموعة بيانات Thorsten-Voice 2022.10 (محايدة)
- Thorsten-Voice Dataset 2023.09 (Hessisch)
- مجموعة بيانات Thorsten-Voice كاملة 44 كيلو هرتز
Thorsten TTS-Models
قناة Thorsten-Voice YouTube
المحادثات العامة ومتحدث المؤتمر

دافع لمشروع ثورستن-فوز

يجب أن يتوفر صوت TTS مجانيًا للاستخدام ، العمل الألماني العالي الجودة ، لكل مشروع دون أي ترخيص يكافح.

الكلمات الشخصية بقلم ثورستين مولر

أساهم بصوتي كشخص يؤمن بعالم يكون فيه جميع الناس متساوون. بغض النظر عن الجنس ، والتوجه الجنسي ، والدين ، ولون البشرة ، و geocoordinates لموقع الميلاد. عالم عالمي حيث يرحب الجميع بحرارة في أي مكان على هذا الكوكب ، ويتوفر المعرفة والتعليم المفتوحة والمجانية للجميع. ؟ ( Thorsten Müller )

من فضلك ضع في اعتبارك أنني لست موهبة صوتية احترافية . أنا مجرد رجل عادي يشارك صوته مع العالم.

وسائل التواصل الاجتماعي

لا تتردد في الاتصال بي على وسائل التواصل الاجتماعي؟

منصة	وصلة
يوتيوب	Thorstenvoice على YouTube
LinkedIn	Thorsten Müller على LinkedIn
تغريد	Thorstenvoice على Twitter
luggingface	Thorstenvoice على Huggingface
Instagram	Thorstenvoice على Instagram

مقالات صوتية

يتم سرد جميع مجموعات بيانات "Thorsten-Voice" الخاصة بي على Zenodo. يحظى Qoutation بتقدير كبير في حالة استخدامها في مشاريعك أو منتجاتك أو الأوراق.

مجموعة البيانات	رابط doi
مجموعة بيانات Thorsten-Voice 2021.02 (محايدة)
مجموعة بيانات Thorsten-Voice 2021.06 (عاطفية)
مجموعة بيانات Thorsten-Voice 2022.10 (محايدة)
Thorsten-Voice Dataset 2023.09 (Hessisch)

مجموعة بيانات Thorsten-Voice 2021.02 (محايدة)

 @dataset{muller_2021_5525342,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.02},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {3.0},
  doi          = {10.5281/zenodo.5525342},
  url          = {https://doi.org/10.5281/zenodo.5525342}
}

ملخص مجموعة البيانات

سجله ثورستين مولر
تم تحسينه من قبل دومينيك كريوتز
ملف LJSPEEDE وهيكل الدليل
22.668 عبارات مسجلة ( ملفات WAV )
أكثر من 23 ساعة من الصوت الخالص
أخذ عينات من 22.050 هرتز
كثرة الوحيدات
تطبيع إلى -24 ديسيبل
طول العبارة (دقيقة / متوسط / كحد أقصى): 2/52/180 chars
لا صمت في البداية/النهاية
AVG المنطوق Chars في الثانية: 14
جمل مع علامة الاستفهام: 2.780
جمل مع علامة تعجب: 1.840

تطور مجموعة البيانات

كما هو موضح في وثيقة PDF (تطور مجموعة بيانات Thorsten) تتكون مجموعة البيانات هذه من ثلاث مراحل تسجيل.

المرحلة الأولى : مسجلة بميكروفون USB رخيص ( جودة منخفضة )
المرحلة 2 : مسجلة بميكروفون جيد ( نوعية جيدة )
المرحلة 3 : مسجلة بنفس الميكروفون الجيد ولكن عبارات أطول (> 100 شار) ( جودة جيدة )

إذا كنت ترغب في استخدام مجموعة فرعية لمجموعة البيانات ، فيمكنك معرفة الملفات التي تنتمي إلى مرحلة التسجيل في تسجيل ملف CSV جودة.

مجموعة بيانات Thorsten-Voice 2021.06 (عاطفية)

 @dataset{muller_2021_5525023,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.06 emotional},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {2.0},
  doi          = {10.5281/zenodo.5525023},
  url          = {https://doi.org/10.5281/zenodo.5525023}
}

جميع التسجيلات العاطفية حيث سجلت بنفسي وحاولت أن أشعر ونطق تلك المشاعر حتى لو كان سياق العبارة لا يتطابق مع هذه المشاعر. مثال: أعلنت التسجيلات النائمة في النغمة التي أملكها قبل وقت قصير من النوم.

ملخص مجموعة البيانات

سجله ثورستين مولر
تم تحسينه من قبل دومينيك كريوتز
300 جملة * 8 مشاعر = 2.400 تسجيلات
كثرة الوحيدات
أخذ عينات من 22.050 هرتز
تطبيع إلى -24 ديسيبل
لا صمت في البداية/النهاية
طول الجملة: 59 - 148 chars

مجموعة بيانات Thorsten-Voice 2022.10 (محايدة)

استمع إلى بعض التسجيلات الصوتية من مجموعة البيانات هذه هنا.

 @dataset{muller_2022_7265581,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2022.10},
  month        = nov,
  year         = 2022,
  publisher    = {Zenodo},
  version      = {1.0},
  doi          = {10.5281/zenodo.7265581},
  url          = {https://doi.org/10.5281/zenodo.7265581}
}

Thorsten-Voice Dataset 2023.09 (Hessisch)

 @dataset{muller_2024_10511260,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2023.09 Hessisch},
  month        = jan,
  year         = 2024,
  publisher    = {Zenodo},
  doi          = {10.5281/zenodo.10511260},
  url          = {https://doi.org/10.5281/zenodo.10511260}
}

مجموعة بيانات Thorsten-Voice كاملة 44 كيلو هرتز

الاحتفال؟ 5 سنوات من مشروع Thorsten-Voice (Est. أكتوبر 2019) أصدرت جميع التسجيلات في Samplate (44 كيلو هرتز) في مجموعة بيانات الكل في واحد على Luggingface! من الواضح مرة أخرى في رخصة CC0!

https://huggingface.co/Datasets/Thorsten-Voice/tv-44khz-full

 @misc {thorsten_müller_2024,
    author       = { {Thorsten Müller} },
    title        = { TV-44kHz-Full (Revision ff427ec) },
    year         = 2024,
    url          = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
    doi          = { 10.57967/hf/3290 },
    publisher    = { Hugging Face }
}

نماذج TTS

استنادًا إلى مجموعات البيانات الصوتية OpenSource هذه ، تم تدريب عدة نماذج TTS (النص إلى الكلام) باستخدام تقنية التعلم الآلي.

هناك العديد من النماذج الألمانية المتاحة المدربة وتستخدمها المشاريع Coqui AI و Piper TTS ومساعد المنزل . يمكنك العثور على مزيد من المعلومات حول كيفية استخدامها وعينات الصوت ودروس الفيديو على موقع Project Thorsten-Voice.

استمع إلى عينات الصوت والتثبيت / تعليمات الاستخدام هنا (؟؟):

TTS محايدة
TTS العاطفية
hessisches tts
سمرثوم / مساعد المنزل

بالإضافة إلى ذلك ، استخدم Silero و Monatis و Zdisket مجموعات البيانات الصوتية الخاصة بي للتدريب على النماذج أيضًا. يمكن العثور على المزيد من العينات والتفاصيل على عينات صوت Silero Thorsten-Voice. انظر دفتر كولاب هذا لمزيد من التفاصيل.

قام Zdisket بعمل أداة تسمى Tensorvox لإعداد بيئة TTS على Windows وتضمنت نموذج TTS الألماني المدرب بواسطة Monatis. شكرا لتقاسم ذلك. أراها في العمل على YouTube.

الدعم وشكر

إذا كنت تحب مساهمتي الصوتية وترغب في دعم جهدي لمستقبل OpenSource Voice Technology ، فيمكنك دعمني ، إذا أردت:

اشترك ومشاركة قناة YouTube Thorsten-Voice واتبعني في ملفات تعريف وسائل التواصل الاجتماعي الخاصة بي
اشتر لي شاي باستخدام Ko-Fi أو Github الراعي

أريد أن أقول شكراً لأشخاص عظماء دعوني في هذه الرحلة بكلمات لطيفة ودعم وحساب القوة: شكرًا El-Tocino ، Eren Gölge ، Gras64 ، Kris Gesling ، NMStoker ، Othilee ، Repodiac ، Sanjaesc ، Synesthesiam.

شكر خاص لزميلي العزيز ، سيباستيان كراوس ، ودعمه لي مع معدات التسجيل الصوتي ولكون العقل المدبر الإبداعي وراء تصميم الشعار وبالطبع العزيزة دومينيك (@بودوروس) لكونه قريب جدا من جانبي في هذه الرحلة المذهلة.

"Thorsten-Voice" قناة YouTube

على قناة YouTube الخاصة بـ Thorsten-Voice ، يمكنك العثور على برنامج تعليمي خطوة بخطوة (وصفات الطهي) حول تقنية صوت OpenSource. إذا كنت مهتمًا ، سأكون سعيدًا بالترحيب بك كمشترك جديد في مجتمع YouTube الرائع.

متحدث المؤتمر

أحب حقًا التحدث عن أهمية مستقبل OpenSource Voice Technology. إذا كنت ترغب في أن أكون متحدثًا في مؤتمر أو حدث ، يسعدني الاتصال به باستخدام نموذج الاتصال على موقع Thorsten-Voice. شاهد بعض مراجع مكبر الصوت على موقع Thorsten-Voice.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-20
الحجم 7.81MB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
GLM 4 Voice

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
flutter_voice_friend

2024-11-01
Retrieval based Voice Conversion WebUI

2024-11-01
GOOGLE VOICE واجهة SMS غير محدودة

2009-11-07

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل