
Motivasi proyek
Catatan pribadi
Dataset Suara Thorsten
Thorsten TTS-Models
Saluran YouTube Thorsten-Voice
Pembicaraan Publik & Pembicara Konferensi
Suara TTS Jerman yang bebas digunakan, bekerja offline , berkualitas tinggi harus tersedia untuk setiap proyek tanpa lisensi yang berjuang.
Saya menyumbangkan suara saya sebagai orang yang percaya pada dunia di mana semua orang setara. Tidak peduli gender, orientasi seksual, agama, warna kulit dan geocoordinate lokasi kelahiran. Dunia global di mana semua orang disambut dengan hangat di tempat mana pun di planet ini dan pengetahuan dan pendidikan terbuka dan gratis tersedia untuk semua orang. ? ( Thorsten Müller )
Harap diingat, bahwa saya bukan bakat suara profesional . Saya hanya pria normal yang berbagi suaranya dengan dunia.
Jangan ragu untuk menghubungi saya di media sosial?
| Platform | Link |
|---|---|
| YouTube | Thorstenvoice di YouTube |
| Thorsten Müller di LinkedIn | |
| Thorstenvoice di Twitter | |
| Huggingface | Thorstenvoice di Huggingface |
| Thorstenvoice di Instagram |
Semua dataset "Thorsten-Voice" saya terdaftar dan dapat diunduh di Zenodo. Qoutation sangat dihargai jika Anda menggunakannya dalam proyek, produk, atau makalah Anda.
| Dataset | Tautan doi |
|---|---|
| Dataset Thorsten-Voice 2021.02 (netral) | |
| Dataset Thorsten-Voice 2021.06 (Emosional) | |
| Dataset Thorsten-Voice 2022.10 (netral) | |
| Dataset Thorsten-Voice 2023.09 (Hessisch) |
@dataset{muller_2021_5525342,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.02},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {3.0},
doi = {10.5281/zenodo.5525342},
url = {https://doi.org/10.5281/zenodo.5525342}
}
Seperti yang dijelaskan dalam dokumen PDF (Evolusi Dataset Thorsten) Dataset ini terdiri dari tiga fase perekaman.
Jika Anda ingin menggunakan subset dataset, Anda dapat melihat file mana yang termasuk dalam fase perekaman dalam file CSV yang berkualitas.
@dataset{muller_2021_5525023,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.06 emotional},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {2.0},
doi = {10.5281/zenodo.5525023},
url = {https://doi.org/10.5281/zenodo.5525023}
}
Semua rekaman emosional di mana direkam oleh diri saya dan saya mencoba merasakan dan mengucapkan emosi itu bahkan jika konteks frasa tidak cocok dengan emosi itu. Contoh: Saya mengucapkan rekaman mengantuk dengan nada yang saya miliki sesaat sebelum tertidur.
Dengarkan beberapa rekaman audio dari dataset ini di sini.
@dataset{muller_2022_7265581,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2022.10},
month = nov,
year = 2022,
publisher = {Zenodo},
version = {1.0},
doi = {10.5281/zenodo.7265581},
url = {https://doi.org/10.5281/zenodo.7265581}
}
@dataset{muller_2024_10511260,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2023.09 Hessisch},
month = jan,
year = 2024,
publisher = {Zenodo},
doi = {10.5281/zenodo.10511260},
url = {https://doi.org/10.5281/zenodo.10511260}
}
Merayakan? 5 tahun Proyek Voice Thorsten (Est. Oktober 2019) Saya merilis semua rekaman dalam sampel penuh (44kHz) dalam dataset all-in-one di? Huggingface! Jelas sekali lagi dalam lisensi CC0!
@misc {thorsten_müller_2024,
author = { {Thorsten Müller} },
title = { TV-44kHz-Full (Revision ff427ec) },
year = 2024,
url = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
doi = { 10.57967/hf/3290 },
publisher = { Hugging Face }
}
Berdasarkan dataset suara openSource ini beberapa model TTS (teks ke pidato) telah dilatih menggunakan teknologi pembelajaran AI / mesin.
Ada beberapa model Jerman yang tersedia dilatih dan digunakan oleh proyek Coqui AI , Piper TTS dan Asisten Rumah . Anda dapat menemukan informasi lebih lanjut tentang cara menggunakannya, sampel audio dan tutorial video di situs web Proyek Voice Thorsten.
Dengarkan sampel audio dan instruksi pemasangan / penggunaan di sini (??):
Selain itu Silero, Monatis dan Zdisket menggunakan set data suara saya untuk pelatihan model juga. Lebih banyak sampel dan detail dapat ditemukan pada sampel audio Silero Thorsten-Voice. Lihat Colab Notebook ini untuk lebih jelasnya.
Zdisket membuat alat yang disebut Tensorvox untuk menyiapkan lingkungan TTS di Windows dan termasuk model TTS Jerman yang dilatih oleh Monatis. Terima kasih telah berbagi itu. Lihat beraksi di YouTube.
Jika Anda menyukai kontribusi suara saya dan ingin mendukung upaya saya untuk masa depan teknologi suara OpenSource, Anda dapat mendukung saya, jika Anda suka:
Saya ingin mengucapkan terima kasih kepada orang-orang hebat yang mendukung saya dalam perjalanan ini dengan kata-kata yang bagus, dukungan dan menghitung kekuatan: Terima kasih El-Tocino, Eren Gölge, Gras64, Kris Gesling, NMSTOKER, OTHIELE, REPODIAC, SANJAESC, SYNESTHESIAM.
Terima kasih khusus kepada kolega saya yang tersayang, Sebastian Kraus, karena telah mendukung saya dengan peralatan rekaman audio dan karena menjadi dalang kreatif di balik desain logo dan tentu saja ke Dominik (@domcross) yang tersayang karena dia begitu dekat dengan sisi saya dalam perjalanan yang luar biasa ini.
Pada saluran YouTube Thorsten-Voice saya, Anda dapat menemukan tutorial langkah demi langkah (resep memasak) tentang teknologi suara OpenSource. Jika Anda tertarik, saya akan dengan senang hati menyambut Anda sebagai pelanggan baru di komunitas youtube saya yang indah.ts ** di kecil saya.
Saya sangat suka berbicara tentang pentingnya masa depan teknologi suara opensource. Jika Anda ingin saya menjadi pembicara di konferensi atau acara, saya akan dengan senang hati dihubungi menggunakan formulir kontak situs web Thorsten-Voice. Lihat beberapa referensi pembicara saya di situs web Thorsten-Voice.