Download Thorsten Voice - Unduh Kode Sumber Thorsten Voice

Thorsten Voice

Kode Sumber AI

1.0.0

Unduh

Logo Thorsten-Voice

Motivasi proyek
Catatan pribadi
Dataset Suara Thorsten
- Dataset Thorsten-Voice 2021.02 (netral)
- Dataset Thorsten-Voice 2021.06 (Emosional)
- Dataset Thorsten-Voice 2022.10 (netral)
- Dataset Thorsten-Voice 2023.09 (Hessisch)
- Dataset Thorsten-Voice Full 44kHz
Thorsten TTS-Models
Saluran YouTube Thorsten-Voice
Pembicaraan Publik & Pembicara Konferensi

Motivasi untuk Proyek Voice Thorsten

Suara TTS Jerman yang bebas digunakan, bekerja offline , berkualitas tinggi harus tersedia untuk setiap proyek tanpa lisensi yang berjuang.

Kata -kata pribadi oleh Thorsten Müller

Saya menyumbangkan suara saya sebagai orang yang percaya pada dunia di mana semua orang setara. Tidak peduli gender, orientasi seksual, agama, warna kulit dan geocoordinate lokasi kelahiran. Dunia global di mana semua orang disambut dengan hangat di tempat mana pun di planet ini dan pengetahuan dan pendidikan terbuka dan gratis tersedia untuk semua orang. ? ( Thorsten Müller )

Harap diingat, bahwa saya bukan bakat suara profesional . Saya hanya pria normal yang berbagi suaranya dengan dunia.

Media sosial

Jangan ragu untuk menghubungi saya di media sosial?

Platform	Link
YouTube	Thorstenvoice di YouTube
LinkedIn	Thorsten Müller di LinkedIn
Twitter	Thorstenvoice di Twitter
Huggingface	Thorstenvoice di Huggingface
Instagram	Thorstenvoice di Instagram

Dataoing suara

Semua dataset "Thorsten-Voice" saya terdaftar dan dapat diunduh di Zenodo. Qoutation sangat dihargai jika Anda menggunakannya dalam proyek, produk, atau makalah Anda.

Dataset	Tautan doi
Dataset Thorsten-Voice 2021.02 (netral)
Dataset Thorsten-Voice 2021.06 (Emosional)
Dataset Thorsten-Voice 2022.10 (netral)
Dataset Thorsten-Voice 2023.09 (Hessisch)

Dataset Thorsten-Voice 2021.02 (netral)

 @dataset{muller_2021_5525342,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.02},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {3.0},
  doi          = {10.5281/zenodo.5525342},
  url          = {https://doi.org/10.5281/zenodo.5525342}
}

Ringkasan dataset

Direkam oleh Thorsten Müller
Dioptimalkan oleh Dominik Kreutz
File dan Struktur Direktori LJSPEECH
22.668 frasa yang direkam ( file WAV )
Lebih dari 23 jam audio murni
Samplerate 22.050Hz
Mono
Dinormalisasi ke -24dB
Panjang frasa (min / rata -rata / maks): 2/52/180 chars
Tidak ada keheningan saat awal/akhir
Rata -rata chars lisan per detik: 14
Kalimat dengan tanda tanya: 2.780
Kalimat dengan tanda seru: 1.840

Evolusi dataset

Seperti yang dijelaskan dalam dokumen PDF (Evolusi Dataset Thorsten) Dataset ini terdiri dari tiga fase perekaman.

Fase 1 : Direkam dengan mikrofon USB murah ( kualitas rendah )
Fase 2 : Direkam dengan mikrofon yang baik ( kualitas bagus )
Fase 3 : Direkam dengan mikrofon bagus yang sama tetapi frasa yang lebih panjang (> 100 chars) ( kualitas bagus )

Jika Anda ingin menggunakan subset dataset, Anda dapat melihat file mana yang termasuk dalam fase perekaman dalam file CSV yang berkualitas.

Dataset Thorsten-Voice 2021.06 (Emosional)

 @dataset{muller_2021_5525023,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.06 emotional},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {2.0},
  doi          = {10.5281/zenodo.5525023},
  url          = {https://doi.org/10.5281/zenodo.5525023}
}

Semua rekaman emosional di mana direkam oleh diri saya dan saya mencoba merasakan dan mengucapkan emosi itu bahkan jika konteks frasa tidak cocok dengan emosi itu. Contoh: Saya mengucapkan rekaman mengantuk dengan nada yang saya miliki sesaat sebelum tertidur.

Ringkasan dataset

Direkam oleh Thorsten Müller
Dioptimalkan oleh Dominik Kreutz
300 kalimat * 8 emosi = 2.400 Rekaman
Mono
Samplerate 22.050Hz
Dinormalisasi ke -24dB
Tidak ada keheningan saat awal/akhir
Panjang Kalimat: 59 - 148 Chars

Dataset Thorsten-Voice 2022.10 (netral)

Dengarkan beberapa rekaman audio dari dataset ini di sini.

 @dataset{muller_2022_7265581,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2022.10},
  month        = nov,
  year         = 2022,
  publisher    = {Zenodo},
  version      = {1.0},
  doi          = {10.5281/zenodo.7265581},
  url          = {https://doi.org/10.5281/zenodo.7265581}
}

Dataset Thorsten-Voice 2023.09 (Hessisch)

 @dataset{muller_2024_10511260,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2023.09 Hessisch},
  month        = jan,
  year         = 2024,
  publisher    = {Zenodo},
  doi          = {10.5281/zenodo.10511260},
  url          = {https://doi.org/10.5281/zenodo.10511260}
}

Dataset Thorsten-Voice Full 44kHz

Merayakan? 5 tahun Proyek Voice Thorsten (Est. Oktober 2019) Saya merilis semua rekaman dalam sampel penuh (44kHz) dalam dataset all-in-one di? Huggingface! Jelas sekali lagi dalam lisensi CC0!

https://huggingface.co/datasets/thorsten-voice/tv-44khz-full

 @misc {thorsten_müller_2024,
    author       = { {Thorsten Müller} },
    title        = { TV-44kHz-Full (Revision ff427ec) },
    year         = 2024,
    url          = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
    doi          = { 10.57967/hf/3290 },
    publisher    = { Hugging Face }
}

Model TTS

Berdasarkan dataset suara openSource ini beberapa model TTS (teks ke pidato) telah dilatih menggunakan teknologi pembelajaran AI / mesin.

Ada beberapa model Jerman yang tersedia dilatih dan digunakan oleh proyek Coqui AI , Piper TTS dan Asisten Rumah . Anda dapat menemukan informasi lebih lanjut tentang cara menggunakannya, sampel audio dan tutorial video di situs web Proyek Voice Thorsten.

Dengarkan sampel audio dan instruksi pemasangan / penggunaan di sini (??):

Tts netral
TT emosional
Hessisches tts
Asisten smarthome / rumah

Selain itu Silero, Monatis dan Zdisket menggunakan set data suara saya untuk pelatihan model juga. Lebih banyak sampel dan detail dapat ditemukan pada sampel audio Silero Thorsten-Voice. Lihat Colab Notebook ini untuk lebih jelasnya.

Zdisket membuat alat yang disebut Tensorvox untuk menyiapkan lingkungan TTS di Windows dan termasuk model TTS Jerman yang dilatih oleh Monatis. Terima kasih telah berbagi itu. Lihat beraksi di YouTube.

Dukungan & Terima kasih

Jika Anda menyukai kontribusi suara saya dan ingin mendukung upaya saya untuk masa depan teknologi suara OpenSource, Anda dapat mendukung saya, jika Anda suka:

Berlangganan dan bagikan saluran YouTube Thorsten-Voice saya dan ikuti saya di profil media sosial saya
Beli saya teh menggunakan sponsor ko-fi atau github

Saya ingin mengucapkan terima kasih kepada orang-orang hebat yang mendukung saya dalam perjalanan ini dengan kata-kata yang bagus, dukungan dan menghitung kekuatan: Terima kasih El-Tocino, Eren Gölge, Gras64, Kris Gesling, NMSTOKER, OTHIELE, REPODIAC, SANJAESC, SYNESTHESIAM.

Terima kasih khusus kepada kolega saya yang tersayang, Sebastian Kraus, karena telah mendukung saya dengan peralatan rekaman audio dan karena menjadi dalang kreatif di balik desain logo dan tentu saja ke Dominik (@domcross) yang tersayang karena dia begitu dekat dengan sisi saya dalam perjalanan yang luar biasa ini.

Saluran YouTube "Thorsten-Voice"

Pada saluran YouTube Thorsten-Voice saya, Anda dapat menemukan tutorial langkah demi langkah (resep memasak) tentang teknologi suara OpenSource. Jika Anda tertarik, saya akan dengan senang hati menyambut Anda sebagai pelanggan baru di komunitas youtube saya yang indah.ts ** di kecil saya.

Pembicara Konferensi

Saya sangat suka berbicara tentang pentingnya masa depan teknologi suara opensource. Jika Anda ingin saya menjadi pembicara di konferensi atau acara, saya akan dengan senang hati dihubungi menggunakan formulir kontak situs web Thorsten-Voice. Lihat beberapa referensi pembicara saya di situs web Thorsten-Voice.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-08-20
ukuran 7.81MB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
GLM 4 Voice

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
flutter_voice_friend

2024-11-01
Retrieval based Voice Conversion WebUI

2024-11-01
Antarmuka SMS tak terbatas GOOGLE VOICE

2009-11-07

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua