
Проект мотивация
Личная записка
Торстен голосовые наборы данных
Торстен TTS-модели
Торстен-голос канал YouTube
Публичные переговоры и спикер конференции
Бесплатный в автономном рабочем, высококачественный немецкий голос TTS должен быть доступен для каждого проекта без какой -либо лицензии.
Я вкладываю свой голос как человека, верующего в мир, где все люди равны. Независимо от пола, сексуальной ориентации, религии, цвета кожи и геокорординат места рождения. Глобальный мир, где все тепло приветствуют на любом месте на этой планете, а также открытые и бесплатные знания и образование, доступны всем. ? ( Торстен Мюллер )
Пожалуйста, имейте в виду, что я не профессиональный голосовой талант . Я просто нормальный парень, делящий свой голос с миром.
Не стесняйтесь связываться со мной в социальных сетях?
| Платформа | Связь |
|---|---|
| YouTube | Thorstenvoice на YouTube |
| Торстен Мюллер на LinkedIn | |
| Thorstenvoice в Твиттере | |
| Объятие | Thorstenvoice на Huggingface |
| Thorstenvoice в Instagram |
Все мои наборы данных "Thorsten-Voice" перечислены и загружаются на Zenodo. Qutation высоко ценится на случай, если вы используете их в своих проектах, продуктах или бумагах.
| Набор данных | Ссылка DOI |
|---|---|
| Набор данных Thorsten-Voice 2021.02 (нейтральный) | |
| Набор данных Thorsten-Voice 2021.06 (эмоциональный) | |
| Набор данных Thorsten-Voice 2022.10 (нейтральный) | |
| Набор данных Thorsten-Voice 2023.09 (Hessisch) |
@dataset{muller_2021_5525342,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.02},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {3.0},
doi = {10.5281/zenodo.5525342},
url = {https://doi.org/10.5281/zenodo.5525342}
}
Как описано в документе PDF (эволюция набора данных Thorsten). Этот набор данных состоит из трех этапов записи.
Если вы хотите использовать подмножество набора данных, вы можете увидеть, какие файлы принадлежат к какой фазе записи при записи качественного файла CSV.
@dataset{muller_2021_5525023,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2021.06 emotional},
month = sep,
year = 2021,
note = {{Please use it to make the world a better place for
whole humankind.}},
publisher = {Zenodo},
version = {2.0},
doi = {10.5281/zenodo.5525023},
url = {https://doi.org/10.5281/zenodo.5525023}
}
Все эмоциональные записи, в которых записаны я и я пытались почувствовать и произнести эту эмоцию, даже если фраза не соответствует этой эмоции. Пример: я произнесла сонные записи в тоне, который у меня есть незадолго до того, как заснуть.
Слушайте некоторые аудиозаписи из этого набора данных здесь.
@dataset{muller_2022_7265581,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2022.10},
month = nov,
year = 2022,
publisher = {Zenodo},
version = {1.0},
doi = {10.5281/zenodo.7265581},
url = {https://doi.org/10.5281/zenodo.7265581}
}
@dataset{muller_2024_10511260,
author = {Müller, Thorsten and
Kreutz, Dominik},
title = {Thorsten-Voice Dataset 2023.09 Hessisch},
month = jan,
year = 2024,
publisher = {Zenodo},
doi = {10.5281/zenodo.10511260},
url = {https://doi.org/10.5281/zenodo.10511260}
}
Празднование? 5 лет проекта Thorsten-Voice (Est. Oct. октябрь 2019 г.) Я выпустил все записи в полной выборке (44 кГц) в наборе данных в одном из них? Huggingface! Очевидно, снова в лицензии CC0!
@misc {thorsten_müller_2024,
author = { {Thorsten Müller} },
title = { TV-44kHz-Full (Revision ff427ec) },
year = 2024,
url = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
doi = { 10.57967/hf/3290 },
publisher = { Hugging Face }
}
Основываясь на этих наборах голосовых данных OpenSource несколько моделей TTS (текст к речи) были обучены с использованием технологии AI / машинного обучения.
Существует несколько немецких моделей, доступных, обученных и используемых проектами Coqui AI , Piper TTS и домашним помощником . Вы можете найти больше информации о том, как их использовать, образцы аудио и видеоуроки на веб-сайте проекта Thorsten-Voice.
Слушайте образы аудио и инструкции по установке / использованию здесь (??):
Кроме того, Silero, Monatis и Zdisket также использовали мои голосовые наборы данных для модельной подготовки. Больше образцов и деталей можно найти в образцах звука Силеро Торстен-голос. Смотрите этот ноутбук Colab для получения более подробной информации.
Zdisket сделал инструмент под названием Tensorvox для настройки среды TTS в Windows и включал немецкую модель TTS, обученную Monatis. Спасибо, что поделились этим. Смотрите в действии на YouTube.
Если вам нравится мой голосовой вклад и вы хотели бы поддержать мои усилия для будущего OpenSource Voice Technology, вы можете поддержать меня, если хотите:
Я хочу поблагодарить великих людей, которые поддержали меня в этом путешествии с хорошими словами, поддержкой и вычислительностью: спасибо Эль-Точино, Эрен Гёльге, Грас64, Крис Геслинг, NMStoker, Othiele, Repodiac, Sanjaesc, Synesthesiam.
Особая благодарность моему дорогому коллеге Себастьяну Краусу за поддержку меня с помощью аудиозаписного оборудования и за то, что он был творческим вдохновителем дизайна логотипа и, конечно, для дорогого Доминика (@Domcross), за то, что он был так близко рядом с моей стороной в этом удивительном путешествии.
На моем канале Thorsten-Voice YouTube вы можете найти пошаговое руководство (рецепты приготовления) по технологии Voice OpenSource. Если вам интересно, я бы рад приветствовать вас в качестве нового подписчика в моем замечательном сообществе YouTube.ts ** на моем маленьком.
Мне очень нравится говорить о важности будущего открытого голоса. Если вы хотите, чтобы я стал докладчиком на конференции или событии, я бы рад связаться, с помощью с ним с помощью контактной формы веб-сайта Thorsten-Voice. Смотрите некоторые из моих ссылок на оратор на веб-сайте Thorsten-Voice.