Thorsten Voice скачать - скачать исходный код Thorsten Voice

Thorsten Voice

AI Исходный код

1.0.0

Скачать

Логотип Торстена

Проект мотивация
Личная записка
Торстен голосовые наборы данных
- Набор данных Thorsten-Voice 2021.02 (нейтральный)
- Набор данных Thorsten-Voice 2021.06 (эмоциональный)
- Набор данных Thorsten-Voice 2022.10 (нейтральный)
- Набор данных Thorsten-Voice 2023.09 (Hessisch)
- Набор данных Thorsten-Voice полный 44 кГц
Торстен TTS-модели
Торстен-голос канал YouTube
Публичные переговоры и спикер конференции

Мотивация для проекта Thorsten-Voice

Бесплатный в автономном рабочем, высококачественный немецкий голос TTS должен быть доступен для каждого проекта без какой -либо лицензии.

Личные слова Торстена Мюллер

Я вкладываю свой голос как человека, верующего в мир, где все люди равны. Независимо от пола, сексуальной ориентации, религии, цвета кожи и геокорординат места рождения. Глобальный мир, где все тепло приветствуют на любом месте на этой планете, а также открытые и бесплатные знания и образование, доступны всем. ? ( Торстен Мюллер )

Пожалуйста, имейте в виду, что я не профессиональный голосовой талант . Я просто нормальный парень, делящий свой голос с миром.

Социальные сети

Не стесняйтесь связываться со мной в социальных сетях?

Платформа	Связь
YouTube	Thorstenvoice на YouTube
LinkedIn	Торстен Мюллер на LinkedIn
Twitter	Thorstenvoice в Твиттере
Объятие	Thorstenvoice на Huggingface
Instagram	Thorstenvoice в Instagram

Голосовые датазы

Все мои наборы данных "Thorsten-Voice" перечислены и загружаются на Zenodo. Qutation высоко ценится на случай, если вы используете их в своих проектах, продуктах или бумагах.

Набор данных	Ссылка DOI
Набор данных Thorsten-Voice 2021.02 (нейтральный)
Набор данных Thorsten-Voice 2021.06 (эмоциональный)
Набор данных Thorsten-Voice 2022.10 (нейтральный)
Набор данных Thorsten-Voice 2023.09 (Hessisch)

Набор данных Thorsten-Voice 2021.02 (нейтральный)

 @dataset{muller_2021_5525342,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.02},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {3.0},
  doi          = {10.5281/zenodo.5525342},
  url          = {https://doi.org/10.5281/zenodo.5525342}
}

Резюме набора данных

Записано Торстен Мюллер
Оптимизирован Доминик Кройц
Файл и структура каталогов LJSPEECH
22.668 Записанные фразы ( файлы WAV )
Более 23 часов чистого аудио
Пробороз 22.050 Гц
Мононуклеоз
Нормализован до -24 дБ
Длина фразы (мин / avg / max): 2/52/180 chars
Нет молчания в начале/окончании
Avg разговоры в секунду: 14
Приговоры с вопросом Марк: 2.780
Предложения с восклицательным знаком: 1,840

Эволюция набора данных

Как описано в документе PDF (эволюция набора данных Thorsten). Этот набор данных состоит из трех этапов записи.

Фаза 1 : Записано с дешевым USB -микрофоном ( низкое качество )
Фаза 2 : Записано с помощью хорошего микрофона ( хорошее качество )
Фаза 3 : Записано с тем же хорошим микрофоном, но более длинными фразами (> 100 Chars) ( хорошее качество )

Если вы хотите использовать подмножество набора данных, вы можете увидеть, какие файлы принадлежат к какой фазе записи при записи качественного файла CSV.

Набор данных Thorsten-Voice 2021.06 (эмоциональный)

 @dataset{muller_2021_5525023,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2021.06 emotional},
  month        = sep,
  year         = 2021,
  note         = {{Please use it to make the world a better place for 
                   whole humankind.}},
  publisher    = {Zenodo},
  version      = {2.0},
  doi          = {10.5281/zenodo.5525023},
  url          = {https://doi.org/10.5281/zenodo.5525023}
}

Все эмоциональные записи, в которых записаны я и я пытались почувствовать и произнести эту эмоцию, даже если фраза не соответствует этой эмоции. Пример: я произнесла сонные записи в тоне, который у меня есть незадолго до того, как заснуть.

Резюме набора данных

Записано Торстен Мюллер
Оптимизирован Доминик Кройц
300 предложений * 8 эмоций = 2,400 записи
Мононуклеоз
Пробороз 22.050 Гц
Нормализован до -24 дБ
Нет молчания в начале/окончании
Длина предложения: 59 - 148 Chars

Набор данных Thorsten-Voice 2022.10 (нейтральный)

Слушайте некоторые аудиозаписи из этого набора данных здесь.

 @dataset{muller_2022_7265581,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2022.10},
  month        = nov,
  year         = 2022,
  publisher    = {Zenodo},
  version      = {1.0},
  doi          = {10.5281/zenodo.7265581},
  url          = {https://doi.org/10.5281/zenodo.7265581}
}

Набор данных Thorsten-Voice 2023.09 (Hessisch)

 @dataset{muller_2024_10511260,
  author       = {Müller, Thorsten and
                  Kreutz, Dominik},
  title        = {Thorsten-Voice Dataset 2023.09 Hessisch},
  month        = jan,
  year         = 2024,
  publisher    = {Zenodo},
  doi          = {10.5281/zenodo.10511260},
  url          = {https://doi.org/10.5281/zenodo.10511260}
}

Набор данных Thorsten-Voice полный 44 кГц

Празднование? 5 лет проекта Thorsten-Voice (Est. Oct. октябрь 2019 г.) Я выпустил все записи в полной выборке (44 кГц) в наборе данных в одном из них? Huggingface! Очевидно, снова в лицензии CC0!

https://huggingface.co/datasets/thorsten-voice/tv-44khz-full

 @misc {thorsten_müller_2024,
    author       = { {Thorsten Müller} },
    title        = { TV-44kHz-Full (Revision ff427ec) },
    year         = 2024,
    url          = { https://huggingface.co/datasets/Thorsten-Voice/TV-44kHz-Full },
    doi          = { 10.57967/hf/3290 },
    publisher    = { Hugging Face }
}

TTS модели

Основываясь на этих наборах голосовых данных OpenSource несколько моделей TTS (текст к речи) были обучены с использованием технологии AI / машинного обучения.

Существует несколько немецких моделей, доступных, обученных и используемых проектами Coqui AI , Piper TTS и домашним помощником . Вы можете найти больше информации о том, как их использовать, образцы аудио и видеоуроки на веб-сайте проекта Thorsten-Voice.

Слушайте образы аудио и инструкции по установке / использованию здесь (??):

Нейтральный тт
Эмоциональные ТТ
Hessisches TTS
Smarthome / Home Assistant

Кроме того, Silero, Monatis и Zdisket также использовали мои голосовые наборы данных для модельной подготовки. Больше образцов и деталей можно найти в образцах звука Силеро Торстен-голос. Смотрите этот ноутбук Colab для получения более подробной информации.

Zdisket сделал инструмент под названием Tensorvox для настройки среды TTS в Windows и включал немецкую модель TTS, обученную Monatis. Спасибо, что поделились этим. Смотрите в действии на YouTube.

Поддержка и спасибо

Если вам нравится мой голосовой вклад и вы хотели бы поддержать мои усилия для будущего OpenSource Voice Technology, вы можете поддержать меня, если хотите:

Подпишитесь и поделитесь моим каналом Thorsten-Voice YouTube и следуйте за мной в моих профилях в социальных сетях
Купить мне чай, используя спонсор KO-Fi или GitHub

Я хочу поблагодарить великих людей, которые поддержали меня в этом путешествии с хорошими словами, поддержкой и вычислительностью: спасибо Эль-Точино, Эрен Гёльге, Грас64, Крис Геслинг, NMStoker, Othiele, Repodiac, Sanjaesc, Synesthesiam.

Особая благодарность моему дорогому коллеге Себастьяну Краусу за поддержку меня с помощью аудиозаписного оборудования и за то, что он был творческим вдохновителем дизайна логотипа и, конечно, для дорогого Доминика (@Domcross), за то, что он был так близко рядом с моей стороной в этом удивительном путешествии.

«Торстен-голос» канал YouTube

На моем канале Thorsten-Voice YouTube вы можете найти пошаговое руководство (рецепты приготовления) по технологии Voice OpenSource. Если вам интересно, я бы рад приветствовать вас в качестве нового подписчика в моем замечательном сообществе YouTube.ts ** на моем маленьком.

Спикер конференции

Мне очень нравится говорить о важности будущего открытого голоса. Если вы хотите, чтобы я стал докладчиком на конференции или событии, я бы рад связаться, с помощью с ним с помощью контактной формы веб-сайта Thorsten-Voice. Смотрите некоторые из моих ссылок на оратор на веб-сайте Thorsten-Voice.

Расширять

Дополнительная информация