Этот сценарий опирается на веб-сайт sinsy.jp из Технологического института Нагоя, который реализует систему синтеза голоса на основе HMM.
Вы можете найти образец, объединенный с инструментальным звуком здесь.
pip install git+git://github.com/mathigatti/midi2voice.git Вы можете использовать его, выполняя установленную модуль с помощью python -m midi2voice . У него есть серверные параметры, большинство из них необязательны, и вам нужно использовать их, только если вы хотите указать что -то другое, чем по умолчанию
python -m midi2voice
-h, --help # show this help message and exit
-l LYRICS, --lyrics LYRICS # Path to txt file containing the lyrics
-m MIDI, --midi MIDI # Path to midi file
-lang {english,japanese,mandarin} # Language of the voice (OPTIONAL / DEFAULT: english)
-g {female,male} # Gender voice (female/male) (OPTIONAL / DEFAULT: female)
-i VOICEINDEX # Each language has different voices, for example japanese has 4 different female voices at the moment, mandarin only one. (OPTIONAL / DEFAULT: 0)
-t TEMPO # Song tempo in BPMs (OPTIONAL / DEFAULT 80)
-s SYNALPHA # Gender parameter [between -0.8 and 0.8, default: 0.55]
-v VIBPOWER # Vibrato intensity [between 0 and 2, default: 1]
-p F0SHIFT # Pitch shift [in half tones, between -24 and 24, default: 0]
-d DESTINATION_FOLDER # Destination folder
Проверьте образцы MIDI и текста здесь.
# Print help
python3 -m midi2voice -h
# Basic example
python -m midi2voice -l shallow.txt -m shallow.mid
# Generate the voice given a midi file and a text file with the lyrics
python -m midi2voice -l shallow.txt -m shallow.mid -lang english -g female -t 96Если у вас нет установленного Python или вы просто хотите проверить его быстро, вы можете попробовать его онлайн здесь.
На данный момент sinsy.jp предоставляет эти голоса. Вы можете использовать параметр VoiceIndex, чтобы выбрать их.
Японский
Женский
Мужской
Английский
Женский
Мужской
Мандарин
Женский
Мужской
Этот исходный код был разработан Матиасом Гатти (@Mathigatti), если вы его используете, не забудьте процитировать меня. Для научных публикаций вы можете использовать этот DOI.
Gatti, M. (2020). mathigatti/midi2voice v1.0.0 (v1.0.0) [Computer software]. Zenodo. https://doi.org/10.5281/ZENODO.3969003
Если вы хотите помочь мне продолжать развиваться и поддерживать проекты с открытым исходным кодом, вы можете внести свой вклад в покупку мне немного KO-Fi.
Грань