youtube_tts_data_generator
Youtube Speech Data Generator
Perpustakaan Python untuk menghasilkan dataset ucapan. Generator Data Pidato YouTube juga menangani hampir semua preprocessing data wicara Anda yang diperlukan untuk membangun dataset ucapan bersama dengan transkripsi mereka memastikan itu mengikuti struktur direktori diikuti oleh sebagian besar arsitektur teks-ke-bicara.
Pastikan FFMPEG diinstal dan diatur ke jalur sistem.
$ pip install youtube-tts-data-generator from youtube_tts_data_generator import YTSpeechDataGenerator
# First create a YTSpeechDataGenerator instance:
generator = YTSpeechDataGenerator ( dataset_name = 'elon' )
# Now create a '.txt' file that contains a list of YouTube videos that contains speeches.
# NOTE - Make sure you choose videos with subtitles.
generator . prepare_dataset ( 'links.txt' )
# The above will take care about creating your dataset, creating a metadata file and trimming silence from the audios. Menginisialisasi generator: generator = YTSpeechDataGenerator(dataset_name='your_dataset',lang='en')
├───your_dataset
│ ├───txts
│ └───wavs
└───your_dataset_prep
├───concatenated
├───downloaded
└───split
{
"your_dataset1.wav": "This is an example text",
"your_dataset2.wav": "This is an another example text",
}
generator.get_available_langs()Metode:
filename,subtitle,trim_min_begin,trim_min_end
audio.wav,subtitle.srt,0,0
audio2.wav,subtitle.vtt,5,6
generator.download('links.txt')generator.split_audios()generator.concat_audios()generator.finalize_dataset(min_audio_length=6)generator.get_available_langs()generator.get_total_audio_length()generator.prepare_dataset(links_txt='links.txt', download_youtube_data=True, min_audio_length=6) Setelah dataset dibuat, struktur di bawah direktori 'your_dataset' seharusnya terlihat seperti:
your_dataset
├───txts
│ ├───your_dataset1.txt
│ └───your_dataset2.txt
├───wavs
│ ├───your_dataset1.wav
│ └───your_dataset2.wav
└───metadata.csv/alignment.json
Catatan - audio.py sangat didasarkan pada kloning suara waktu nyata
SRT ke JSON
Baca lebih lanjut tentang perpustakaan di sini