annotate_audio
1.0.0
이 Python 헬퍼 스크립트는 큰 오디오가 포함 된 파일에서 STT 또는 TTS 모델을 훈련시키는 작은 주석이 작은 오디오 파일을 얻는 데 도움이됩니다. 오디오에 여러 스피커가있는 경우 다른 스피커가 사용하는 부품을 제거 할 수도 있습니다. 2. (선택 사항) Google Cloud STT 서비스에서 이러한 작은 오디오 파일에 대한 전사를 받으십시오. 이는 GCP 계정이 필요합니다.
1 단계는 시스템에 FFMPEG를 설치해야합니다.
모든 스크립트는 Python 3.6+로 작성되며 필요한 패키지를 다음과 같이 설치할 수 있습니다.
pip install -r requirement.txt
3 단계에는 Pyaudio가 필요합니다.
또한 GCP의 STT를 사용하려면 Python 클라이언트를 설치해야합니다.
pip install --upgrade google-cloud-speech
여기에 표시된대로 프로젝트를 구성하십시오.
이 스크립트의 현재 버전은 Google-Cloud-Speech 2.X와 호환됩니다. 버전 1.X를 사용하려면 해당 버전의 이전 버전을 살펴볼 수 있습니다.
python split.py --input big_file.wav --audio_folder audio --out_csv sentences.csv
sentences.csv 파일은 "파일; 문장"으로 작성됩니다.
특정 스피커가 사용하는 파일 만 유지하려면 "-remove_bad_segments"및 "-speaker_segment"인수를 사용하십시오.
python get_gcp_transcription.py --audio_folder audio --csv sentences.csv --language_code en-US
python annotate.py --audio_folder audio --csv sentences.csv
세 스크립트 모두에 대해 추가 인수를 볼 수 있습니다.
python FILE_NAME.py -h