annotate_audio 다운로드 annotate_audio 소스 코드 다운로드

annotate_audio

AI 소스 코드

1.0.0

다운로드

오디오에 주석을 달다

이 Python 헬퍼 스크립트는 큰 오디오가 포함 된 파일에서 STT 또는 TTS 모델을 훈련시키는 작은 주석이 작은 오디오 파일을 얻는 데 도움이됩니다. 오디오에 여러 스피커가있는 경우 다른 스피커가 사용하는 부품을 제거 할 수도 있습니다. 2. (선택 사항) Google Cloud STT 서비스에서 이러한 작은 오디오 파일에 대한 전사를 받으십시오. 이는 GCP 계정이 필요합니다.

설치

1 단계는 시스템에 FFMPEG를 설치해야합니다.
모든 스크립트는 Python 3.6+로 작성되며 필요한 패키지를 다음과 같이 설치할 수 있습니다.

 pip install -r requirement.txt

3 단계에는 Pyaudio가 필요합니다.

또한 GCP의 STT를 사용하려면 Python 클라이언트를 설치해야합니다.

 pip install --upgrade google-cloud-speech

여기에 표시된대로 프로젝트를 구성하십시오.
이 스크립트의 현재 버전은 Google-Cloud-Speech 2.X와 호환됩니다. 버전 1.X를 사용하려면 해당 버전의 이전 버전을 살펴볼 수 있습니다.

용법

 python split.py --input big_file.wav --audio_folder audio --out_csv sentences.csv

sentences.csv 파일은 "파일; 문장"으로 작성됩니다.
특정 스피커가 사용하는 파일 만 유지하려면 "-remove_bad_segments"및 "-speaker_segment"인수를 사용하십시오.

 python get_gcp_transcription.py --audio_folder audio --csv sentences.csv --language_code en-US

 python annotate.py --audio_folder audio --csv sentences.csv

세 스크립트 모두에 대해 추가 인수를 볼 수 있습니다.

 python FILE_NAME.py -h

확장하다

추가 정보

버전 1.0.0
유형 AI 소스 코드
업데이트 시간 2025-09-14
크기 6.71KB
출처 Github

annotate_audio

오디오에 주석을 달다

설치

용법

nspanel_pro_tools_apk

audio share

오디오 오디오 편집 앱 무료 버전

헤이링크 오디오 앱

오디오 맥

오디오 맥 뮤직 클립 안드로이드 버전

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express