annotate_audio ดาวน์โหลด - annotate_audio ซอร์สโค้ดดาวน์โหลดดาวน์โหลด

annotate_audio

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

คำอธิบายประกอบเสียง

สคริปต์ Helper Python เหล่านี้ช่วยให้คุณได้รับไฟล์เสียงที่มีคำอธิบายประกอบขนาดเล็กลงจากไฟล์เสียงขนาดใหญ่ที่มีไฟล์เพื่อฝึกอบรมรุ่น STT หรือ TTS โดย: 1 แยกไฟล์ขนาดใหญ่ในไฟล์ WAV ขนาดเล็กหลายไฟล์คั่นด้วยความเงียบ หากมีลำโพงหลายตัวในเสียงของคุณคุณสามารถลบชิ้นส่วนที่พูดโดยลำโพงอื่น ๆ 2. (ไม่บังคับ) รับการถอดความสำหรับไฟล์เสียงขนาดเล็กเหล่านี้จากบริการ Google Cloud STT ซึ่งต้องใช้บัญชี GCP 3. คำอธิบายประกอบด้วยตนเอง (หรือแก้ไขคำอธิบายประกอบ GCP) ไฟล์เสียงที่เล็กลง

การติดตั้ง

ขั้นตอนที่ 1 ต้องมีการติดตั้ง FFMPEG ในระบบของคุณ
สคริปต์ทั้งหมดเขียนใน Python 3.6+ แพ็คเกจที่จำเป็นสามารถติดตั้งได้ด้วย:

 pip install -r requirement.txt

คุณจะต้องใช้ Pyaudio สำหรับขั้นตอนที่ 3

นอกจากนี้หากคุณต้องการใช้ STT ของ GCP คุณควรติดตั้งไคลเอนต์ Python ด้วย

 pip install --upgrade google-cloud-speech

และกำหนดค่าโครงการตามที่แสดงไว้ที่นี่
เวอร์ชันปัจจุบันของสคริปต์นี้เข้ากันได้กับ Google-Cloud-Speech 2.x หากคุณต้องการใช้เวอร์ชัน 1.x คุณสามารถดู repo รุ่นก่อนหน้านี้ซึ่งใช้เวอร์ชันนั้นได้เช่นกัน

การใช้งาน

 python split.py --input big_file.wav --audio_folder audio --out_csv sentences.csv

ไฟล์ sentences.csv จะถูกสร้างเป็น "ไฟล์; ประโยค"
หากต้องการเก็บเฉพาะไฟล์ที่พูดโดยลำโพงเฉพาะให้ใช้อาร์กิวเมนต์ "-REMOVE_BAD_SEGMENTS" และ "-SPEAKER_SEGMENT"

 python get_gcp_transcription.py --audio_folder audio --csv sentences.csv --language_code en-US

 python annotate.py --audio_folder audio --csv sentences.csv

สำหรับสคริปต์ทั้งสามคุณสามารถดูอาร์กิวเมนต์เพิ่มเติมได้

 python FILE_NAME.py -h

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-14
ขนาด 6.71KB
มาจาก Github

แอปที่เกี่ยวข้อง

nspanel_pro_tools_apk

2024-11-12
audio share

2024-11-02
แอปแก้ไขเสียงเวอร์ชันฟรี

2024-01-11
แอพเสียง Heylink

2023-07-28
เครื่องเสียงแม็ค

2023-07-18
คลิปเสียงเพลงแม็ค เวอร์ชั่น Android

2023-07-17

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด