เสื้อคลุม API สำหรับไลบรารี Whisperx
นี่คือแอปพลิเคชัน fastapi ที่ให้จุดสิ้นสุดสำหรับการถอดความวิดีโอ/เสียงโดยใช้คำสั่ง whisperx แอปพลิเคชันรองรับรูปแบบเสียงและวิดีโอหลายรูปแบบ มันดำเนินการถอดความการจัดตำแหน่งและ diarization ของไฟล์สื่อที่อัปโหลด
ทำตามคำแนะนำเกี่ยวกับวิธีการติดตั้ง Whisperx ในที่เก็บอย่างเป็นทางการคุณสามารถติดตั้งการอ้างอิงเหล่านี้โดยใช้ไฟล์ requirements.txt :
pip install -r requirements.txt สร้างไฟล์ .env ในไดเรกทอรีรูทของคุณและเพิ่มตัวแปรต่อไปนี้:
SECRET_KEY = your_secret_key
MASTER_KEY = your_master_key
HUGGING_FACE_TOKEN = your_hugging_face_token
API_PORT = 11300 SQLite ใช้สำหรับการจัดเก็บข้อมูลผู้ใช้ ฐานข้อมูลถูกสร้างขึ้นโดยอัตโนมัติเมื่อแอปพลิเคชันทำงาน
เรียกใช้แอปพลิเคชันโดยใช้:
python api_whisperx.py แทนที่ main ด้วยชื่อไฟล์ Python ของคุณหากไม่ใช่ main.py
/authรับรองความถูกต้องของผู้ใช้และส่งคืนโทเค็น JWT
username : ชื่อผู้ใช้ของผู้ใช้password : รหัสผ่านของผู้ใช้/create_userสร้างผู้ใช้ใหม่
username : ชื่อผู้ใช้ที่ต้องการpassword : รหัสผ่านที่ต้องการmaster_key : คีย์หลักสำหรับการสร้างผู้ใช้ที่ได้รับอนุญาต/whisperx-transcribe/ถอดเสียงไฟล์เสียงหรือวิดีโอที่อัปโหลด
file : ไฟล์เสียงหรือวิดีโอเพื่อถอดความlang : ภาษาสำหรับการถอดความ (ค่าเริ่มต้นคือ "PT")model : รุ่นที่ใช้สำหรับการถอดความ (ค่าเริ่มต้นคือ "ขนาดใหญ่ V2")min_speakers : จำนวนลำโพงขั้นต่ำสำหรับ diarization (ค่าเริ่มต้นคือ 1)max_speakers : จำนวนสูงสุดของลำโพงสำหรับ diarization (ค่าเริ่มต้นคือ 2) แอปพลิเคชันมีการบันทึกในตัวที่แจ้งเกี่ยวกับขั้นตอนที่ดำเนินการและข้อผิดพลาดใด ๆ ที่เกิดขึ้น