Pembungkus API untuk Perpustakaan Whisperx
Ini adalah aplikasi FASTAPI yang menyediakan titik akhir untuk transkripsi video/audio menggunakan perintah whisperx . Aplikasi ini mendukung beberapa format audio dan video. Ini melakukan transkripsi, penyelarasan, dan diarisasi file media yang diunggah.
Ikuti instruksi tentang cara menginstal Whisperx di repositori resmi Anda dapat menginstal dependensi ini menggunakan file requirements.txt :
pip install -r requirements.txt Buat file .env di direktori root Anda dan tambahkan variabel berikut:
SECRET_KEY = your_secret_key
MASTER_KEY = your_master_key
HUGGING_FACE_TOKEN = your_hugging_face_token
API_PORT = 11300 SQLite digunakan untuk menyimpan informasi pengguna. Basis data dibuat secara otomatis saat aplikasi berjalan.
Jalankan aplikasi menggunakan:
python api_whisperx.py Ganti main dengan nama file python Anda jika bukan main.py
/authMengotentikasi pengguna dan mengembalikan token JWT.
username : Nama pengguna pengguna.password : Kata sandi pengguna./create_userBuat pengguna baru.
username : Nama pengguna yang diinginkan.password : Kata sandi yang diinginkan.master_key : Kunci master untuk pembuatan pengguna yang berwenang./whisperx-transcribe/Transkripsi audio atau file video yang diunggah.
file : File audio atau video untuk ditranskripsikan.lang : Bahasa untuk Transkripsi (default adalah "PT").model : Model untuk digunakan untuk transkripsi (default adalah "V2 besar").min_speakers : Jumlah minimum speaker untuk diarization (default adalah 1).max_speakers : Jumlah maksimum speaker untuk diarization (default adalah 2). Aplikasi ini memiliki logging bawaan yang menginformasikan tentang langkah-langkah yang dilakukan dan kesalahan apa pun yang terjadi.