
Bermain Bermain Bermain
Bangun Aplikasi Pidato2Text Real-Time secara instan dalam 99 bahasa menggunakan lebih cepat-whisper, diart, dan pyannote
Cobalah melalui demo online
Playground.demo.mp4
Pengaturan
- Memiliki
Conda dan Yarn di perangkat Anda - Klon atau garpu repositori ini
- Instal Backend dan Frontend Environment
sh install_playground.sh - Tinjau config.py untuk memastikan perangkat transkripsi dan tipe komputasi cocok dengan pengaturan Anda. Tinjau config.js untuk memastikan itu sesuai dengan konfigurasi backend dan bahwa alamat backend benar.
- Jalankan backend
cd backend && python server.py - Di terminal yang berbeda, jalankan
cd interface && yarn start
Akses ke Model Pyannote
Repositori ini menggunakan pustaka berdasarkan model Pyannote.Audio, yang disimpan di hub pemeluk wajah. Anda harus menerima ketentuan penggunaannya sebelum menggunakannya. Catatan: Anda harus memiliki akun yang memeluk untuk menggunakan Pyannote
- Terima ketentuan untuk model
pyannote/segmentation - Terima ketentuan untuk model
pyannote/embedding - Terima ketentuan untuk model
pyannote/speaker-diarization - Instal HuggingFace -Cli dan Masuk dengan Token Akses Pengguna Anda (dapat ditemukan di Pengaturan -> Token Akses)
Parameter
- Ukuran Model: Pilih ukuran model, dari kecil ke V2 besar.
- Bahasa: Pilih bahasa yang akan Anda bicarakan.
- Batas waktu transkripsi: Tetapkan jumlah detik aplikasi akan menunggu sebelum menyalin data audio saat ini.
- Ukuran balok: Sesuaikan jumlah transkripsi yang dihasilkan dan dipertimbangkan, yang mempengaruhi akurasi dan waktu pembuatan transkripsi.
- Metode transkripsi: Pilih "real-time" untuk diarisasi dan transkripsi waktu nyata, atau "berurutan" untuk transkripsi periodik dengan lebih banyak konteks.
Pemecahan masalah
- Pada macOS, jika membangun roda untuk safetensor gagal, pasang rust
brew install rust dan coba lagi.
Bug yang dikenal
- Dalam mode berurutan, mungkin ada pertukaran speaker yang tidak terkendali.
- Dalam mode real-time, data audio tidak memenuhi batas waktu transkripsi tidak akan ditranskripsi.
Repositori ini belum diuji untuk semua bahasa; Harap buat masalah jika Anda mengalami masalah.
Lisensi
Repositori ini dan bobot kode dan model bisikan ini dirilis di bawah lisensi MIT.