Pencernaan bicara
Aplikasi StreamLit ini memungkinkan pengguna untuk mengunggah file audio, mentranskripsi audio menggunakan ASR Whisper OpenAI, dan kemudian merangkum transkripsi menggunakan model bahasa GPT-3.5-Turbo OpenAI.
Fitur
- Unggah file audio dalam format yang didukung (m4a, mp3, webm, mp4, mpga, wav, dan mpeg)
- Transkrip Audio Menggunakan Openai's Whisper ASR
- Ringkas audio yang ditranskripsikan menggunakan Openai's GPT-3.5-turbo
- Berikan kunci API khusus dan pilih model yang diinginkan
Instalasi
Prasyarat
- Python 3.6 atau lebih tinggi
- Streamlit
- Perpustakaan Openai Python (v0.27.0 atau lebih tinggi)
Tangga
- Klon Repositori:
git clone https://github.com/StanGirard/speechdigest
- Ubah ke direktori repositori:
- Pasang paket yang diperlukan:
pip install -r requirements.txt
- Atur tombol API OpenAI Anda sebagai variabel lingkungan:
export OPENAI_API_KEY="your-api-key"
- Jalankan aplikasi streamLit:
Aplikasi ini sekarang dapat diakses di http://localhost:8501 di browser Anda.
Penggunaan
- Buka aplikasi di browser Anda.
- Masukkan tombol API OpenAI Anda dan pilih model yang diinginkan (GPT-4 atau GPT-3.5-TURBO) menggunakan bidang input.
- Unggah file audio dalam format yang didukung menggunakan pengunggah file.
- Aplikasi ini akan menuliskan audio menggunakan Whisper ASR dan menampilkan transkripsi.
- Aplikasi kemudian akan merangkum transkripsi menggunakan model bahasa yang dipilih dan menampilkan ringkasan.
Berkontribusi
Jangan ragu untuk mengirimkan masalah, permintaan fitur, atau permintaan tarik. Kami menghargai kontribusi apa pun untuk meningkatkan aplikasi.