คำพูดย่อย
แอพ streamlit นี้ช่วยให้ผู้ใช้สามารถอัปโหลดไฟล์เสียงถอดรหัสเสียงโดยใช้ ASR Whisper ของ OpenAI จากนั้นสรุปการถอดรหัสโดยใช้โมเดลภาษา GPT-3.5-turbo ของ OpenAI
คุณสมบัติ
- อัปโหลดไฟล์เสียงในรูปแบบที่รองรับ (M4A, MP3, Webm, MP4, MPGA, WAV และ MPEG)
- ถอดเสียงโดยใช้ Whisper ASR ของ Openai
- สรุปเสียงที่ถอดความโดยใช้ GPT-3.5-turbo ของ OpenAI
- ระบุรหัส API ที่กำหนดเองและเลือกรุ่นที่ต้องการ
การติดตั้ง
ข้อกำหนดเบื้องต้น
- Python 3.6 หรือสูงกว่า
- มีแสงสว่าง
- Openai Python Library (v0.27.0 หรือสูงกว่า)
ขั้นตอน
- โคลนที่เก็บ:
git clone https://github.com/StanGirard/speechdigest
- เปลี่ยนเป็นไดเรกทอรีของที่เก็บ:
- ติดตั้งแพ็คเกจที่ต้องการ:
pip install -r requirements.txt
- ตั้งค่าคีย์ OpenAI API ของคุณเป็นตัวแปรสภาพแวดล้อม:
export OPENAI_API_KEY="your-api-key"
- เรียกใช้แอพ Streamlit:
ตอนนี้แอพจะสามารถเข้าถึงได้ที่ http://localhost:8501 ในเบราว์เซอร์ของคุณ
การใช้งาน
- เปิดแอพในเบราว์เซอร์ของคุณ
- ป้อนคีย์ OpenAI API ของคุณและเลือกรุ่นที่ต้องการ (GPT-4 หรือ GPT-3.5-turbo) โดยใช้ฟิลด์อินพุต
- อัปโหลดไฟล์เสียงในรูปแบบที่รองรับโดยใช้ไฟล์อัปโหลด
- แอพจะถอดเสียงเสียงโดยใช้ Whisper ASR และแสดงการถอดความ
- แอพจะสรุปการถอดรหัสโดยใช้โมเดลภาษาที่เลือกและแสดงบทสรุป
การบริจาค
อย่าลังเลที่จะส่งปัญหาคำขอคุณลักษณะหรือคำขอดึง เราขอขอบคุณที่มีส่วนร่วมในการปรับปรุงแอพ