Sprachverdauung
Mit dieser Streamlit-App können Benutzer eine Audiodatei hochladen, das Audio mithilfe von OpenAIs Whisper ASR transkribieren und dann die Transkription mithilfe von OpenAIs GPT-3.5-Turbo-Sprachmodell zusammenfassen.
Merkmale
- Audiodateien in unterstützten Formaten hochladen (M4A, MP3, Webm, MP4, MPGA, WAV und MPEG)
- Transkribieren Sie Audio mit OpenAIs Whisper ASR
- Fassen Sie das transkribierte Audio mit OpenAIs GPT-3,5-Turbo zusammen
- Geben Sie den benutzerdefinierten API -Schlüssel an und wählen Sie das gewünschte Modell aus
Installation
Voraussetzungen
- Python 3.6 oder höher
- Straffung
- Openai Python Library (v0.27.0 oder höher)
Schritte
- Klonen Sie das Repository:
git clone https://github.com/StanGirard/speechdigest
- Wechseln Sie in das Verzeichnis des Repositorys:
- Installieren Sie die erforderlichen Pakete:
pip install -r requirements.txt
- Stellen Sie Ihre OpenAI -API -Schlüssel als Umgebungsvariable fest:
export OPENAI_API_KEY="your-api-key"
- Führen Sie die Streamlit -App aus:
Die App ist nun unter http://localhost:8501 in Ihrem Browser zugänglich.
Verwendung
- Öffnen Sie die App in Ihrem Browser.
- Geben Sie Ihre OpenAI-API-Taste ein und wählen Sie das gewünschte Modell (GPT-4 oder GPT-3.5-Turbo) mit den Eingangsfeldern aus.
- Laden Sie eine Audiodatei in einem unterstützten Format mit dem Datei -Uploader hoch.
- Die App transkribieren das Audio mithilfe von Whisper ASR und zeigt die Transkription an.
- Die App fasst dann die Transkription mit dem ausgewählten Sprachmodell zusammen und zeigt die Zusammenfassung an.
Beitragen
Fühlen Sie sich frei, Probleme, Feature -Anfragen oder Anfragen einzureichen. Wir schätzen jeden Beitrag zur Verbesserung der App.