speechdigest Download - speechdigest -Quellcode -Download

speechdigest

Anderer Quellcode

1.0.0

Herunterladen

Sprachverdauung

Mit dieser Streamlit-App können Benutzer eine Audiodatei hochladen, das Audio mithilfe von OpenAIs Whisper ASR transkribieren und dann die Transkription mithilfe von OpenAIs GPT-3.5-Turbo-Sprachmodell zusammenfassen.

Merkmale

Audiodateien in unterstützten Formaten hochladen (M4A, MP3, Webm, MP4, MPGA, WAV und MPEG)
Transkribieren Sie Audio mit OpenAIs Whisper ASR
Fassen Sie das transkribierte Audio mit OpenAIs GPT-3,5-Turbo zusammen
Geben Sie den benutzerdefinierten API -Schlüssel an und wählen Sie das gewünschte Modell aus

Installation

Voraussetzungen

Python 3.6 oder höher
Straffung
Openai Python Library (v0.27.0 oder höher)

Schritte

Klonen Sie das Repository:

 git clone https://github.com/StanGirard/speechdigest

Wechseln Sie in das Verzeichnis des Repositorys:

 cd speechdigest

Installieren Sie die erforderlichen Pakete:

 pip install -r requirements.txt

Stellen Sie Ihre OpenAI -API -Schlüssel als Umgebungsvariable fest:

 export OPENAI_API_KEY="your-api-key"

Führen Sie die Streamlit -App aus:

 streamlit run app.py

Die App ist nun unter http://localhost:8501 in Ihrem Browser zugänglich.

Verwendung

Öffnen Sie die App in Ihrem Browser.
Geben Sie Ihre OpenAI-API-Taste ein und wählen Sie das gewünschte Modell (GPT-4 oder GPT-3.5-Turbo) mit den Eingangsfeldern aus.
Laden Sie eine Audiodatei in einem unterstützten Format mit dem Datei -Uploader hoch.
Die App transkribieren das Audio mithilfe von Whisper ASR und zeigt die Transkription an.
Die App fasst dann die Transkription mit dem ausgewählten Sprachmodell zusammen und zeigt die Zusammenfassung an.