Scribe ist ein Python-Skript, das Audiodateien mithilfe von OpenAi Whisper transkribiert und die Transkriptionen als PDF-Dokumente exportiert, die durch die GPT-3.5-Turbo-API verbessert werden. Es unterstützt MP3-, M4A- und MP4 -Dateiformate als Eingabe und generiert eine PDF -Datei mit dem auf einer A4 -Größe formatierten Transkriptionstext. Das Skript verwendet auch das GPT-3,5-Turbo-Modell von OpenAI, um einen Titel für die Transkription zu generieren.
Funktionen konvertieren MP3-, M4A- und MP4-Dateien in WAV-Format für Transkriptions-Transkribier-Audiodateien mit dem Whisper Asr-Modell Generieren Sie einen Titel für die Transkription unter Verwendung von OpenAIs GPT-3.5-Turbo-Modell Erstellen Sie eine PDF
Verwendung: Python Scribev4.py <Peds_file>
Ersetzen Sie <Peds_file> durch den Pfad zu Ihrer Datei MP3-, M4A- oder MP4 -Datei.
Das Skript transkribieren die Audiodatei, generiert einen Titel und erstellt eine PDF -Datei in demselben Verzeichnis wie die Eingabedatei mit demselben Namen, aber eine .pdf -Erweiterung.
Voraussetzungen:
Installieren Sie Whisper: PIP Installieren Sie GIT+https: //github.com/openai/whisper.git
Schauen Sie sich die verschiedenen verfügbaren vorgeborenen Modelle und ihre Leistung in Whisper's GitHub an: https://github.com/openai/whisper
Installieren Sie andere Abhängigkeiten: Pydub OpenAI ReportLab Moviepy
Diet Scribe verwendet die OpenAI -API und gibt einen txt aus.
Legen Sie Ihre API -Taste ein
Installieren Sie alle erforderlichen Abhängigkeiten: pydub, moviepy, openai
Run: Python Diet-scribe.py <input_file>