Scribe est un script Python qui transcrit des fichiers audio à l'aide d'Openai Whisper et exporte les transcriptions sous forme de documents PDF, améliorés par l'API GPT-3.5-Turbo. Il prend en charge les formats de fichiers MP3, M4A et MP4 en entrée et génère un fichier PDF avec le texte de transcription formaté sur une page de taille A4. Le script utilise également le modèle GPT-3.5-Turbo d'OpenAI pour générer un titre pour la transcription.
Fonctionnalités Convertir les fichiers MP3, M4A et MP4 au format WAV pour la transcription des fichiers audio transcrits à l'aide du modèle Whisper ASR Générer un titre pour la transcription à l'aide du modèle GPT-3.5-Turbo d'Openai Créer un fichier PDF avec le texte de transcription formaté sur une page de taille A4 personnaliser le style de la sortie PDF, y compris le texte de la transcription et la taille de la partie A4
Utilisation: Python Scribev4.py <NOWSE_FILE>
Remplacez <fut_file> par le chemin d'accès à votre fichier MP3, M4A ou MP4.
Le script transcrira le fichier audio, générera un titre et créera un fichier PDF dans le même répertoire que le fichier d'entrée avec le même nom mais une extension .pdf.
Pré-requis:
Installer Whisper: PIP Installer Git + https: //github.com/openai/whisper.git
Consultez les différents modèles pré-formés disponibles et leurs performances sur GitHub de Whisper: https://github.com/openai/whisper
Installez d'autres dépendances: Pydub Openai ReportLab MoviePy
Diet Scribe utilise l'API OpenAI et produit un TXT.
Définissez votre clé API
Installez toutes les dépendances requises: pydub, filmpy, openai
Exécuter: Python Diet-Scribe.py <port_file>