Scribeは、Openai Whisperを使用してオーディオファイルを転写し、GPT-3.5-ターボAPIによって強化されたPDFドキュメントとして転写をエクスポートするPythonスクリプトです。 MP3、M4A、およびMP4ファイル形式を入力としてサポートし、A4サイズのページで転写テキストがフォーマットされたPDFファイルを生成します。このスクリプトは、OpenAIのGPT-3.5ターボモデルを使用して、転写のタイトルを生成します。
Whisper ASRモデルを使用してTranscription Transcraption Transcraption FiledのMP3、M4A、およびMP4ファイルはWAV形式に変換され、OpenAIのGPT-3.5ターボモデルを使用して転写のタイトルを生成します。
使用法:python scribev4.py <inupt_file>
<inupt_file>をmp3、m4a、またはmp4ファイルへのパスに置き換えます。
スクリプトは、オーディオファイルを転写し、タイトルを生成し、同じ名前の入力ファイルと同じディレクトリにPDFファイルを作成します。
前提条件:
インストールささやき:PIPインストールgit+https://github.com/openai/whisper.git
さまざまな利用可能な事前に訓練されたモデルと、whisper'sGithubでのパフォーマンスをご覧ください:https://github.com/openai/whisper
その他の依存関係をインストール:Pydub Openai ReportLab Moviepy
Diet ScribeはOpenai APIを使用し、TXTを出力します。
APIキーを設定します
必要なすべての依存関係をインストールします:pydub、moviepy、openai
実行:python diet-scribe.py <inupt_file>