whisperx api
1.0.0
WhisperxライブラリのAPIラッパー
これは、 whisperxコマンドを使用してビデオ/オーディオ転写のエンドポイントを提供するFastAPIアプリケーションです。アプリケーションは、複数のオーディオおよびビデオ形式をサポートしています。アップロードされたメディアファイルの転写、アライメント、およびダイアリゼーションを実行します。
whisperxを公式リポジトリにインストールする方法の指示に従ってください。 requirements.txtを使用してこれらの依存関係をインストールできます。txtファイル:
pip install -r requirements.txtルートディレクトリに.envファイルを作成し、次の変数を追加します。
SECRET_KEY = your_secret_key
MASTER_KEY = your_master_key
HUGGING_FACE_TOKEN = your_hugging_face_token
API_PORT = 11300 SQLiteは、ユーザー情報の保存に使用されます。データベースは、アプリケーションの実行時に自動的に作成されます。
以下を使用してアプリケーションを実行します。
python api_whisperx.py main.pyでない場合は、Pythonファイルの名前をmainに置き換えます。
/authユーザーを認証し、JWTトークンを返します。
username :ユーザーのユーザー名。password :ユーザーのパスワード。/create_user新しいユーザーを作成します。
username :目的のユーザー名。password :希望するパスワード。master_key :認定ユーザー作成のマスターキー。/whisperx-transcribe/アップロードされたオーディオまたはビデオファイルを転写します。
file :転写するオーディオまたはビデオファイル。lang :Transcriptionの言語(デフォルトは「PT」です)。model :転写に使用するモデル(デフォルトは「大V2」です)。min_speakers :ダイアリゼーションのためのスピーカーの最小数(デフォルトは1)。max_speakers :ダイアリゼーションのためのスピーカーの最大数(デフォルトは2)。 アプリケーションには、実行されている手順と発生するエラーについて通知するロギングが組み込まれています。