Un envoltorio API para la biblioteca Whisperx
Esta es una aplicación FastAPI que proporciona un punto final para la transcripción de video/audio utilizando el comando whisperx . La aplicación admite múltiples formatos de audio y video. Realiza la transcripción, la alineación y la diario de los archivos multimedia cargados.
Siga las instrucciones sobre cómo instalar Whisperx en el repositorio oficial, puede instalar estas dependencias utilizando el archivo requirements.txt :
pip install -r requirements.txt Cree un archivo .env en su directorio raíz y agregue las siguientes variables:
SECRET_KEY = your_secret_key
MASTER_KEY = your_master_key
HUGGING_FACE_TOKEN = your_hugging_face_token
API_PORT = 11300 SQLite se utiliza para almacenar información del usuario. La base de datos se crea automáticamente cuando se ejecuta la aplicación.
Ejecute la aplicación usando:
python api_whisperx.py Reemplace main con el nombre de su archivo Python si no es main.py
/authAutenticar a un usuario y devolver un token JWT.
username : el nombre de usuario del usuario.password : la contraseña del usuario./create_userCrear un nuevo usuario.
username : nombre de usuario deseado.password : contraseña deseada.master_key : clave maestra para la creación autorizada de usuarios./whisperx-transcribe/Transcribe un archivo de audio o video cargado.
file : el archivo de audio o video para transcribir.lang : Idioma para la transcripción (el valor predeterminado es "PT").model : Modelo para usar para la transcripción (el valor predeterminado es "grande-V2").min_speakers : número mínimo de altavoces para diarización (el valor predeterminado es 1).max_speakers : número máximo de altavoces para diarización (el valor predeterminado es 2). La aplicación tiene registro incorporado que informa sobre los pasos que se realizan y cualquier error que ocurra.