Descarga de LLM Minutes of Meeting - LLM Minutes of Meeting Descargar el código fuente

LLM Minutes of Meeting

Datos del sitio web

1.0.0

Descargar

LLM-Minutes de la reunión

Tabla de contenido

Sr. No.	Tema	Enlace
0.	Introducción y "por qué" del proyecto	El enlace vendrá aquí
1.	Configuración e instalación	El enlace vendrá aquí
2.	Características	Otro enlace
3.	Capturas de pantalla de demostración y aplicación	Otro enlace
4.	Enfoque e implementación*	Otro enlace
5.	Actualizaciones recientes y direcciones futuras	Otro enlace
6.	Contribuciones	Otro enlace
7.	Problemas/Solución de problemas	Otro enlace

0. Introducción y "por qué" del proyecto

Minutes de reuniones Imagen AI

El objetivo principal de este proyecto es mostrar la capacidad de NLP & LLM para resumir rápidamente las largas reuniones y ayudarlo a usted y su organización automatizar la tarea de delegar minutos de correos electrónicos de reuniones (MOM). Utiliza un enfoque de alto nivel de nivel 2 donde el paso 1 corresponde a la conversión de cualquier archivo de audio/video en una conversación de texto. El paso 2 utiliza el texto producido por el Paso 1 y genera minutos de reunión y notas de resumen detalladas. Estas actas de reunión serán un texto editable. Una vez que finalice a la madre, puede usarla más según sus requisitos.

El objetivo a largo plazo para este repositorio también es desarrollar una aplicación web de Python en tiempo real que pueda asistir a reuniones para usted y también proporcionarle a su madre al final de la reunión. Tomar pasos para bebés y tratando de llegar a largo plazo comenzando un objetivo a corto plazo.

Para su información: estoy trabajando en el ajuste de LLMS y el desarrollo personalizados. Tenga paciencia mientras todo el proyecto sea completamente estable. Agregaré código de entrenamiento e inferencia una vez completado. Haga este repositorio si necesita saber las últimas actualizaciones. ? Aprecia tu tiempo.

1. Configuración e instalación

Antes de continuar, asegúrese de tener lo siguiente instalado:

Ubuntu 22.04 o más reciente.
Python (v3.10 o superior)
Una herramienta de entorno virtual como virtualenv o venv .

Comencemos los pasos de instalación ahora.

Clon el repositorio de Github
Abra su terminal o símbolo del sistema y navegue al directorio donde desea clonar el repositorio. Luego corre:
```
git clone https://github.com/inboxpraveen/LLM-Minutes-of-Meeting
cd LLM-Minutes-of-Meeting
```

Requisitos de instalación

Es una buena práctica crear un entorno virtual antes de instalar dependencias para evitar posibles conflictos con otros proyectos de Python. Si está utilizando virtualenv , puede configurar un nuevo entorno de la siguiente manera:

 # # Create a python virtual environment and activate it.
# Install the required packages after activating:
pip install -r requirements.txt

# # After this, let's install Llama-Cpp-Python binding which will be used to interact with LLMs. 

# # Run the following line if you are using it on a CPU.
pip install llama-cpp-python

# # Run the following line if you are using GPU (T4, A100, A10, or H100), or any Nvidia Cuda based GPU Drivers.
CMAKE_ARGS= " -DLLAMA_CUDA=on " pip install llama-cpp-python

# # If you are on Mac or any other GPU types, you can refer the following links and setup the Llama-Cpp-Python

https://llama-cpp-python.readthedocs.io/en/stable/ # installation-configuration

https://llama-cpp-python.readthedocs.io/en/stable/install/macos/

Configurar el procesamiento de trabajo de antecedentes de RabbitMQ & Ceyery
Use el siguiente enlace para configurar RabbitMQ en su máquina. Siga las instrucciones hasta el paso 5 y guarde su nombre de usuario y password admin-username .
Configurar conejos en Ubuntu 22.04
Una vez que haya configurado con éxito RabbitMQ, configure Redis-Server y Celery. Use el siguiente comando para configurarlos e instalarlos.
```
sudo apt-get update -y
# # Try with apt-get. If it does not install, then run with apt. 
sudo apt-get install redis-server -y 
# # If the above does not work, try this:
sudo apt install redis-server -y
```
Ejecutar la aplicación y la tarea de apio en ejecución paralela

Primero, inicie la aplicación Flask:

 cd /path/to/project/

y luego abra el archivo App.py dentro de su editor de códigos y modifique la siguiente línea.

 Line 18 :     broker = 'amqp://<user>:<password>$@localhost:5672//'

## Update <user> with "your-admin-username".
## Update <password> with "your-admin-password"
## Eg: broker='amqp://admin:hello_world$@localhost:5672//'

### IMPORTANT NOTE: If your password contains '@' symbol, you will need to convert it because it is the default delimiter in broker settings. Example if your password has @ symbol inside it would be. 
## broker='amqp://admin:hello%40world$@localhost:5672//'  -- where the original password was "hello@world", we represent it as 'hello%40world'

Después de haber actualizado el archivo, ejecutará el archivo setup.py para configurar directorios y descargar modelos. Si desea cambiar las configuraciones de los modelos que desea usar, puede cambiarlos adecuadamente en función de su tamaño de infraestructura y capacidad del sistema. La siguiente tabla muestra qué modelos admitimos actualmente en este proyecto, pero agregaremos un nuevo soporte de LLMS a medida que los vemos en forma y de código abierto.

Modelos de habla apoyados

Nombre del modelo	Tamaño del modelo	Memoria requerida (RAM o VRAM)
destilado	3.1 GB	4 GB
destilado	3.1 GB	4 GB
DISTIL-WHISPER/DISTIL-MIDIUM.EN	1.6 GB	2 GB
destilado	680 MB	900 MB
OpenAI/Whisper-Large-V3	6.2 GB	7.5 GB
OpenAI/Whisper-Large-V2	6.2 GB	7.5 GB
OpenAI/Whisper-Large-V1	6.2 GB	7.5 GB
OPERAI/Whisper-Medio	3.2 GB	4.5 GB
OpenAI/Whisper-Small (predeterminado)	980 MB	1.7 GB

LLMS admitido

Nombre del modelo	Tamaño del modelo	Se requiere memoria
QuantFactory/Phi-3-Mini-4K-InStruct-GGUF (predeterminado)	1 GB - 8 GB	2 GB - 14 GB
QuantFactory/Phi-3-Mini-128K-Instructo-GGUF	1 GB - 8 GB	2.5 GB - 16 GB
Bartowski/Phi-3-Medium-128K-Instructo-GGUF	3 GB - 14 GB	6 GB - 18 GB

Deberá modificar el archivo global_varibables.py con el nombre del modelo que elija y luego ejecute el archivo setup.py que depositará automáticamente los modelos que elija.

 Line 32 : DEFAULT_SPEECH_MODEL = "openai/whisper-small"
...
Line 46 : DEFAULT_SUMMARY_MODEL = ( "QuantFactory/Phi-3-mini-4k-instruct-GGUF" , "Phi-3-mini-4k-instruct.Q5_0.gguf" )


### After update the above lines as per your need, run the setup.py
python setup . py

En una nueva ventana de terminal (asegúrese de que su entorno virtual se active aquí también), inicie la aplicación y el trabajador de apio:

python app.py # ensure your environment is activated

# and then in new terminal, run the following.
celery -A app.celery worker --loglevel=info -f celery.logs

Subir la grabación para formar
Abra su navegador web y navegue a la URL de la aplicación Flask (generalmente http://127.0.0.1:5000 ). Use la interfaz para cargar la grabación de su reunión.
Obtenga el último estado y espere a que se complete
Después de cargar la grabación, puede verificar el estado del procesamiento. Esto podría implementarse como una página de estado o una barra de progreso en su aplicación. Espere hasta que se complete el procesamiento.
Vea las actas finales procesadas de la reunión (mamá)
Una vez que se completa el procesamiento, la solicitud debe mostrar las actas finales de la reunión. Puede ver, editar (si la función está disponible) y guardar la madre para su referencia.

2. Características:

Convierta sin esfuerzo archivos de audio y video a transcripciones precisas de texto: también se pueden usar para resumir, generar elementos de acción, comprender las flujos de trabajo y la planificación de recursos.
Destacación de palabras clave y etiquetado de temas para referencia rápida: extraer temas y encontrar contenido relevante para saltar a través de reuniones y escuchar solo temas específicos que son de su interés.
Minutes de exportación en varios formatos, incluidos PDF y texto sin formato: le permite exportar transcripciones de reuniones, resúmenes, temas y palabras clave, elementos de acción, etc. en documentos que pueden utilizarse en los marcos de planificación y gestión de proyectos. También elimina su necesidad de escribir y generar plantillas manualmente.
Interfaz fácil de usar para una fácil personalización e integración: fácil de ajustar el modelo de código abierto o de código cerrado que desea elegir.

Enfoque e implementación:

Descripción general

La funcionalidad central gira en torno a las grabaciones de reuniones de procesamiento enviadas a través de la página de inicio de la aplicación web. Una vez que se envía una grabación, se inicia una tarea de fondo utilizando el apio, que realiza dos operaciones principales: conversión del habla a texto y las actas de generación de la reunión del texto convertido.

Implementación

El diagrama de flujo que ha compartido contornos un proceso detallado para manejar y procesar archivos multimedia, particularmente centrado en las entradas de audio y video para generar transcripciones y resúmenes. Desglosemos cada paso y describamos las soluciones de alto nivel involucradas en este flujo de trabajo:

1. Subir el archivo multimedia

Tipos de medios : Admite archivos MP3, WAV, MP4.
Acción : los usuarios cargan sus archivos multimedia al sistema.

2. Async Loop para notificación en tiempo real

Propósito : mantener informados a los usuarios sobre el estado de su carga y procesamiento.
Implementación : use una API de notificación asíncrona para enviar actualizaciones en tiempo real al usuario.

3. Lea el archivo cargado

Acción : el sistema lee el archivo cargado para determinar el tipo y el contenido.

4. Ramificación para audio y video

Audio :
- Convertir a 16 kHz : estandarizar la frecuencia de muestreo de audio para un procesamiento consistente.
- Transcripción : Convertir el discurso de audio en texto.
Video :
- Extraiga audio y marcos (1 cuadro/segundo) : pista de audio separada y marcos de video para procesar.
- Resumen corto por cuadro : genere un breve resumen para cada marco extraído.

5. Une todo el resumen corto y cree la transcripción principal (para video)

Acción : Combine todos los resúmenes breves en una única transcripción integral del contenido de video.

6. dividido si número de token> 4000

Propósito : Manejar las limitaciones del modelo de lenguaje de procesamiento que podría tener un límite de entrada de token máximo.
Implementación : si la transcripción excede el límite del token, divida el contenido en piezas manejables.

7. Modelo de idioma de mamá recursivo

Genere Video Mom (actas de reunión) : si la entrada es un video, genere un resumen detallado o minutos de la transcripción.
Procesamiento recursivo : para contenido más largo, resume recursivamente para condensar la información de manera efectiva.

8. Resumen generado y mamá

Acción : produce un resumen final y actas del documento de reunión basado en el texto transcrito y procesado.

9. Fusionar tanto mamá como una nueva mamá

Propósito : Combine resúmenes de diferentes fragmentos (si se divide anteriormente) en un documento completo completo.

10. Notificación de la finalización del proceso

Integración con API de notificación : informe al usuario que el procesamiento está completo y proporciona acceso a los resúmenes generados o documentos de MOM.

Diagrama de flujo

Diagrama de flujo de bucle de preparación de datos

Pila técnica:

Back-end : Python, Flask
Cola de tareas asincrónicas : Redis, apio
Speech-to-Text : Whisper, más rápido, Distil-Whisper
LLM para el procesamiento de texto : Phi3, Gemma 2, Llama 3
Frontend : HTML, CSS, JavaScript

Casos de uso y aplicaciones: ✅

Reuniones corporativas : mejora la productividad al proporcionar minutos rápidos y precisos para varias reuniones corporativas, reuniones de la junta y discusiones de equipo.
Instituciones educativas : útiles para profesores y estudiantes para transcribir y resumir conferencias, seminarios y discusiones grupales.
Campos legales y médicos : ayuda a documentar con precisión los procedimientos legales, las entrevistas y las consultas de los pacientes.
Accesibilidad : ayuda a las personas con discapacidades, especialmente a aquellos que tienen dificultades para tomar notas, al proporcionar una forma automatizada de capturar y resumir el contenido hablado.
Cobertura de eventos : útil para periodistas y organizadores de eventos para transcribir discursos, presentaciones y discusiones de paneles, ayudando en la creación de informes y la documentación del evento.

Alcance y mejoras futuras :?

Integración con herramientas de videoconferencia para la captura de grabación directa.
Soporte de varios idiomas para la conversión de voz a texto.
Características de resumen mejoradas adaptadas a tipos de reuniones específicos (por ejemplo, estrategia técnica, comercial).
Capacidades de transcripción y resumen en tiempo real.
Opciones de personalización del usuario para formatear las actas.

Muestra de capturas de pantalla de la aplicación:

Pantalla de inicio.

Captura de pantalla 1

Nuevas actas de diálogo de reuniones

Captura de pantalla 2

Sube un archivo de video/audio.

Captura de pantalla 3

Centro de notificaciones: comenzó a procesar

Captura de pantalla 4

Centro de notificaciones: en actualizaciones en tiempo real de Prgress

Captura de pantalla 5

Centro de notificaciones: procesamiento completo

Captura de pantalla 6

Página de actas finales de reunión

Captura de pantalla 7

Centro de notificaciones: estado de archivo múltiple

Captura de pantalla 8

Centro de notificaciones: estado de archivo múltiple

Captura de pantalla 9

Centro de notificaciones: estado de archivo múltiple

Captura de pantalla 10

Ejecutar la herramienta localmente :?

Requisitos previos

Antes de continuar, asegúrese de tener lo siguiente instalado:

Ubuntu 22.04 o más reciente.
Python (v3.10 o superior)
Una herramienta de entorno virtual como virtualenv o venv .

Instalación y configuración:

Solución de problemas: ?

Asegúrese de que todas las variables de entorno requeridas por la aplicación y el apio estén correctamente establecidas.
Verifique los mensajes de error en las salidas de terminales de matraz y apio.
Asegúrese de que las versiones de Python y los paquetes en requirements.txt sean compatibles.

Fase 2 - Transcripciones en tiempo real: ⏭️

En la fase 2 de nuestro proyecto, planeamos habilitar la transcripción de reuniones en tiempo real. ¡Únase a nosotros para dar forma al futuro de las reuniones eficientes y colaborativas!

Mantente actualizado:

? Sígueme para obtener actualizaciones sobre el desarrollo de la Fase 2 y otras mejoras para que sus reuniones sean aún más productivas.

Contribuciones bienvenidas:

? ‍ Alentando las contribuciones de la comunidad a hacer de esta herramienta un cambio de juego para las reuniones en todas partes. ¡Contribuya sus ideas y experiencia para ayudarnos a lograr la transcripción en tiempo real!

Expandir

Información adicional

Versión 1.0.0
Tipo Datos del sitio web
Fecha de actualización 2025-07-05
tamaño 4.98MB
Proviene de Github

Aplicaciones relacionadas

TensorRT LLM

2024-11-10
Compañía de héroes: Cuentos de valor

2022-09-04
Age of Mythology: El cuento del dragón

2022-08-29
44 minutos en pesadilla

2022-08-02
20 minutos hasta el amanecer

2022-07-26
Sistema de gestión de conferencias Roark Meeting

2012-06-05

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Twitter Sentiment Analysis on Flask App

Datos del sitio web

1.0.0
data science app road accident analysis

Datos del sitio web

1.0.0
static web apps cli

Datos del sitio web

v2.0.2
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo