LLM Minutes of Meeting 다운로드 -LLM LLM Minutes of Meeting 소스 코드 다운로드

LLM Minutes of Meeting

웹사이트 데이터

1.0.0

다운로드

LLM- 미팅

Sr. No.	주제	링크
0.	프로젝트의 소개 및 "왜"	링크가 여기에 올 것입니다
1.	설정 및 설치	링크가 여기에 올 것입니다
2.	특징	다른 링크
3.	데모 및 응용 프로그램 스크린 샷	다른 링크
4.	접근 및 구현*	다른 링크
5.	최근 업데이트 및 향후 방향	다른 링크
6.	기여	다른 링크
7.	문제/문제 해결	다른 링크

0. 프로젝트의 소개 및 "왜"

회의록 AI 이미지

이 프로젝트의 주요 목표는 NLP & LLM의 오랜 회의를 신속하게 요약하고 귀하와 귀하의 조직이 회의록 (MOM) 이메일을 위임하는 작업을 자동화하는 데 도움이되는 NLP & LLM의 기능을 보여주는 것입니다. 1 단계가 오디오/비디오 파일을 텍스트 대화로 변환하는 데 해당하는 높은 레벨 2 단계 접근 방식을 사용합니다. 2 단계는 1 단계에서 생성 된 텍스트를 사용하고 회의록 및 자세한 요약 노트를 생성합니다. 이 회의록은 편집 가능한 텍스트가 될 것입니다. 엄마를 마무리하면 요구 사항에 따라 더 사용할 수 있습니다.

이 저장소의 장기 목표는 또한 회의에 참석할 수있는 실시간 파이썬 웹 응용 프로그램을 개발하고 회의가 끝날 때 엄마를 제공하는 것입니다. 아기 발걸음을 내딛고 단기 목표를 시작하여 장기적으로 가려고 노력합니다.

귀하의 정보를 위해 : 저는 맞춤형 LLM 및 개발을 미세 조정하고 있습니다. 전체 프로젝트가 완전히 안정적 인 동안 인내하십시오. 완료되면 교육 및 추론 코드를 추가하겠습니다. 최신 업데이트를 알아야 할 경우이 저장소를 수행하십시오. ? 당신의 시간에 감사드립니다.

1. 설정 및 설치

진행하기 전에 다음과 같은 설치를했는지 확인하십시오.

우분투 22.04 또는 최신.
파이썬 (v3.10 이상)
virtualenv 또는 venv 와 같은 가상 환경 도구.

지금 설치 단계를 시작합시다.

Github 저장소를 복제하십시오
터미널 또는 명령 프롬프트를 열고 저장소를 복제하려는 디렉토리로 이동하십시오. 그런 다음 실행 :
```
git clone https://github.com/inboxpraveen/LLM-Minutes-of-Meeting
cd LLM-Minutes-of-Meeting
```

요구 사항을 설치하십시오

다른 Python 프로젝트와의 잠재적 충돌을 피하기 위해 종속성을 설치하기 전에 가상 환경을 조성하는 것이 좋습니다. virtualenv 사용하는 경우 다음과 같이 새로운 환경을 설정할 수 있습니다.

 # # Create a python virtual environment and activate it.
# Install the required packages after activating:
pip install -r requirements.txt

# # After this, let's install Llama-Cpp-Python binding which will be used to interact with LLMs. 

# # Run the following line if you are using it on a CPU.
pip install llama-cpp-python

# # Run the following line if you are using GPU (T4, A100, A10, or H100), or any Nvidia Cuda based GPU Drivers.
CMAKE_ARGS= " -DLLAMA_CUDA=on " pip install llama-cpp-python

# # If you are on Mac or any other GPU types, you can refer the following links and setup the Llama-Cpp-Python

https://llama-cpp-python.readthedocs.io/en/stable/ # installation-configuration

https://llama-cpp-python.readthedocs.io/en/stable/install/macos/

설치 Rabbitmq & Celery 배경 작업 처리
다음 링크를 사용하여 컴퓨터에서 RabbitMQ를 설정하십시오. 5 단계 까지 지시를 따르고 admin-username 및 password 저장하십시오.
Ubuntu 22.04의 설치 RabbitMQ
RabbitMQ를 성공적으로 설정 한 다음 Redis-Server 및 Celery를 설정하십시오. 다음 명령을 사용하여 설정하고 설치하십시오.
```
sudo apt-get update -y
# # Try with apt-get. If it does not install, then run with apt. 
sudo apt-get install redis-server -y 
# # If the above does not work, try this:
sudo apt install redis-server -y
```
응용 프로그램 실행 및 병렬 실행 셀러리 작업

먼저 플라스크 응용 프로그램을 시작하십시오.

 cd /path/to/project/

그런 다음 app.py 파일 내부 코드 편집기를 열고 다음 줄을 수정하십시오.

 Line 18 :     broker = 'amqp://<user>:<password>$@localhost:5672//'

## Update <user> with "your-admin-username".
## Update <password> with "your-admin-password"
## Eg: broker='amqp://admin:hello_world$@localhost:5672//'

### IMPORTANT NOTE: If your password contains '@' symbol, you will need to convert it because it is the default delimiter in broker settings. Example if your password has @ symbol inside it would be. 
## broker='amqp://admin:hello%40world$@localhost:5672//'  -- where the original password was "hello@world", we represent it as 'hello%40world'

파일을 업데이트 한 후 setup.py 파일을 설정하여 디렉토리를 설정하고 모델의 다운로드합니다. 사용하려는 모델의 구성을 변경하려면 인프라 크기 및 시스템 용량에 따라 모델을 적절하게 변경할 수 있습니다. 다음 표는 현재이 프로젝트에서 어떤 모델을 지원하는지 보여 주지만, 우리는 그들이 적합하고 오픈 소스를 볼 때 새로운 LLMS 지원을 추가 할 것입니다.

스피치 모델이 지원됩니다

모델 이름	모델 크기	메모리 필수 (RAM 또는 VRAM)
Distil-Whisper/Distil-Large-V3	3.1 GB	4GB
Distil-Whisper/Distil-Large-V2	3.1 GB	4GB
Distil-Whisper/Distil-Medium.en	1.6GB	2GB
Distil-Whisper/Distil-Small.en	680MB	900MB
Openai/Whisper-Large-V3	6.2GB	7.5GB
Openai/Whisper-Large-V2	6.2GB	7.5GB
Openai/Whisper-Large-V1	6.2GB	7.5GB
Openai/Whisper-Medium	3.2GB	4.5GB
Openai/Whisper-Small (기본값)	980 MB	1.7GB

LLMS 지원

모델 이름	모델 크기	메모리가 필요합니다
QuantFactory/PHI-3-MINI-4K-Instruct-Gguf (기본값)	1GB -8GB	2GB -14GB
QuantFactory/Phi-3-Mini-128k-instruct-gguf	1GB -8GB	2.5GB -16GB
Bartowski/Phi-3-Medium-128k-instruct-Gguf	3GB -14GB	6GB -18GB

선택한 모델 이름으로 global_varibables.py 파일을 수정 한 다음 선택한 모델을 자동으로 다운하는 setup.py 파일을 실행해야합니다.

 Line 32 : DEFAULT_SPEECH_MODEL = "openai/whisper-small"
...
Line 46 : DEFAULT_SUMMARY_MODEL = ( "QuantFactory/Phi-3-mini-4k-instruct-GGUF" , "Phi-3-mini-4k-instruct.Q5_0.gguf" )


### After update the above lines as per your need, run the setup.py
python setup . py

새로운 터미널 창에서 (여기에서 가상 환경이 활성화되어 있는지 확인) 앱 및 셀러리 작업자를 시작하십시오.

python app.py # ensure your environment is activated

# and then in new terminal, run the following.
celery -A app.celery worker --loglevel=info -f celery.logs

녹음을 형성합니다
웹 브라우저를 열고 플라스크 애플리케이션의 URL (일반적으로 http://127.0.0.1:5000 )으로 이동하십시오. 인터페이스를 사용하여 회의 기록을 업로드하십시오.
최신 상태를 얻고 완료 될 때까지 기다리십시오
녹음을 업로드 한 후 처리 상태를 확인할 수 있습니다. 응용 프로그램의 상태 페이지 또는 진행률 표시 줄로 구현 될 수 있습니다. 처리가 완료 될 때까지 기다리십시오.
최종 처리 된 회의 회의록 (엄마) 참조
처리가 완료되면 응용 프로그램은 회의의 마지막 시간을 표시해야합니다. 당신은보기, 편집 (기능을 사용할 수있는 경우)을보고, 참조를 위해 엄마를 저장할 수 있습니다.

2. 기능 :

오디오 및 비디오 파일을 정확한 텍스트 성적표로 쉽게 변환합니다. 또한 요약, 작업 항목을 생성, 작업 흐름 이해 및 리소스 계획에도 사용될 수도 있습니다.
빠른 참조를위한 키워드 하이라이트 및 주제 태그 : 주제를 추출하고 관련 내용을 찾아 회의를 건너 뛰고 관심있는 특정 주제 만 듣습니다.
PDF 및 일반 텍스트를 포함한 다양한 형식의 수출 시간 : 회의 성적표, 요약, 주제 및 키워드, 액션 항목 등을 프로젝트 계획 및 관리 프레임 워크에 활용할 수있는 문서로 내보낼 수 있습니다. 또한 템플릿을 수동으로 작성하고 생성 할 필요가 없습니다.
쉽게 사용자 정의 및 통합을위한 사용자 친화적 인 인터페이스 : 선택하려는 오픈 소스 또는 폐쇄 소스 모델을 쉽게 조정하기 쉽습니다.

접근 및 구현 :

개요

핵심 기능은 웹 응용 프로그램의 홈페이지를 통해 제출 된 회의 기록 처리와 관련이 있습니다. 녹음이 제출되면 셀러리를 사용하여 배경 작업이 시작되며, 이는 두 가지 주요 작업, 즉 음성-텍스트 변환 및 변환 된 텍스트에서 회의 시간을 생성하는 두 가지 주요 작업을 수행합니다.

구현

공유 한 플로우 차트는 미디어 파일을 처리하고 처리하기위한 세부 프로세스, 특히 오디오 및 비디오 입력에 중점을 두어 전사 및 요약을 생성합니다. 각 단계를 세분화 하고이 워크 플로와 관련된 고급 솔루션을 설명해 봅시다.

1. 미디어 파일 업로드

미디어 유형 : MP3, WAV, MP4 파일을 지원합니다.
조치 : 사용자는 미디어 파일을 시스템에 업로드합니다.

2. 실시간 알림을위한 비동기 루프

목적 : 사용자에게 업로드 및 처리 상태에 대해 정보를 제공합니다.
구현 : 비동기식 알림 API를 사용하여 사용자에게 실시간 업데이트를 보냅니다.

3. 업로드 된 파일을 읽습니다

조치 : 시스템은 업로드 된 파일을 읽고 유형과 컨텐츠를 결정합니다.

4. 오디오 및 비디오 분기

오디오 :
- 16kHz로 변환 : 일관된 처리를 위해 오디오 샘플 속도를 표준화하십시오.
- 전사 : 오디오 음성을 텍스트로 변환하십시오.
동영상 :
- 오디오 및 프레임 추출 (1 프레임/초) : 처리를 위해 오디오 트랙과 비디오 프레임을 별도로 따릅니다.
- 프레임 당 짧은 요약 : 추출 된 각 프레임에 대한 간단한 요약을 생성합니다.

5. 모든 짧은 요약에 가입하고 주요 전사를 만듭니다 (비디오 용)

조치 : 모든 짧은 요약을 비디오 컨텐츠의 단일 포괄적 인 전사로 결합하십시오.

6. 토큰 수> 4000 인 경우 분할

목적 : 최대 토큰 입력 한계를 가질 수있는 처리 언어 모델의 핸들 제한.
구현 : 전사가 토큰 제한을 초과하면 컨텐츠를 관리 가능한 부품으로 분할하십시오.

7. 재귀 엄마 언어 모델

비디오 엄마 생성 (회의록) : 입력이 비디오 인 경우 세부 요약 또는 전사에서 분을 생성하십시오.
재귀 처리 : 더 긴 콘텐츠의 경우 재귀 적으로 정보를 효과적으로 압축하도록 요약하십시오.

8. 생성 된 요약 및 엄마

조치 : 전사 및 처리 된 텍스트를 기반으로 한 회의 문서의 최종 요약 및 회의록을 작성하십시오.

9. 두 엄마를 합쳐서 새로운 엄마를 얻으십시오

목적 : 다른 청크의 요약 (이전에 분할 된 경우)을 최종 포괄적 인 문서로 결합하십시오.

10. 프로세스 완료 알림

알림 API와의 통합 : 처리가 완료되었음을 사용자에게 알리고 생성 된 요약 또는 엄마 문서에 액세스 할 수 있습니다.

흐름도

데이터 준비 루프 흐름도

기술 스택 :

백엔드 : 파이썬, 플라스크
비동기 작업 대기열 : Redis, Celery
Speech-to-Text : Whisper, 더 빠른 창자, Distil-Whisper
LLM 텍스트 처리 : PHI3, Gemma 2, Llama 3
프론트 엔드 : HTML, CSS, JavaScript

사용 사례 및 응용 프로그램 : applic

기업 회의 : 다양한 기업 모임, 이사회 회의 및 팀 토론에 빠르고 정확한 시간을 제공하여 생산성을 향상시킵니다.
교육 기관 : 강사와 학생들이 강의, 세미나 및 그룹 토론을 전사하고 요약하는 데 유용합니다.
법률 및 의료 분야 : 법적 절차, 인터뷰 및 환자 상담을 정확하게 문서화하는 데 도움이됩니다.
접근성 : 장애가있는 개인, 특히 음표 컨텐츠를 캡처하고 요약하는 자동화 된 방법을 제공함으로써 장애가있는 사람들을 지원합니다.
이벤트 커버리지 : 언론인 및 이벤트 주최자가 보고서 작성 및 이벤트 문서를 지원하는 연설, 프레젠테이션 및 패널 토론을 전사하는 데 유용합니다.