ดาวน์โหลด LLM Minutes of Meeting - LLM Minutes of Meeting ดาวน์โหลด

LLM Minutes of Meeting

ข้อมูลเว็บไซต์

1.0.0

ดาวน์โหลด

การประชุม LLM-minutes

สารบัญ

ซีเนียร์ไม่	หัวข้อ	การเชื่อมโยง
0.	บทนำและ "ทำไม" ของโครงการ	ลิงค์จะมาที่นี่
1.	การตั้งค่าและการติดตั้ง	ลิงค์จะมาที่นี่
2.	คุณสมบัติ	ลิงค์อื่น
3.	การสาธิตและภาพหน้าจอแอปพลิเคชัน	ลิงค์อื่น
4.	แนวทางและการดำเนินการ*	ลิงค์อื่น
5.	การอัปเดตล่าสุดและทิศทางในอนาคต	ลิงค์อื่น
6.	ผลงาน	ลิงค์อื่น
7.	ปัญหา/การแก้ไขปัญหา	ลิงค์อื่น

0. บทนำและ "ทำไม" ของโครงการ

การประชุมนาที AI Image

วัตถุประสงค์หลักของโครงการนี้คือการแสดงความสามารถของ NLP & LLM ในการสรุปการประชุมที่ยาวนานอย่างรวดเร็วและช่วยคุณและองค์กรของคุณโดยอัตโนมัติในการมอบหมายนาทีการประชุม (MOM) อีเมล ใช้วิธีการขั้นตอนระดับสูง 2 ขั้นตอนที่ขั้นตอนที่ 1 สอดคล้องกับการแปลงไฟล์เสียง/วิดีโอใด ๆ เป็นบทสนทนาข้อความ ขั้นตอนที่ 2 ใช้ข้อความที่ผลิตโดยขั้นตอนที่ 1 และสร้างรายงานการประชุมและบันทึกสรุปโดยละเอียด นาทีการประชุมเหล่านี้จะเป็นข้อความที่แก้ไขได้ เมื่อคุณทำแม่เสร็จแล้วคุณสามารถใช้มันเพิ่มเติมตามความต้องการของคุณ

วัตถุประสงค์ระยะยาวสำหรับพื้นที่เก็บข้อมูลนี้คือการพัฒนาแอพพลิเคชั่นเว็บ Python แบบเรียลไทม์ซึ่งสามารถเข้าร่วมการประชุมสำหรับคุณและให้คุณแม่เมื่อสิ้นสุดการประชุม ทำตามขั้นตอนของทารกและพยายามไปสู่ระยะยาวโดยเริ่มต้นวัตถุประสงค์ระยะสั้น

สำหรับข้อมูลของคุณ: ฉันกำลังทำงานเกี่ยวกับการปรับแต่ง LLM และการพัฒนาที่กำหนดเอง โปรดอดทนในขณะที่โครงการทั้งหมดมีเสถียรภาพอย่างสมบูรณ์ ฉันจะเพิ่มรหัสการฝึกอบรมและการอนุมานเมื่อเสร็จสิ้น ทำที่เก็บนี้หากคุณต้องการทราบการอัปเดตล่าสุด - ขอบคุณเวลาของคุณ

1. การตั้งค่าและการติดตั้ง

ก่อนดำเนินการตรวจสอบให้แน่ใจว่าคุณติดตั้งดังต่อไปนี้:

Ubuntu 22.04 หรือล่าสุด
Python (v3.10 หรือสูงกว่า)
เครื่องมือสภาพแวดล้อมเสมือนจริงเช่น virtualenv หรือ venv

มาเริ่มขั้นตอนการติดตั้งกันเลย

โคลนที่เก็บ GitHub
เปิดเทอร์มินัลหรือคำสั่งของคุณและนำทางไปยังไดเรกทอรีที่คุณต้องการโคลนที่เก็บ จากนั้นเรียกใช้:
```
git clone https://github.com/inboxpraveen/LLM-Minutes-of-Meeting
cd LLM-Minutes-of-Meeting
```

ติดตั้งข้อกำหนด

เป็นวิธีปฏิบัติที่ดีในการสร้างสภาพแวดล้อมเสมือนจริงก่อนที่จะติดตั้งการพึ่งพาเพื่อหลีกเลี่ยงความขัดแย้งที่อาจเกิดขึ้นกับโครงการ Python อื่น ๆ หากคุณใช้ virtualenv คุณสามารถตั้งค่าสภาพแวดล้อมใหม่ได้ดังนี้:

 # # Create a python virtual environment and activate it.
# Install the required packages after activating:
pip install -r requirements.txt

# # After this, let's install Llama-Cpp-Python binding which will be used to interact with LLMs. 

# # Run the following line if you are using it on a CPU.
pip install llama-cpp-python

# # Run the following line if you are using GPU (T4, A100, A10, or H100), or any Nvidia Cuda based GPU Drivers.
CMAKE_ARGS= " -DLLAMA_CUDA=on " pip install llama-cpp-python

# # If you are on Mac or any other GPU types, you can refer the following links and setup the Llama-Cpp-Python

https://llama-cpp-python.readthedocs.io/en/stable/ # installation-configuration

https://llama-cpp-python.readthedocs.io/en/stable/install/macos/

การตั้งค่า RabbitMQ & การประมวลผลงานพื้นหลังคี่
ใช้ลิงค์ต่อไปนี้เพื่อตั้งค่า RabbitMQ บนเครื่องของคุณ ทำตามคำแนะนำจนถึง ขั้นตอนที่ 5 และบันทึก admin-username และ password ของคุณ
ตั้งค่า RabbitMQ บน Ubuntu 22.04
เมื่อคุณตั้งค่า RabbitMQ สำเร็จแล้วตั้งค่า Redis-Server และ Celery ใช้คำสั่งต่อไปนี้เพื่อตั้งค่าและติดตั้ง
```
sudo apt-get update -y
# # Try with apt-get. If it does not install, then run with apt. 
sudo apt-get install redis-server -y 
# # If the above does not work, try this:
sudo apt install redis-server -y
```
เรียกใช้งานคื่นฉ่าย

ก่อนอื่นให้เริ่มแอปพลิเคชัน Flask:

 cd /path/to/project/

จากนั้นเปิดไฟล์ app.py ภายในตัวแก้ไขรหัสของคุณและแก้ไขบรรทัดต่อไปนี้

 Line 18 :     broker = 'amqp://<user>:<password>$@localhost:5672//'

## Update <user> with "your-admin-username".
## Update <password> with "your-admin-password"
## Eg: broker='amqp://admin:hello_world$@localhost:5672//'

### IMPORTANT NOTE: If your password contains '@' symbol, you will need to convert it because it is the default delimiter in broker settings. Example if your password has @ symbol inside it would be. 
## broker='amqp://admin:hello%40world$@localhost:5672//'  -- where the original password was "hello@world", we represent it as 'hello%40world'

หลังจากที่คุณอัปเดตไฟล์แล้วคุณจะเรียกใช้ไฟล์ setup.py เพื่อตั้งค่าไดเรกทอรีและดาวน์โหลดรุ่น หากคุณต้องการเปลี่ยนการกำหนดค่าของรุ่นที่คุณต้องการใช้คุณสามารถเปลี่ยนได้อย่างเหมาะสมตามขนาดโครงสร้างพื้นฐานและความจุของระบบ ตารางต่อไปนี้แสดงให้เห็นว่ารุ่นใดที่เราสนับสนุนในโครงการนี้ แต่เราจะเพิ่มการสนับสนุน LLMS ใหม่เนื่องจากเราเห็นว่าเหมาะสมและโอเพนซอร์ซ

รองรับแบบจำลองการพูด

ชื่อนางแบบ	ขนาดรุ่น	ต้องการหน่วยความจำ (RAM หรือ VRAM)
distil-whisper/distil-v3	3.1 GB	4 GB
distil-whisper/distil-v2	3.1 GB	4 GB
distil-whisper/distil-medium.en	1.6 GB	2 GB
distil-whisper/distil-small.en	680 MB	900 MB
Openai/Whisper-Large-V3	6.2 GB	7.5 GB
Openai/Whisper-Large-V2	6.2 GB	7.5 GB
Openai/Whisper-Large-V1	6.2 GB	7.5 GB
Openai/Whisper-Medium	3.2 GB	4.5 GB
Openai/Whisper-Small (ค่าเริ่มต้น)	980 MB	1.7 GB

รองรับ LLMS

ชื่อนางแบบ	ขนาดรุ่น	ต้องการหน่วยความจำ
QuantFactory/Phi-3-Mini-4K-Instruct-Gguf (ค่าเริ่มต้น)	1 GB - 8 GB	2 GB - 14 GB
QuantFactory/Phi-3-MINI-128K-Instruct-Gguf	1 GB - 8 GB	2.5 GB - 16 GB
Bartowski/Phi-3-Medium-128K-Instruct-Gguf	3 GB - 14 GB	6 GB - 18 GB

คุณจะต้องแก้ไขไฟล์ global_varibables.py ด้วยชื่อรุ่นที่คุณเลือกจากนั้นเรียกใช้ไฟล์ setup.py ซึ่งจะลงโมเดลที่คุณเลือกโดยอัตโนมัติ

 Line 32 : DEFAULT_SPEECH_MODEL = "openai/whisper-small"
...
Line 46 : DEFAULT_SUMMARY_MODEL = ( "QuantFactory/Phi-3-mini-4k-instruct-GGUF" , "Phi-3-mini-4k-instruct.Q5_0.gguf" )


### After update the above lines as per your need, run the setup.py
python setup . py

ในหน้าต่างเทอร์มินัลใหม่ (ตรวจสอบให้แน่ใจว่าสภาพแวดล้อมเสมือนจริงของคุณเปิดใช้งานที่นี่เช่นกัน) เริ่มต้นแอพและผู้ปฏิบัติงานคื่นฉ่าย:

python app.py # ensure your environment is activated

# and then in new terminal, run the following.
celery -A app.celery worker --loglevel=info -f celery.logs

อัปโหลดการบันทึกไปยังแบบฟอร์ม
เปิดเว็บเบราว์เซอร์ของคุณและนำทางไปยัง URL ของแอปพลิเคชัน Flask (โดยปกติจะ http://127.0.0.1:5000 ) ใช้อินเทอร์เฟซเพื่ออัปโหลดการบันทึกการประชุมของคุณ
รับสถานะล่าสุดและรอให้เสร็จสมบูรณ์
หลังจากอัปโหลดการบันทึกคุณสามารถตรวจสอบสถานะของการประมวลผล สิ่งนี้สามารถนำไปใช้เป็นหน้าสถานะหรือแถบความคืบหน้าในแอปพลิเคชันของคุณ รอจนกว่าการประมวลผลจะเสร็จสมบูรณ์
ดูรายงานการประชุมครั้งสุดท้ายของการประชุม (แม่)
เมื่อการประมวลผลเสร็จสมบูรณ์แอปพลิเคชันควรแสดงนาทีสุดท้ายของการประชุม คุณสามารถดูแก้ไข (หากมีคุณสมบัติ) และบันทึกแม่สำหรับการอ้างอิงของคุณ

2. ฟีเจอร์:

แปลงไฟล์เสียงและวิดีโอให้เป็นข้อความการถอดเสียงข้อความที่แม่นยำ: สิ่งเหล่านี้สามารถใช้เพื่อสรุปสร้างรายการการกระทำทำความเข้าใจกระแสงานและการวางแผนทรัพยากร
การเน้นคำหลักและการติดแท็กหัวข้อเพื่อการอ้างอิงอย่างรวดเร็ว: การแยกหัวข้อและการค้นหาเนื้อหาที่เกี่ยวข้องเพื่อข้ามผ่านการประชุมและฟังหัวข้อเฉพาะที่เป็นที่สนใจของคุณ
นาทีการส่งออกในรูปแบบต่าง ๆ รวมถึง PDF และข้อความธรรมดา: ช่วยให้คุณสามารถส่งออกการประชุมการประชุมสรุปหัวข้อและคำหลักรายการการดำเนินการ ฯลฯ ลงในเอกสารที่สามารถนำไปใช้ในการวางแผนโครงการและกรอบการจัดการ นอกจากนี้ยังช่วยลดความต้องการของคุณในการเขียนและสร้างแม่แบบด้วยตนเอง
อินเทอร์เฟซที่ใช้งานง่ายสำหรับการปรับแต่งและการรวมง่าย: ง่ายต่อการปรับแต่งซึ่งเคยเป็นแบบโอเพนซอร์ซหรือแบบปิดที่คุณต้องการเลือก

แนวทางและการดำเนินการ:

ภาพรวม

ฟังก์ชั่นหลักหมุนรอบการบันทึกการประชุมที่ส่งผ่านหน้าแรกของเว็บแอปพลิเคชัน เมื่อมีการส่งการบันทึกงานพื้นหลังจะเริ่มต้นโดยใช้คื่นฉ่ายซึ่งดำเนินการสองการดำเนินการหลัก: การแปลงคำพูดเป็นข้อความและการสร้างนาทีของการประชุมจากข้อความที่แปลง

การดำเนินการ

ผังงานที่คุณได้แชร์สรุปกระบวนการโดยละเอียดสำหรับการจัดการและประมวลผลไฟล์สื่อโดยเฉพาะอย่างยิ่งการมุ่งเน้นไปที่อินพุตเสียงและวิดีโอเพื่อสร้างการถอดความและบทสรุป มาแยกแต่ละขั้นตอนและอธิบายโซลูชันระดับสูงที่เกี่ยวข้องในเวิร์กโฟลว์นี้:

1. อัปโหลดไฟล์สื่อ

ประเภทสื่อ : รองรับไฟล์ MP3, WAV, MP4
การดำเนินการ : ผู้ใช้อัปโหลดไฟล์สื่อไปยังระบบ

2. async วนซ้ำสำหรับการแจ้งเตือนแบบเรียลไทม์

วัตถุประสงค์ : เพื่อแจ้งให้ผู้ใช้ทราบเกี่ยวกับสถานะของการอัปโหลดและการประมวลผล
การใช้งาน : ใช้ API การแจ้งเตือนแบบอะซิงโครนัสเพื่อส่งการอัปเดตแบบเรียลไทม์ไปยังผู้ใช้

3. อ่านไฟล์ที่อัปโหลด

การดำเนินการ : ระบบอ่านไฟล์ที่อัปโหลดเพื่อกำหนดประเภทและเนื้อหา

4. การแตกแขนงสำหรับเสียงและวิดีโอ

เสียง :
- แปลงเป็น 16 kHz : มาตรฐานอัตราตัวอย่างเสียงสำหรับการประมวลผลที่สอดคล้องกัน
- ถอดความ : แปลงคำพูดเสียงเป็นข้อความ
วิดีโอ :
- แยกเสียงและเฟรม (1 เฟรม/วินาที) : แยกเสียงแทร็กและวิดีโอสำหรับการประมวลผล
- สรุปสั้น ๆ ต่อเฟรม : สร้างสรุปสั้น ๆ สำหรับแต่ละเฟรมที่แยกออกมา

5. เข้าร่วมสรุปสั้น ๆ ทั้งหมดและสร้างการถอดความหลัก (สำหรับวิดีโอ)

การดำเนินการ : รวมบทสรุปสั้น ๆ ทั้งหมดลงในการถอดความเนื้อหาวิดีโอที่ครอบคลุมเพียงครั้งเดียว

6. แยกถ้าจำนวนโทเค็น> 4000

วัตถุประสงค์ : จัดการข้อ จำกัด ของรูปแบบภาษาการประมวลผลซึ่งอาจมีขีด จำกัด อินพุตโทเค็นสูงสุด
การใช้งาน : หากการถอดความเกินขีด จำกัด โทเค็นให้แบ่งเนื้อหาออกเป็นส่วนที่จัดการได้

7. รูปแบบภาษาแม่แบบเรียกซ้ำ

สร้างวิดีโอ Mom (นาทีของการประชุม) : หากอินพุตเป็นวิดีโอให้สร้างสรุปโดยละเอียดหรือนาทีจากการถอดความ
การประมวลผลแบบเรียกซ้ำ : สำหรับเนื้อหาที่ยาวขึ้นสรุปซ้ำเพื่อกลั่นตัวข้อมูลอย่างมีประสิทธิภาพ

8. สรุปที่สร้างขึ้นและแม่

การดำเนินการ : จัดทำสรุปขั้นสุดท้ายและรายงานการประชุมเอกสารการประชุมตามข้อความที่ถอดความและประมวลผล

9. รวมทั้งแม่และรับแม่ใหม่

วัตถุประสงค์ : รวมบทสรุปจากชิ้นส่วนที่แตกต่างกัน (ถ้าแยกก่อนหน้านี้) ลงในเอกสารที่ครอบคลุมขั้นสุดท้าย

10. การแจ้งเตือนกระบวนการเสร็จสิ้น

การรวมเข้ากับ API การแจ้งเตือน : แจ้งผู้ใช้ว่าการประมวลผลเสร็จสมบูรณ์และให้การเข้าถึงบทสรุปที่สร้างขึ้นหรือเอกสาร MOM

แผนภาพการไหล

แผนภาพการไหลของลูปการเตรียมข้อมูล

สแต็คทางเทคนิค:

back-end : Python, Flask
คิวงานแบบอะซิงโครนัส : Redis, Celery
คำพูดเป็นข้อความ : กระซิบ, เร็วขึ้น-เสียงกระซิบ, distil-whisper
LLM สำหรับการประมวลผลข้อความ : Phi3, Gemma 2, Llama 3
Frontend : HTML, CSS, JavaScript

ใช้กรณีและแอปพลิเคชัน: ✅

การประชุม บริษัท : เพิ่มประสิทธิภาพการผลิตโดยให้นาทีที่รวดเร็วและแม่นยำสำหรับการชุมนุมขององค์กรการประชุมคณะกรรมการและการอภิปรายเป็นทีม
สถาบันการศึกษา : มีประโยชน์สำหรับอาจารย์และนักเรียนในการถอดความและสรุปการบรรยายการสัมมนาและการอภิปรายกลุ่ม
สาขากฎหมายและการแพทย์ : ช่วยในการบันทึกการดำเนินคดีทางกฎหมายการสัมภาษณ์และการให้คำปรึกษาผู้ป่วยอย่างถูกต้อง
การเข้าถึง : ช่วยเหลือบุคคลที่มีความพิการโดยเฉพาะผู้ที่มีปัญหาในการจดบันทึกโดยให้วิธีอัตโนมัติในการจับและสรุปเนื้อหาที่พูด
ความครอบคลุมของเหตุการณ์ : มีประโยชน์สำหรับนักข่าวและผู้จัดงานในการถอดความสุนทรพจน์การนำเสนอและการอภิปรายแผงช่วยในการสร้างรายงานและเอกสารเหตุการณ์

ขอบเขตและการปรับปรุงในอนาคต:?

การรวมเข้ากับเครื่องมือการประชุมทางวิดีโอสำหรับการบันทึกการบันทึกโดยตรง
การสนับสนุนหลายภาษาสำหรับการแปลงคำพูดเป็นข้อความ
คุณลักษณะการสรุปขั้นสูงที่ปรับให้เหมาะกับประเภทการประชุมเฉพาะ (เช่นเทคนิคกลยุทธ์ธุรกิจ)
ความสามารถในการถอดความและการสรุปแบบเรียลไทม์
ตัวเลือกการปรับแต่งผู้ใช้สำหรับการจัดรูปแบบนาที

ตัวอย่างภาพหน้าจอของแอปพลิเคชัน:

หน้าจอหลัก

ภาพหน้าจอ 1

นาทีใหม่ของการสนทนาการประชุม

ภาพหน้าจอ 2

อัปโหลดไฟล์วิดีโอ/เสียง

ภาพหน้าจอ 3

ศูนย์แจ้งเตือน - เริ่มการประมวลผล

ภาพหน้าจอ 4

ศูนย์แจ้งเตือน - ในการอัปเดตเรียลไทม์ Prgress

ภาพหน้าจอ 5

ศูนย์แจ้งเตือน - การประมวลผลที่เสร็จสมบูรณ์

ภาพหน้าจอ 6

นาทีสุดท้ายของหน้าการประชุม

ภาพหน้าจอ 7

ศูนย์แจ้งเตือน - สถานะไฟล์หลายไฟล์

ภาพหน้าจอ 8

ศูนย์แจ้งเตือน - สถานะไฟล์หลายไฟล์

ภาพหน้าจอ 9

ศูนย์แจ้งเตือน - สถานะไฟล์หลายไฟล์

ภาพหน้าจอ 10

การรันเครื่องมือในเครื่อง:?

ข้อกำหนดเบื้องต้น

ก่อนดำเนินการตรวจสอบให้แน่ใจว่าคุณติดตั้งดังต่อไปนี้:

Ubuntu 22.04 หรือล่าสุด
Python (v3.10 หรือสูงกว่า)
เครื่องมือสภาพแวดล้อมเสมือนจริงเช่น virtualenv หรือ venv

การติดตั้งและการตั้งค่า:

การแก้ไขปัญหา:?

ตรวจสอบให้แน่ใจว่าตัวแปรสภาพแวดล้อมทั้งหมดที่ต้องการโดยแอปพลิเคชันและคื่นฉ่ายได้รับการตั้งค่าอย่างถูกต้อง
ตรวจสอบข้อความแสดงข้อผิดพลาดใด ๆ ในเอาต์พุต Flask และ Celery Terminal
ตรวจสอบให้แน่ใจว่ารุ่น Python และแพ็คเกจใน requirements.txt เข้ากันได้

ขั้นตอนที่ 2 - การถอดความแบบเรียลไทม์: ⏭

ในระยะที่ 2 ของโครงการของเราเราวางแผนที่จะเปิดใช้งานการถอดความการประชุมแบบเรียลไทม์ เข้าร่วมกับเราในการกำหนดอนาคตของการประชุมที่มีประสิทธิภาพและร่วมมือกัน!

อัปเดตอยู่:

- ติดตามฉันสำหรับการอัปเดตเกี่ยวกับการพัฒนาระยะที่ 2 และการปรับปรุงอื่น ๆ เพื่อให้การประชุมของคุณมีประสิทธิผลมากขึ้น

ยินดีต้อนรับผลงาน:

? ‍ การสนับสนุนการมีส่วนร่วมจากชุมชนเพื่อให้เครื่องมือนี้เป็นตัวเปลี่ยนเกมสำหรับการประชุมทุกที่ มีส่วนร่วมในความคิดและความเชี่ยวชาญของคุณเพื่อช่วยให้เราบรรลุการถอดความแบบเรียลไทม์!

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ข้อมูลเว็บไซต์
เวลาอัปเดต 2025-07-05
ขนาด 4.98MB
มาจาก Github

แอปที่เกี่ยวข้อง

TensorRT LLM

2024-11-10
Company of Heroes: Tales of Valor

2022-09-04
ยุคแห่งตำนาน: เรื่องราวของมังกร

2022-08-29
44 นาทีในฝันร้าย

2022-08-02
20 นาทีก่อนรุ่งสาง

2022-07-26
ระบบจัดการประชุม Roark Meeting

2012-06-05

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Twitter Sentiment Analysis on Flask App

ข้อมูลเว็บไซต์

1.0.0
data science app road accident analysis

ข้อมูลเว็บไซต์

1.0.0
static web apps cli

ข้อมูลเว็บไซต์

v2.0.2
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด