LLM Minutes of Meeting Unduh - LLM Minutes of Meeting

LLM Minutes of Meeting

Data situs web

1.0.0

Unduh

LLM-Minutes-of-Meeting

Daftar isi

Sr. No.	Topik	Link
0.	Pendahuluan dan "Mengapa" dari proyek tersebut	Tautan akan datang ke sini
1.	Pengaturan dan Instalasi	Tautan akan datang ke sini
2.	Fitur	Tautan lain
3.	Demo dan screenshot aplikasi	Tautan lain
4.	Pendekatan dan Implementasi*	Tautan lain
5.	Pembaruan terbaru dan arah masa depan	Tautan lain
6.	Kontribusi	Tautan lain
7.	Masalah/Pemecahan Masalah	Tautan lain

0. Pendahuluan dan "Mengapa" dari Proyek

Risalah Rapat Gambar AI

Tujuan utama dari proyek ini adalah untuk memamerkan kemampuan NLP & LLM untuk dengan cepat merangkum pertemuan panjang dan membantu Anda dan organisasi Anda mengotomatiskan tugas mendelegasikan email risalah rapat (MOM). Ini menggunakan pendekatan Level 2 Langkah Tinggi di mana Langkah 1 sesuai dengan konversi file audio/video apa pun menjadi percakapan teks. Langkah 2 Memanfaatkan teks yang diproduksi oleh Langkah 1 dan menghasilkan menit pertemuan dan catatan ringkasan terperinci. Risalah pertemuan ini akan menjadi bagian teks yang dapat diedit. Setelah Anda menyelesaikan ibu, Anda dapat menggunakannya lebih lanjut sesuai kebutuhan Anda.

Tujuan jangka panjang untuk repositori ini juga untuk mengembangkan aplikasi web python waktu nyata yang dapat menghadiri pertemuan untuk Anda dan juga memberi Anda ibu di akhir pertemuan. Mengambil langkah bayi dan mencoba mencapai jangka panjang dengan memulai tujuan jangka pendek.

Untuk informasi Anda: Saya sedang mengerjakan LLM dan pengembangan kustom yang menyempurnakan. Harap bersabar sementara seluruh proyek benar -benar stabil. Saya akan menambahkan pelatihan & kode inferensi setelah selesai. Lakukan repositori ini jika Anda perlu mengetahui pembaruan terbaru. ? Hargai waktu Anda.

1. Pengaturan dan instalasi

Sebelum melanjutkan, pastikan Anda menginstal berikut:

Ubuntu 22.04 atau terbaru.
Python (v3.10 atau lebih tinggi)
Alat lingkungan virtual seperti virtualenv atau venv .

Mari kita mulai langkah instalasi sekarang.

Klon Repositori GitHub
Buka terminal atau prompt perintah Anda dan navigasikan ke direktori tempat Anda ingin mengkloning repositori. Kemudian jalankan:
```
git clone https://github.com/inboxpraveen/LLM-Minutes-of-Meeting
cd LLM-Minutes-of-Meeting
```

Pasang persyaratan

Ini adalah praktik yang baik untuk menciptakan lingkungan virtual sebelum memasang dependensi untuk menghindari potensi konflik dengan proyek Python lainnya. Jika Anda menggunakan virtualenv , Anda dapat mengatur lingkungan baru sebagai berikut:

 # # Create a python virtual environment and activate it.
# Install the required packages after activating:
pip install -r requirements.txt

# # After this, let's install Llama-Cpp-Python binding which will be used to interact with LLMs. 

# # Run the following line if you are using it on a CPU.
pip install llama-cpp-python

# # Run the following line if you are using GPU (T4, A100, A10, or H100), or any Nvidia Cuda based GPU Drivers.
CMAKE_ARGS= " -DLLAMA_CUDA=on " pip install llama-cpp-python

# # If you are on Mac or any other GPU types, you can refer the following links and setup the Llama-Cpp-Python

https://llama-cpp-python.readthedocs.io/en/stable/ # installation-configuration

https://llama-cpp-python.readthedocs.io/en/stable/install/macos/

Pengaturan Rabbitmq & Celery Latar Belakang Pemrosesan Pekerjaan
Gunakan tautan berikut untuk mengatur RabbitMQ di mesin Anda. Ikuti petunjuk sampai langkah 5 dan simpan admin-username & password Anda.
Pengaturan RabbitMQ di Ubuntu 22.04
Setelah Anda berhasil mengatur RabbitMQ, kemudian mengatur Redis-Server dan Celery. Gunakan perintah berikut untuk mengatur dan menginstalnya.
```
sudo apt-get update -y
# # Try with apt-get. If it does not install, then run with apt. 
sudo apt-get install redis-server -y 
# # If the above does not work, try this:
sudo apt install redis-server -y
```
Jalankan Aplikasi dan Tugas Seledri Paralel

Pertama, mulailah aplikasi Flask:

 cd /path/to/project/

dan kemudian buka file app.py di dalam editor kode Anda dan memodifikasi baris berikut.

 Line 18 :     broker = 'amqp://<user>:<password>$@localhost:5672//'

## Update <user> with "your-admin-username".
## Update <password> with "your-admin-password"
## Eg: broker='amqp://admin:hello_world$@localhost:5672//'

### IMPORTANT NOTE: If your password contains '@' symbol, you will need to convert it because it is the default delimiter in broker settings. Example if your password has @ symbol inside it would be. 
## broker='amqp://admin:hello%40world$@localhost:5672//'  -- where the original password was "hello@world", we represent it as 'hello%40world'

Setelah Anda memperbarui file, Anda akan menjalankan file setup.py untuk mengatur direktori dan mengunduh model. Jika Anda ingin mengubah konfigurasi model mana yang ingin Anda gunakan, Anda dapat mengubahnya dengan tepat berdasarkan ukuran infrastruktur dan kapasitas sistem Anda. Tabel berikut menunjukkan model mana yang kami dukung saat ini dalam proyek ini tetapi kami akan menambahkan dukungan LLMS baru karena kami melihatnya cocok dan open-source.

Model ucapan didukung

Nama model	Ukuran model	Memori dibutuhkan (RAM atau VRAM)
Distil-Whisper/Distil-Large-V3	3.1 GB	4 GB
Distil-Whisper/Distil-Large-V2	3.1 GB	4 GB
distil-whisper/distil-medium.en	1,6 GB	2 GB
Distil-whisper/distil-small.en	680 MB	900 MB
Openai/Whisper-Large-V3	6.2 GB	7,5 GB
Openai/Whisper-Large-V2	6.2 GB	7,5 GB
Openai/Whisper-Large-V1	6.2 GB	7,5 GB
Openai/Whisper-Medium	3.2 GB	4,5 GB
Openai/Whisper-Small (default)	980 MB	1,7 GB

LLMS didukung

Nama model	Ukuran model	Memori diperlukan
QuantFactory/phi-3-mini-4k-instruct-gguf (default)	1 GB - 8 GB	2 GB - 14 GB
QuantFactory/phi-3-mini-128k-instruct-GGUF	1 GB - 8 GB	2,5 GB - 16 GB
Bartowski/phi-3-medium-128k-instruct-GGUF	3 GB - 14 GB	6 GB - 18 GB

Anda perlu memodifikasi file global_varibables.py dengan nama model yang Anda pilih dan kemudian jalankan file setup.py yang secara otomatis turun ke model yang Anda pilih.

 Line 32 : DEFAULT_SPEECH_MODEL = "openai/whisper-small"
...
Line 46 : DEFAULT_SUMMARY_MODEL = ( "QuantFactory/Phi-3-mini-4k-instruct-GGUF" , "Phi-3-mini-4k-instruct.Q5_0.gguf" )


### After update the above lines as per your need, run the setup.py
python setup . py

Di jendela terminal baru (pastikan lingkungan virtual Anda diaktifkan di sini juga), mulailah aplikasi dan pekerja seledri:

python app.py # ensure your environment is activated

# and then in new terminal, run the following.
celery -A app.celery worker --loglevel=info -f celery.logs

Unggah perekaman untuk membentuk
Buka browser web Anda dan navigasikan ke URL aplikasi Flask (biasanya http://127.0.0.1:5000 ). Gunakan antarmuka untuk mengunggah rekaman pertemuan Anda.
Dapatkan status terbaru dan tunggu selesai
Setelah mengunggah perekaman, Anda dapat memeriksa status pemrosesan. Ini dapat diimplementasikan sebagai halaman status atau bilah kemajuan dalam aplikasi Anda. Tunggu sampai pemrosesan selesai.
Lihat Risalah Pertemuan Terakhir yang Diproses (Ibu)
Setelah pemrosesan selesai, aplikasi harus menampilkan menit -menit terakhir pertemuan. Anda dapat melihat, mengedit (jika fitur tersedia), dan menyimpan ibu untuk referensi Anda.

2. Fitur:

Konversi file audio dan video dengan mudah menjadi transkrip teks yang akurat: Ini juga dapat digunakan untuk meringkas, menghasilkan item tindakan, memahami aliran kerja, dan perencanaan sumber daya.
Sorotan Kata Kunci dan Penandaan Topik untuk Referensi Cepat: Mengekstraksi Topik dan Menemukan Konten yang Relevan Untuk Melewati Rapat dan Dengarkan Hanya Topik Khusus Yang Menarik Anda.
Risalah ekspor dalam berbagai format, termasuk PDF dan teks biasa: memungkinkan Anda untuk mengekspor transkrip pertemuan, ringkasan, topik & kata kunci, item tindakan, dll ke dalam dokumen yang dapat digunakan dalam kerangka perencanaan dan manajemen proyek. Juga menghilangkan kebutuhan Anda untuk menulis dan menghasilkan templat secara manual.
Antarmuka yang ramah pengguna untuk kustomisasi dan integrasi yang mudah: Mudah untuk mengubah model sumber open-source atau tertutup yang ingin Anda pilih.

Pendekatan dan Implementasi:

Ringkasan

Fungsionalitas inti berkisar pada pemrosesan rekaman pertemuan yang dikirimkan melalui halaman beranda aplikasi web. Setelah rekaman dikirimkan, tugas latar belakang dimulai menggunakan Celery, yang melakukan dua operasi utama: konversi ucapan-ke-teks dan menghasilkan menit pertemuan dari teks yang dikonversi.

Pelaksanaan

Diagram alur yang telah Anda bagikan menguraikan proses terperinci untuk menangani dan memproses file media, terutama yang berfokus pada input audio dan video untuk menghasilkan transkripsi dan ringkasan. Mari kita uraikan setiap langkah dan jelaskan solusi tingkat tinggi yang terlibat dalam alur kerja ini:

1. Unggah file media

Jenis Media : Mendukung MP3, WAV, file MP4.
Tindakan : Pengguna mengunggah file media mereka ke sistem.

2. Loop async untuk pemberitahuan waktu nyata

Tujuan : Untuk memberi tahu pengguna tentang status unggahan dan pemrosesan mereka.
Implementasi : Gunakan API pemberitahuan asinkron untuk mengirim pembaruan waktu nyata kepada pengguna.

3. File yang diunggah

Tindakan : Sistem membaca file yang diunggah untuk menentukan jenis dan konten.

4. Bercabang untuk audio dan video

Audio :
- Konversi ke 16 kHz : Standarisasi laju sampel audio untuk pemrosesan yang konsisten.
- Transcribe : Konversi pidato audio ke teks.
Video :
- Ekstrak audio dan bingkai (1 bingkai/kedua) : Bingkai trek audio dan video terpisah untuk diproses.
- Ringkasan singkat per bingkai : Hasilkan ringkasan singkat untuk setiap bingkai yang diekstraksi.

5. Bergabunglah dengan semua ringkasan singkat dan buat transkripsi utama (untuk video)

Tindakan : Gabungkan semua ringkasan singkat menjadi satu transkripsi komprehensif konten video.

6. Pisahkan jika jumlah token> 4000

TUJUAN : Menangani keterbatasan model bahasa pemrosesan yang mungkin memiliki batas input token maksimum.
Implementasi : Jika transkripsi melebihi batas token, membagi konten menjadi bagian yang dapat dikelola.

7. Model Bahasa Ibu Rekursif

Hasilkan Video Mom (Risalah Rapat) : Jika input adalah video, hasilkan ringkasan terperinci atau menit dari transkripsi.
Pemrosesan Rekursif : Untuk konten yang lebih lama, diringkas secara rekursif untuk memadatkan informasi secara efektif.

8. Ringkasan dan ibu yang dihasilkan

Tindakan : Menghasilkan ringkasan akhir dan risalah dokumen pertemuan berdasarkan teks yang ditranskripsi dan diproses.

9. Gabungkan kedua ibu dan dapatkan ibu baru

TUJUAN : Gabungkan ringkasan dari potongan yang berbeda (jika terbagi sebelumnya) menjadi dokumen komprehensif akhir.

10. Pemberitahuan penyelesaian proses

Integrasi dengan API Pemberitahuan : Beri tahu pengguna bahwa pemrosesan selesai dan menyediakan akses ke ringkasan yang dihasilkan atau dokumen MOM.

Diagram alir

Diagram Aliran Loop Persiapan Data

Tumpukan Teknis:

Back-end : Python, Flask
Antrian tugas asinkron : redis, seledri
Pidato-ke-teks : Whisper, lebih cepat-whisper, distil-whisper
LLM untuk pemrosesan teks : Phi3, Gemma 2, Llama 3
Frontend : HTML, CSS, JavaScript

Gunakan kasus dan aplikasi: ✅

Pertemuan perusahaan : Meningkatkan produktivitas dengan memberikan menit yang cepat dan akurat untuk berbagai pertemuan perusahaan, rapat dewan, dan diskusi tim.
Lembaga Pendidikan : Berguna bagi dosen dan siswa untuk menyalin dan merangkum kuliah, seminar, dan diskusi kelompok.
Bidang Hukum dan Medis : Membantu secara akurat mendokumentasikan proses hukum, wawancara, dan konsultasi pasien.
Aksesibilitas : Membantu individu penyandang cacat, terutama mereka yang mengalami kesulitan dalam mencatat, dengan memberikan cara otomatis untuk menangkap dan merangkum konten lisan.
Cakupan acara : Berguna bagi jurnalis dan penyelenggara acara untuk menyalin pidato, presentasi, dan diskusi panel, membantu dalam pembuatan laporan dan dokumentasi acara.

Lingkup dan peningkatan di masa depan :?

Integrasi dengan alat konferensi video untuk penangkapan perekaman langsung.
Dukungan multi-bahasa untuk konversi ucapan-ke-teks.
Fitur peringkasan yang ditingkatkan yang disesuaikan dengan jenis pertemuan tertentu (misalnya, strategi bisnis, bisnis).
Kemampuan transkripsi dan peringkasan waktu nyata.
Opsi kustomisasi pengguna untuk memformat menit.

Contoh screenshot aplikasi:

Layar Beranda.

Tangkapan layar 1

Menit baru pertemuan dialog

Tangkapan layar 2

Unggah file video/audio.

Tangkapan layar 3

Pusat Pemberitahuan - Mulai Mulai

Tangkapan layar 4

Pusat Pemberitahuan - dalam pembaruan waktu nyata Prgress

Screenshot 5

Pusat Pemberitahuan - Pemrosesan Selesai

Tangkapan layar 6

Menit akhir halaman pertemuan

Tangkapan layar 7

Pusat Pemberitahuan - beberapa status file

Screenshot 8

Pusat Pemberitahuan - beberapa status file

Tangkapan layar 9

Pusat Pemberitahuan - beberapa status file

Tangkapan layar 10

Menjalankan alat secara lokal :?

Prasyarat

Sebelum melanjutkan, pastikan Anda menginstal berikut:

Ubuntu 22.04 atau terbaru.
Python (v3.10 atau lebih tinggi)
Alat lingkungan virtual seperti virtualenv atau venv .

Instalasi dan Pengaturan:

Pemecahan Masalah :?

Pastikan semua variabel lingkungan yang dibutuhkan oleh aplikasi dan seledri diatur dengan benar.
Periksa pesan kesalahan apa pun dalam output terminal flask dan seledri.
Pastikan versi Python dan paket dalam requirements.txt kompatibel.

Fase 2 - Transkripsi real -time: ⏭️

Dalam fase 2 proyek kami, kami berencana untuk memungkinkan transkripsi pertemuan real-time. Bergabunglah dengan kami dalam membentuk masa depan pertemuan yang efisien dan kolaboratif!

Tetap diperbarui:

? Ikuti saya untuk pembaruan tentang pengembangan Fase 2 dan peningkatan lainnya untuk membuat pertemuan Anda lebih produktif.

Kontribusi Selamat Datang:

? ‍ Mendorong kontribusi dari masyarakat untuk menjadikan alat ini sebagai game-changer untuk pertemuan di mana-mana. Berkontribusi ide dan keahlian Anda untuk membantu kami mencapai transkripsi real-time!

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Data situs web
Waktu Pembaruan 2025-07-05
ukuran 4.98MB
Berasal dari Github

Aplikasi Terkait

TensorRT LLM

2024-11-10
Perusahaan Pahlawan: Tales of Valor

2022-09-04
Zaman Mitologi: Kisah Naga

2022-08-29
44 Menit dalam Mimpi Buruk

2022-08-02
20 Menit Hingga Fajar

2022-07-26
Sistem manajemen konferensi Roark Meeting

2012-06-05

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Twitter Sentiment Analysis on Flask App

Data situs web

1.0.0
data science app road accident analysis

Data situs web

1.0.0
static web apps cli

Data situs web

v2.0.2
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua