Unduh Chatbot_Moin_Von_Bremen - Unduh kode sumber Chatbot_Moin_Von

Chatbot_Moin_Von_Bremen

Kode sumber lainnya

1.0.0

Unduh

? Moin von Bremen?

Selamat datang di "Moin von Bremen," proyek yang menyenangkan dan interaktif yang dikembangkan oleh sekelompok mahasiswa master yang antusias dari University of Bremen. Dalam proyek ini, kami menyelami dunia LLMS (model bahasa besar), mengeksplorasi kekuatan pengambilan generasi augmented (RAG), dan bereksperimen dengan konsep multimodalitas. Bersama -sama, kami membuat panduan kota audio untuk kota Bremen kami yang tercinta! ? ️

Tinjauan Proyek

Proyek ini adalah perjalanan yang menarik yang dimulai dengan gagasan membangun chatbot yang mampu melayani sebagai panduan kota audio. Kota apa yang lebih baik untuk dipilih selain Bremen, rumah kami saat belajar di Universitas Bremen? Dengan panduan ini, Anda akan mengenal Bremen tidak seperti sebelumnya!

Cara kerjanya

Kami menggabungkan pengetahuan lokal kami dengan fakta yang dapat diandalkan dari Wikipedia untuk menciptakan pengalaman yang menarik dan informatif. Berikut ini adalah kerusakan langkah demi langkah tentang bagaimana kami melakukannya:

Pembuatan Data : Kami bersumber dari gambar dan data dari Wikipedia untuk mendukung chatbot kami. Lihat file datageneration.ipynb untuk detail lebih lanjut tentang bagaimana ini dilakukan.
LLM & RAG : Penasaran tentang membangun bot pribadi Anda sendiri? Begitu juga kita! Kami mempelajari LLMS dan teknik kain yang selalu populer untuk mengembangkan aplikasi pengetahuan khusus domain. Rag banyak digunakan oleh bisnis besar untuk membuat aplikasi khusus. Ingin belajar lebih banyak? Baca artikel Rag yang mendalam ini.
Teks embeddings dengan chromadb : Perjalanan kami dilanjutkan dengan file textdata_chromadb.py , di mana kami mengembangkan kain menggunakan vektor embeddings dengan chromadb. Kami bahkan membangun API menggunakan gradio untuk antarmuka pengguna yang lancar. Kami juga bereksperimen dengan konsep multimodal dengan membuat koleksi untuk teks dan gambar. Saat diberi prompt, sistem mencari gambar dan teks yang paling relevan dalam database.
Vektor embedding : Konsep embedding vektor meluas untuk membuat konteks numerik yang relevan, yang digunakan selama pencarian untuk menarik data yang paling relevan dari database. Untuk penjelasan mendalam, lihat artikel ini tentang database embeddings dan vektor.
Panduan Audio dengan FAISS : Bergerak maju, kami mengembangkan panduan audio dengan mengimplementasikan kode di audiodata_faissEmbedding.py . Kami menggunakan model ASR Whisper Openai untuk konversi audio-ke-teks. Pelajari lebih lanjut tentang Whisper di sini. Untuk menyelam dalam yang menarik ke dalam spektrogram, lihat artikel ini.
Pencarian kesamaan dengan FAISS : FAISS, yang dikembangkan oleh Facebook AI Research, dirancang untuk pencarian kesamaan yang efisien dan pengelompokan vektor padat. Ini sangat berguna untuk menemukan item serupa dalam dataset berdasarkan representasi vektor mereka. Untuk penjelasan terperinci, kunjungi halaman resmi FAISS.

Chromadb vs. Faiss

Mengapa kami memilih Chromadb daripada FAISS untuk proyek ini? Inilah perbandingan cepat:

FAISS : Perpustakaan khusus untuk pencarian kesamaan yang efisien, terutama berfokus pada penanganan dan vektor permintaan.
Chromadb : Sistem basis data yang lebih komprehensif yang dirancang khusus untuk embeddings, dengan fitur canggih untuk mengelola koleksi, permintaan, penyaringan, dan menangani data multi-modal.

Untuk pencarian multi-modal (seperti mencari teks dengan embeddings gambar), Chromadb menawarkan lebih banyak fleksibilitas daripada FAISS. Kami memecah proses pengambilan keputusan kami dan implementasi di Main.py , diilustrasikan dalam diagram berikut (masukkan diagram di sini).

Pengaturan

Untuk memulai proyek ini, ikuti langkah -langkah ini:

Pasang paket yang diperlukan :
```
pip install -r requirements.txt
```
Data : Data implementasi saat ini ada di folder data .

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-06-01
ukuran 8.93MB
Berasal dari Github

Aplikasi Terkait

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Anjing_Rubah_Kelinci

2022-08-01
Mesin analisis data Lihua versi gratis 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua