Chatbot_Moin_Von_Bremen Descargar - Chatbot_Moin_Von

Chatbot_Moin_Von_Bremen

Otro código fuente

1.0.0

Descargar

? ¿Moin von Bremen?

Bienvenido a "Moin von Bremen", un proyecto divertido e interactivo desarrollado por un grupo de entusiastas estudiantes de maestría de la Universidad de Bremen. En este proyecto, nos sumergimos en el mundo de las LLM (modelos de idiomas grandes), exploramos el poder de la generación aumentada de recuperación (RAG) y experimentamos con el concepto de multimodalidad. ¡Juntos, creamos una guía de Audio City para nuestra querida ciudad de Bremen! ? ️

Descripción general del proyecto

Este proyecto es un viaje fascinante que comienza con la idea de construir un chatbot capaz de servir como una guía de la ciudad de audio. ¿Qué mejor ciudad para elegir que Bremen, nuestro hogar mientras estudiaba en la Universidad de Bremen? Con esta guía, ¡conocerás a Bremen como nunca antes!

Cómo funciona

Combinamos nuestro conocimiento local con hechos confiables de Wikipedia para crear una experiencia atractiva e informativa. Aquí hay un desglose paso a paso de cómo lo hicimos:

Generación de datos : obtuvimos imágenes y datos de Wikipedia para admitir nuestro chatbot. Consulte el archivo datageneration.ipynb para obtener más detalles sobre cómo se hizo esto.
LLM & RAG : ¿Curioso por construir su propio bot personal? ¡Así lo estábamos! Nos profundizamos en LLM y la técnica de RAG siempre popular para desarrollar una aplicación de conocimiento específica del dominio. El RAG es ampliamente utilizado por grandes empresas para crear aplicaciones especializadas. ¿Quieres aprender más? Lea este artículo de trapo perspicaz.
Incruscaciones de texto con ChromAdB : Nuestro viaje continuó con el archivo textdata_chromadb.py , donde desarrollamos RAG utilizando integridades vectoriales con ChromAdB. Incluso construimos una API usando Gradio para una interfaz de usuario suave. También experimentamos con conceptos multimodales creando colecciones tanto para texto como para imágenes. Cuando se le da un aviso, el sistema busca la imagen y el texto más relevantes en la base de datos.
Incrustación de vectores : el concepto de incrustación vectorial se extiende a la creación de contextos numéricos relevantes, que se utilizan durante las búsquedas para extraer los datos más relevantes de la base de datos. Para obtener una explicación en profundidad, consulte este artículo sobre incrustaciones y bases de datos vectoriales.
Guía de audio con FAISS : en el futuro, desarrollamos una guía de audio mediante la implementación del código en audiodata_faissEmbedding.py . Utilizamos el modelo Whisper ASR de OpenAI para la conversión de audio a texto. Aprenda más sobre Whisper aquí. Para obtener una inmersión profunda interesante en los espectrogramas MEL, consulte este artículo.
La búsqueda de similitud con FAISS : FAISS, desarrollada por Facebook AI Research, está diseñada para una búsqueda de similitud eficiente y agrupación de vectores densos. Es increíblemente útil para encontrar elementos similares en un conjunto de datos basado en sus representaciones vectoriales. Para una explicación detallada, visite la página oficial de FAISS.

ChromadB vs. Faiss

¿Por qué elegimos ChromadB sobre FAISS para este proyecto? Aquí hay una comparación rápida:

FAISS : una biblioteca especializada para una búsqueda de similitud eficiente, centrándose principalmente en el manejo y consulta de vectores.
ChromAdB : un sistema de base de datos más completo diseñado específicamente para incrustaciones, con características avanzadas para administrar colecciones, consultas, filtración y manejo de datos multimodales.

Para búsquedas multimodales (como buscar texto con embedidas de imagen), ChromAdB ofrece más flexibilidad que FAISS. Desglosamos nuestro proceso de toma de decisiones y la implementación en Main.py , ilustrada en el siguiente diagrama (inserte el diagrama aquí).

Configuración

Para comenzar con este proyecto, siga estos pasos:

Instale los paquetes requeridos :
```
pip install -r requirements.txt
```
Datos : los datos de implementación actuales están presentes en la carpeta data .

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-06-01
tamaño 8.93MB
Proviene de Github

Aplicaciones relacionadas

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
perro_zorro_conejito

2022-08-01
Motor de análisis de datos Lihua versión gratuita 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo