Rag-Nificent: AI Chatbot, работающий на LLMS для цитирования пользовательских PDF, отчетов и руководящих принципов
Теперь поддерживает Llama-3.1 от Meta AI

Rag-nificent-это современный репозиторий, который использует силу извлеченного авторского поколения (RAG) для предоставления мгновенных ответов и ссылок из кураторского каталога PDF, содержащих информацию на любую конкретную тему, такую как документы рекомендаций WHO. Эта система предназначена для помощи исследователям, политикам и общественности в быстрое поиск конкретной информации в обширных документах.
Функции
- Разговорной интерфейс : взаимодействуйте с системой, используя запросы естественного языка для получения ответов, непосредственно полученных от PDF.
- Прямая цитата : Каждый ответ из системы включает прямую ссылку на страницу PDF -источника, обеспечивая отслеживание и проверку.
- Справочник PDF : предопределенный набор ключевых документов PDF, в настоящее время включая рекомендации ВОЗ по основным темам здоровья, такие как шистосомоз и малярия.
Доступные модели
- ? Llama-3.1-8b-Instant : испытать мгновенные, эффективные ответы с этой моделью, оптимизированной для быстрого взаимодействия.
- ? Llama-3.1-70b-veratile : используйте эту универсальную модель для широкого спектра сложных языковых задач с высокой точностью.
- GPT-3,5-Turbo : взаимодействуйте с расширенными человеческими взаимодействиями, подходящими для различных разговорных задач.
- ? LLAMA3-70B-8192 : наслаждайтесь высококлассными показателями с этой крупномасштабной моделью, идеально подходящей для глубокого обучения.
- ? LLAMA3-8B-8192 : надежные возможности с этой более доступной версией Llama3, идеально подходящей для широкого спектра приложений для искусственного интеллекта.
- ? Mixtral-8x7b-32768 : Используйте силу ансамблевого моделирования с обширной способностью Mixtral для нюансированного понимания и генерации реагирования.
- ? GEMMA-7B-IT : Исследуйте специализированные взаимодействия и технологические решения с Gemma, адаптированными для ИТ-технического и технического содержания.
Демо

Как это работает
В приложении используется комбинация встроений OpenAI, поиска векторов Pinecone и разговорного интерфейса, чтобы обеспечить бесшовный поиск. Когда запрашивается запрос, система:
- Преобразует запрос в встраивания.
- Поиск наиболее релевантных разделов документов с использованием векторного поиска Pinecone.
- Возвращает ответ вместе с цитатами и ссылками на исходные документы.
Настраивать
Клонировать репозиторий:
git clone https://github.com/yourusername/RAG-nificent.git
Установить зависимости:
pip install -r requirements.txt
Установите переменные среды в .env (также см. Файл .env.example :
-
PINECONE_INDEX_NAME -
PINECONE_NAME_SPACE -
OPENAI_API_KEY -
PINECONE_API_KEY -
GROQ_API_KEY
Создайте индекс Pinecone с тем же именем, что и PINECONE_INDEX_NAME . Установите его с dimensions=1536 и metric=cosine .
Разместите PDFS в каталог pdf_data и запустите data_ingestion.py
Запустите приложение:
Исходные документы
Система в настоящее время включает в себя руководящие принципы из следующих PDF -файлов с прямыми ссылками на документы:
- ВОЗ руководства по контролю и устранению чистосомоза человека (2022)
- ВОЗ РУКОВОДСТВО ДЛЯ МАЛАРИИ (2023)