О
Этот репозиторий содержит приложение Chatbot, созданное с использованием Streatlit, Langchain и ChromAdB, предназначенного для предоставления важной информации о COVID-19 на основе содержимого файлов PDF. Чатбот использует подход (RAG) для поиска-аугированного поколения (RAG), где соответствующая информация получена из векторной базы данных, а затем обрабатывается языковой моделью для создания окончательного ответа.
Оглавление
- Функции
- Архитектура
- Установка
- Использование
- Развертывание
- Вклад
- Будущие работы
Функции
- ПДФ ПРЕДУПРЕЖДЕНИЕ: чат-бот может приглашать файлы PDF, содержащие связанную с COVID-19 информацию, и создавать векторную базу данных с использованием ChromADB.
- Ответ: Пользователи могут задавать вопросы, связанные с COVID-19, а чат-бот будет получать соответствующую информацию из векторной базы данных и генерировать ответ с использованием языковой модели.
- Интерфейс Streamlit: чат-бот имеет удобный интерфейс, созданный с помощью Streamlit, позволяющий пользователям взаимодействовать с приложением через веб-интерфейс.
Архитектура
Чатбот следует за подходом поиска-аугированного поколения (RAG), который сочетает в себе методы поиска и генерации для предоставления точных и актуальных ответов. Архитектура состоит из следующих компонентов:
- Загрузчик документа: загружает файлы PDF из папки книг и разбивает их на более мелкие текстовые куски.
- Векторная база данных: Текстовые кусочки преобразуются в векторные встроения с использованием встраиваний OpenAI и хранятся в базе данных вектора ChromADB.
- Поиск сходства: когда пользователь задает вопрос, соответствующие текстовые куски получены из векторной базы данных на основе их сходства с вопросом.
- Языковая модель: извлеченные текстовые куски передаются в языковую модель (GPT-3.5-Turbo) вместе с вопросом пользователя. Модель генерирует окончательный ответ на основе предоставленного контекста.
- Интерфейс Streamlit: пользовательский интерфейс создан с использованием Streatlit, позволяя пользователям взаимодействовать с чат-ботом через веб-интерфейс.
Установка
- Клонировать репозитурирование:
git clone https://github.com/saral7293/COVID-19-CHATBOT-Retrieval-Augmented-Generation-
- Перейдите к каталогу проекта:
cd COVID-19-CHATBOT-Retrieval-Augmented-Generation
- Установите требуемые зависимости:
pip install -r requirements.txt
- Установите свой ключ API OpenAI в качестве переменной среды:
export OPENAI_API_KEY=your_openai_api_key
Использование
Чтобы запустить чат -бот локально, используя стримку, выполните следующую команду:
Это запустит приложение Streamlit, и вы можете взаимодействовать с чат -ботом через веб -интерфейс.
Развертывание
Этот чат -бот был развернут на экземпляре EC2 в виртуальной машине.
Вклад
Взносы приветствуются! Если вы найдете какие -либо проблемы или хотите добавить новые функции, пожалуйста, откройте проблему или отправьте запрос на привлечение.
Будущие работы
Прекрасно настроить чат -бот и применить Advance Rag Techniques.