Этот проект использует агент AI для автоматического извлечения и обработки данных. Система позволяет пользователям загружать файл CSV или подключаться к листу Google, а затем взаимодействовать с данными, используя запросы естественного языка. Агент генерирует код Python на основе запроса, выполняет код для манипулирования данными и представляет результат в различных форматах, таких как таблица, график или строка, или скрещивания полезных данных для вашего файла.
Чтобы запустить этот проект, вам нужен Python 3.7 или более поздней версии. В проекте используется несколько сторонних библиотек, которые могут быть установлены через PIP.
git clone https://github.com/UjjawalGusain/CheatSheet-Langchain-Project.git
cd Langchain-Web-Agent python3 -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
pip install -r requirements.txtНастройте Google Sheets API:
Запустите приложение:
streamlit run dashboard.pyПосле запуска этой команды приложение запустится, и вы можете получить к нему доступ через свой браузер.
Этот проект использует несколько API для обработки различных операций, включая соскабливание данных и взаимодействие с моделью. Интегрированные API:
Groq API:
Модель: Llama-3.1-70B-Versatile
Цель: API GROQ используется для взаимодействия с большой языковой моделью для генерации ответов, выполнения операций в наборе данных и обработки сложных запросов. Модель Llama-3.1-70b-Versatile используется для эффективного понимания и генерации естественного языка, помогает обработать запросы и дает действенные результаты.
Использование:
API вызывается для обработки запросов, связанных с данными, включая такие операции, как извлечение, фильтрация и генерация резюме. Ответ от модели помогает в формировании операций, применяемых к набору данных.
Подсказки, используемые для модели, структурированы в определенном формате, чтобы обеспечить желаемый ответ и избежать ошибок во время выполнения.
Scraper API:
Цель: API Scraper используется для сбора дополнительных данных из внешних источников и добавления этих данных в набор данных.
Использование:
Выберите источник данных на боковой панели: либо загрузите CSV, либо подключите Google Sheets.
Введите запрос:
Просмотреть результаты:
Быстрое форматирование и сложность: значительной проблемой было обеспечение того, чтобы подсказки, передаваемые модели, были правильно отформатированы и обрабатывались системой. Модель, необходимая для создания точных ответов на основе структуры и сложности запросов. Также было важно поддерживать ясность и последовательность в том, как была извлечена и представлена информация пользователю, особенно с помощью сложных запросов.
Управление рисками безопасности с помощью LLMS: использование крупных языковых моделей (LLMS) ввело потенциальные риски безопасности, особенно в отношении конфиденциальности данных и обработки конфиденциальной информации. Обеспечение того, чтобы никакие конфиденциальные или частные данные были непреднамеренно обнажены, в то время как взаимодействие с моделью было критическим аспектом процесса разработки. Нам пришлось внедрить гарантии, чтобы минимизировать эти риски при использовании LLMS для генерации данных кода и обработки.