Скачать smartchat conversational chatbot - smartchat conversational chatbot Sourced Code Скачать

smartchat conversational chatbot

AI Исходный код

1.0.0

Скачать

Содержимое

Название репозитория
Название проекта
Краткое описание проекта
Цели проекта
Имя набора данных
Описание набора данных
Цель проекта с использованием этого набора данных
Размер набора данных
Алгоритмы, которые используются как часть нашего исследования
Требования к проекту
Использование проекта
Какую архитектуру чат -ботов следует использовать пользователи
Авторы

Название репозитория

SmartChat-Conversational-chatbot

Название проекта

SmartChat: контекстный разговорный агент

Краткое описание проекта

Разработайте чат -бот, который может эффективно адаптироваться к контексту и темам сдвига в разговоре, используя набор данных для ответов на вопросы Стэнфорда для предоставления информированных и актуальных ответов, и тем самым увеличивая удовлетворенность и вовлечение пользователей.

Цели проекта

Создайте удобный интерфейс веб-сайта или приложения, который позволяет пользователям вести естественные и последовательные беседы с чат-ботом, с высоким уровнем удовлетворения.

Имя набора данных

Набор данных, используемый в этом проекте, представляет собой набор данных для ответов на вопрос Стэнфорда .

Источник данных: Kaggle

Тип набора данных: текст

Описание набора данных

Стэнфордский набор данных для ответа на вопросы (Squad) - это набор данных по пониманию прочитанного, состоящий из вопросов, заданных толщинами на наборе статей Википедии. Ответ на каждый вопрос - это сегмент текста или пролета, из соответствующего отрывка для чтения. На более чем 500 статьях насчитывается 100 000+ пар вопросов-ответов. Более подробную информацию можно найти по адресу: https://rajpurkar.github.io/squad-explorer/

Цель проекта с использованием этого набора данных

Целью проекта является разработка чат-бота, который может провести многообразные разговоры, адаптироваться к контексту и обрабатывать различные темы.

Размер набора данных:

Набор данных имеет 2 файла JSON. Один для обучения, а другой - для тестирования
- dev-v1.1.json-4,9 МБ
- Train-V1.1.json-30,3 МБ

Алгоритмы, которые используются как часть нашего исследования

2 различные архитектуры используются:
- GPT2-Medium Architecture с использованием Lora и Peft
- Берт (Bert-базовый

Требования к проекту

Python3
наборы данных
факел
Пефт
Трансформеры
оценивать
Safetensors
Numpy
Панды
matplotlib
Scikit-learn
морской
nltk
Руж-оценка
Руж
градио
TQDM

Использование проекта

Предварительная обработка набора набора данных GOTO и убедитесь, что у вас есть файлы train-v1.1.json и dev-v1.1.json .
- Если у вас их нет, вы можете скачать их здесь и здесь
GOTO DEST DEST DATASET PREPROCESSING FILE и запустите все ячейки.
Чтобы выполнить и просмотреть результаты подхода BERT (BERT-BASE-USADES), пожалуйста, пройдите инструкции, представленные в файле Squad_chatbot_USING_BERT-BASE-UNCASED_README.MD.
Чтобы выполнить и просмотреть результаты подхода GPT (GPT2-Medium с использованием LORA и PEFT), пожалуйста, пройдите инструкции, представленные в файле Squad_chatbot_USING_GPT2-MEDIUM_README.MD.

Какую архитектуру чат -ботов следует использовать пользователи

На самом деле, оба чат -бота работают хорошо.
Squad_using_gpt2-medium генерирует ответы, но в большинстве случаев у него проблемы.
- Для получения дополнительной информации о наблюдениях и технических деталях обратитесь к файлам обучения и проверки.
Squad_using_bert-base-yearsed работает очень хорошо, как и ожидалось.
Окончательный вывод: пользователи могут использовать любой чат -бот. Но для совершенного поколения ответов используйте Squad_using_bert-Base-Undersed.