mbti_chatbot Скачать - mbti_chatbot ИСПРАВЛЕННЫЙ КОД Скачать

mbti_chatbot

AI Исходный код

1.0.0

Скачать

MBTI Chatbot

Этот репозиторий содержит код для разработки чат-бота, который может взять один из 16 типов личности Майерс-Бриггс .

Соскабливание данных

Чат-бот точно настроен для каждой личности, используя посты и комментарии, принадлежащие соответствующему субреддиту (например, R/Infj для типа INFJ ).

reddit_scraper.py содержит сценарий для сокраски данного субреддита. Чтобы выполнить его, сначала вам нужен экземпляр базы данных MySQL для подключения. Вам также нужны некоторые параметры, связанные с вашей учетной записью Reddit и в базе данных MySQL: все необходимо вставить в файл config.py , следуя схеме config.example.py .

Сценарий сначала загрузит все сообщения в таблице под названием posts , а затем их комментарии в таблице под названием comments . Хотя параллелизация была применена, эта вторая часть займет много часов. Вот почему, как только вы скачали посты, которые вас интересуют через основной сценарий (~ 20 минут), вы можете использовать сценарий comments_scraper.py для загрузки соответствующих комментариев. Если вы прерываете его, в следующий раз, когда вы запустите его, сценарий начнется с того места, где вы ушли.

Обучение

Подготовка данных

Чтобы обучить модель, я впервые сообщил данные в conversational dataset format , т.е. таблица CSV со следующей структурой.

идентификатор	ответ	контекст	контекст/0	...	контекст/n
S892NN	Я в порядке	Ничего страшного. А вы?	Как жизнь?	...	Привет!

Здесь, контекст/N представляет собой начало разговора, переходя к самому последнему обмену (показан в контексте/0 , контексте и ответе , который является последним предложением в разговоре). Это возможно изменить кардинальность контекстов, переопределяя параметр NUMBER_OF_CONTEXTS в файле config.py .

Script create_conversational_dataset.py генерирует CSV, начиная с таблиц SQL, созданных на этапе скребки, сохраняя его в файл рассола в папке данных. Разговор построен либо из поста, так и из его прямых комментариев, либо из поста, комментария и его цепочки комментариев.

Выполнение скрипта параллелизируется, поэтому он записывается на n различных CSVS - n в зависимости от параметра NUMBER_OF_PROCESSES - наконец -то объединяется для создания полученного файла рассола.

Модель

The Notebook training.py содержит точную настройку модели языка DialoGPT-medium на разговорных данных и в основном является адаптацией кода, который вы можете найти в this notebook .

Выполнение demo.py начнет разговор.

Бег

Чтобы запустить весь код в ресторане, вы можете создать виртуальную среду и запустить следующие команды.

 virtualenv venv 
source ./venv/bin/activate
pip install -r requirements.txt

Расширять

Дополнительная информация

Версия 1.0.0
Тип AI Исходный код
Время обновления 2025-09-08
размер 24.91KB
От Github

Связанные приложения

Дети переходят дорогу м ксилоза м

2024-03-08
кот м ксилоза м

2024-02-23
М комиксы

2023-08-25
csgom

2023-08-21
Путешествие 2М

2023-06-16
Королевство Драконов М

2023-06-09

mbti_chatbot

MBTI Chatbot

Соскабливание данных

Обучение

Подготовка данных

Модель

Бег

Дети переходят дорогу м ксилоза м

кот м ксилоза м

М комиксы

csgom

Путешествие 2М

Королевство Драконов М

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express