Chatbot for mental health скачать - Chatbot for mental health Скачать исходный код

Chatbot for mental health

Другой исходный код

1.0.0

Скачать

Чат -бот для психического здоровья

Обновления (2024)

Фиксированные проблемы, связанные с сценариями Python, не работают из -за устаревших библиотечных версий и методов
Добавлены требования. Txt для легкой установки зависимостей

Прежде чем запустить сценарии, убедитесь, что у вас установлена версия Python <= 3.8 (предпочтительно Python 3.8; необходимо для установки некоторых библиотек, таких как Tensorflow).

Этот проект был сделан для исследовательского проекта под руководством профессора в моем университете с самостоятельным набором данных. Набор данных, который мы использовали, является конфиденциальным; Следовательно, я использовал образец набора данных Kaggle. Я решил сделать сценарии с открытым исходным кодом, чтобы сделать сборник различных чат-ботов с нуля в Python, так как я боролся с такими ресурсами во время своих исследований.

Мотивация этого проекта

В 2017 году Национальное обследование психического здоровья сообщило, что каждый из семи человек в Индии страдал от психических расстройств, включая депрессию и беспокойство. Растущая осведомленность о психическом здоровье сделала его основной проблемой развития. Почти 150 миллионов человек в Индии нуждались в вмешательствах, где низкий и средний класс столкнулся с большим бременем, чем зажиточные люди. Этот проект является попыткой сделать психическое здоровье более доступным. Этот разговорной агент может быть дополнен клиницистами, чтобы сделать его более эффективным и плодотворным.

Классификации чат -ботов

Чат -боты могут быть классифицированы на основе различных атрибутов -

Мое исследование было связано с подходами к проектированию, а именно, основанным на правилах, на основе поиска и на основе генерации.

Чатботы на основе правил: чат-бот на основе правил использует простое отображение на основе правил или сопоставление шаблонов, чтобы выбрать ответы из наборов предопределенных ответов. Эти системы не производят новый текст; Вместо этого они выбирают ответ из заранее определенного списка.
Чат-боты на основе поиска: чат-бот на основе поиска использует ансамбли машинного обучения в качестве эвристики для оценки. Подобно чат-ботам на основе правил, они не генерируют новые тексты.
Генеративные чат-боты: генеративные модели не полагаются на предопределенные ответы. Они придумывают новые ответы с нуля. Методы машинного перевода обычно используются в генеративных моделях, но вместо того, чтобы переводить с одного языка на другой, мы «переводем» с ввода на вывод (ответ). Генеративные модели используются для создания, потому что они учатся с нуля.

Обзор обученных ботов

Набор данных был взят из FAQ Kaggle - психическое здоровье. Этот набор данных состоит из 98 часто задаваемых вопросов о психическом здоровье. Он состоит из 3 столбцов - вопроса, вопросов и ответов.

Обратите внимание, что для обучения поиска чат -бота файл CSV был вручную преобразован в файл JSON . Поскольку это не оригинальный набор данных, используемый для исследования (читать Intro), я использовал только первые 20 строк для обучения модели.

Репозиторий состоит из трех ноутбуков для трех типов чат -ботов.

Для на основе правил TF-IDF использовался с токенизатором NLTK для обработки данных. Обработанные данные были протестированы с ожидаемым результатом, и для оценки использовалось сходство косинуса .
Для поиска, несколько моделей машинного обучения и глубокого обучения были обучены,
- Ваниль Рнн
- LSTM
- BI - LSTM
- Гру
- Модели поиска CNN обучаются на файлах JSON. Для всех вышеупомянутых моделей использовалась регуляризация, и на основе обучения и точности и убытков валидации лучшая модель была оставлена для окончательного сравнения. Было отмечено, что архитектура CNN дала наилучшие результаты . Модель состояла из 3 слоев - сверточной нейронной сети (CNN) + встроенного уровня + и полностью подключенного уровня.
Для генеративных чат-ботов NLP использовался с тех пор, как NLP позволяет чат-ботам учиться и имитировать шаблоны и стили человеческого разговора . Это дает вам ощущение, что вы разговариваете с человеком, а не с роботом. Он отображает ввод пользователя с целью с целью классификации сообщения для соответствующего предопределенного возможного ответа.

Модель энкодера-декодера была обучена на файле CSV. Endoder-Decoder-это модель SEQ2SEQ, также называемая моделью Encoder-Decoder, использует длинные краткосрочные памятью для генерации текста из учебного корпуса.
Что делает модель SEQ2SEQ или Encoder-Decoder в простых словах? Он предсказывает слово, приведенное в пользовательском вводе, и тогда каждое из следующих слов предсказывается с использованием вероятности вероятности возникновения этого слова.

JSON против CSV

Во время этого проекта самая большая путаница, которую я испытал, заключалась в том, почему чат-бот использовал файл JSON вместо CSV для модели на основе поиска. Я перечислил некоторые моменты, которые проводят сравнение между двумя типами файлов -

JSON хранит данные иерархическим образом, что лучше для чат-бота на основе поиска, учитывая, что чат-бот потребует тегов и контекстов.
Чат-бот на основе поиска обучена дать лучший ответ на основе пула предопределенных ответов. Эти предопределенные ответы конечны по количеству. Тэг должен быть предоставлен для картирования ввода в выпуск. Проще говоря, ввод, указанный пользователем (контекст), определяется предоставленным тегом. Основываясь на лучшем теге, который предсказывается, пользователю показан один из предопределенных ответов . Следовательно, хранение такого рода данных в файле JSON проще из -за его компактности и иерархической структуры.
Файл CSV был использован для хранения данных генеративного чата. Генеративный чат -бот не требует тегов для прогнозирования . Эти данные легче хранить в файле CSV, поскольку нам нужно всего два столбца - входной текст и выходной текст. Добавление или удаление данных будет проще в этом случае по сравнению с файлом JSON.

Будущие цели

Я хочу дальше исследовать возможности чат-бота на основе генерации. Текущая модель энкодера-декодера не может запечатлеть все зависимости в слое декодера из-за компактной природы LSTM. Слои внимания могут быть добавлены после динамического декодирования каждого выхода.

Расширять

Дополнительная информация