mbti_chatbot Téléchargement - mbti_chatbot CODE Téléchargement du code

mbti_chatbot

Code Source AI

1.0.0

Télécharger

Chatbot mbti

Ce référentiel contient le code pour développer un chatbot qui peut prendre l'un des 16 types de personnalité Myers-Briggs .

Gratter les données

Le chatbot est affiné pour chaque personnalité en utilisant des publications et des commentaires appartenant au subreddit correspondant (par exemple, R / INFJ pour le type InfJ ).

reddit_scraper.py contient le script pour gratter un subreddit donné. Pour l'exécuter, vous avez d'abord besoin d'une instance d'une base de données MySQL pour vous connecter. Vous avez également besoin de certains paramètres associés à votre compte Reddit et à la base de données MySQL: tous doivent être insérés dans un fichier config.py , en suivant le schéma de config.example.py .

Le script va d'abord charger tous les messages dans un tableau appelé posts , puis leurs commentaires dans un tableau appelé comments . Bien que la parallélisation ait été appliquée, cette deuxième partie va prendre plusieurs heures. C'est pourquoi, une fois que vous avez téléchargé les articles qui vous intéressent via le script principal (~ 20min), vous pouvez utiliser le script comments_scraper.py pour télécharger les commentaires associés. Si vous l'interrompez, la prochaine fois que vous l'exécutez, le script va commencer d'où vous êtes parti.

Entraînement

Préparer des données

Pour former le modèle, j'ai d'abord rapporté des données dans le conversational dataset format , c'est-à-dire une table CSV avec la structure suivante.

identifiant	réponse	contexte	Contexte / 0	...	contexte / n
S892NN	Je vais bien	C'est bon. Et toi?	Comment va la vie?	...	Salut!

Ici, le contexte / n représente le début de la conversation, allant à l'échange le plus récent (montré dans le contexte / 0 , contexte et réponse , qui est la dernière phrase de la conversation). Il est possible de modifier la cardinalité des contextes en remplaçant le paramètre NUMBER_OF_CONTEXTS dans le fichier config.py .

Le script create_conversational_dataset.py génère le CSV à partir des tables SQL créées pendant la phase de grattage, en les enregistrant dans un fichier de cornichon dans le dossier de données. Une conversation est construite soit à partir d'un post et l'un de ses commentaires directs, soit à partir d'un article, d'un commentaire et de sa chaîne de commentaires.

L'exécution du script est parallélisée, il écrit donc sur n différents CSV - n en fonction du paramètre NUMBER_OF_PROCESSES - enfin concaténé pour créer le fichier de cornichon résultant.

Modèle

The Notebook training.py contient le réglage fin du modèle de langue DialoGPT-medium sur les données conversationnelles, et est principalement une adaptation du code que vous pouvez trouver dans this notebook .

L'exécution demo.py commencera la conversation.

En cours d'exécution

Pour exécuter tout le code dans le respository, vous pouvez créer un environnement virtuel et exécuter les commandes suivantes.

 virtualenv venv 
source ./venv/bin/activate
pip install -r requirements.txt

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-08
taille 24.91KB
Provenant de Github

Applications connexes

Enfants traversant la route m xylose m

2024-03-08
chat m xylose m

2024-02-23
M bandes dessinées

2023-08-25
csgom

2023-08-21
Voyage 2M

2023-06-16
Royaume des Dragons M

2023-06-09

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout