Descargar mbti_chatbot - Descargar el código fuente mbti

mbti_chatbot

Código Fuente de IA

1.0.0

Descargar

MBTI chatbot

Este repositorio contiene el código para desarrollar un chatbot que pueda tomar uno de los 16 tipos de personalidad de Myers-Briggs .

Raspando datos

El chatbot está ajustado para cada personalidad utilizando publicaciones y comentarios que pertenecen al subreddit correspondiente (por ejemplo, R/INFJ para el tipo INFJ ).

reddit_scraper.py contiene el script para raspar un subreddit dado. Para ejecutarlo, primero necesita una instancia de una base de datos MySQL para conectarse. También necesita algunos parámetros asociados a su cuenta Reddit y a la base de datos MySQL: todo debe insertarse en un archivo config.py , siguiendo el esquema de config.example.py .

El guión primero cargará todas las publicaciones en una tabla llamada posts , y luego sus comentarios en una tabla llamaron comments . Aunque se ha aplicado la paralelización, esta segunda parte tomará muchas horas. Es por eso que, una vez que haya descargado las publicaciones que le interesa a través del script principal (~ 20 minutos), puede usar el script comments_scraper.py para descargar los comentarios asociados. Si lo interrumpe, la próxima vez que lo ejecute, el guión comenzará desde donde se fue.

Capacitación

Preparación de datos

Para entrenar el modelo, primero informé datos en el conversational dataset format , es decir, una tabla CSV con la siguiente estructura.

identificación	respuesta	contexto	contexto/0	...	contexto/n
s892nn	Estoy bien	Está bien. ¿Qué pasa contigo?	¿Cómo es la vida?	...	¡Hola!

Aquí, el contexto/n representa el comienzo de la conversación, yendo al intercambio más reciente (mostrado en contexto/0 , contexto y respuesta , que es la última oración en la conversación). Es posible cambiar la cardinalidad de los contextos anulando el parámetro NUMBER_OF_CONTEXTS en el archivo config.py .

El script create_conversational_dataset.py genera el CSV que comienza desde las tablas SQL creadas durante la fase de raspado, guardándolo en un archivo de encurtido en la carpeta de datos. Una conversación se construye a partir de una publicación y uno de sus comentarios directos o desde una publicación, un comentario y su cadena de comentarios.

La ejecución del script está paralelo, por lo que se escribe en n diferentes csvs, n dependiendo del parámetro NUMBER_OF_PROCESSES , finalmente concatenado para crear el archivo de pepinillo resultante.

Modelo

El Notebook training.py contiene el ajuste del modelo de lenguaje DialoGPT-medium en los datos de conversación, y es principalmente una adaptación del código que puede encontrar en this notebook .

Ejecutar demo.py comenzará la conversación.

Correr

Para ejecutar todo el código en el Respository, puede crear un entorno virtual y ejecutar los siguientes comandos.

 virtualenv venv 
source ./venv/bin/activate
pip install -r requirements.txt

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-08
tamaño 24.91KB
Proviene de Github

Aplicaciones relacionadas

Niños cruzando la calle m xilosa m

2024-03-08
gato m xilosa m

2024-02-23
cómics

2023-08-25
csgom

2023-08-21
Viaje 2M

2023-06-16
Reino Dragón M

2023-06-09

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo