Descarga de funnybot - Descargar el código fuente de funnybot

funnybot

Código Fuente de IA

1.0.0

Descargar

Funnybot

Este es un intento de crear un bot divertido entrenado en un corpus de bromas. El objetivo del proyecto es dibujar muestras que son realmente divertidas, de un modelo LSTM a nivel de personaje.

Lea mi publicación de blog para obtener análisis y resultados detallados.

Este proyecto también obtuvo cobertura en TED Ideas: https://ideas.te.com/can-you-toach-a-computer-to-be-funny/

Conjuntos de datos

Chistes cortos : contiene 231,657 chistes y onelinistas cortos. Para el modelo de lenguaje, el archivo CSV del conjunto de datos se procesa y se escribe en un archivo de texto separado data/shortjokes.txt con utils/csv_to_text.py .
Amigos : como una tarea divertida, las transcripciones de todos los episodios de la serie de televisión amigos se compilan en un solo archivo de texto de 4.79mb ( /data/friends.txt ) usando el script utils/friends.py . La intención es generar texto divertido similar a los diálogos de la serie. El guión es ad-hoc a partir de ahora, por lo que las contribuciones son bienvenidas.

Dependencias

Python - Preprocesando el conjunto de datos.
Torca - El modelo de idioma está escrito en la antorcha.

Modelo de ejecución

Navegue a /src/ carpeta y ejecute los siguientes comandos:

python scripts/preprocess.py --input_txt ../data/shortjokes.txt  --output_h5 my_data.h5  --output_json my_data.json
th train.lua -input_h5 my_data.h5 -input_json my_data.json -model_type lstm -num_layers 3 -rnn_size 512

Esto comenzará la sesión de entrenamiento de 50 épocas en el conjunto de datos de chistes y los puntos de control se guardan en la carpeta src/cv/ cada 1000 iteraciones con nombres como cv/checkpoint_1000.t7 .

Para probar datos con 2000 caracteres del punto de control entrenado (por ejemplo, después de 3000 iteraciones), ejecute el siguiente comando:

th sample.lua -checkpoint cv/checkpoint_3000.t7 -length 2000

En caso de errores, dependencias faltantes o más información, consulte Torch-RNN.

Contribuciones y Todos

Los datos compilados de utils/friends.py contienen muchos encabezados adicionales, que se eliminaron manualmente. Sería genial si esta tarea pudiera ser automatizada.
Se ha intentado mantener el conjunto de datos lo más limpio posible. Por lo tanto, las adiciones relevantes al conjunto de datos de chistes son bienvenidas.

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-07
tamaño 87.86MB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo