Download de funnybot - Download de código fonte funnybot

funnybot

Código-Fonte de IA

1.0.0

Baixar

Funnybot

Esta é uma tentativa de criar um bot engraçado treinado em um corpus de piadas. O objetivo do projeto é desenhar amostras que são realmente engraçadas, a partir de um modelo LSTM de nível de personagem.

Leia minha postagem no blog para análises e resultados detalhados.

Este projeto também obteve cobertura em idéias do TED: https://ideas.ted.com/can-you-teach-a-computer-to-be---uns-nny/

Conjuntos de dados

Piadas curtas : Ele contém 231.657 piadas curtas e Oneliners. Para o modelo de idioma, o arquivo CSV do conjunto de dados é processado e gravado em um arquivo de texto separado data/shortjokes.txt com utils/csv_to_text.py .
Amigos : como uma tarefa divertida, transcrições de todos os episódios de séries de TV Friends são compilados em um único arquivo de texto de 4.79MB ( /data/friends.txt ) usando o script utils/friends.py . A intenção é gerar texto engraçado semelhante aos diálogos da série. O script é ad-hoc a partir de agora, então as contribuições são bem-vindas.

Dependências

Python - pré -processando o conjunto de dados.
Torch - Modelo de idioma está escrito na tocha.

Modelo em execução

Navegue até /src/ pasta e execute os seguintes comandos:

python scripts/preprocess.py --input_txt ../data/shortjokes.txt  --output_h5 my_data.h5  --output_json my_data.json
th train.lua -input_h5 my_data.h5 -input_json my_data.json -model_type lstm -num_layers 3 -rnn_size 512

Isso iniciará a sessão de treinamento de 50 épocas no conjunto de dados de piadas e os pontos de verificação são salvos na pasta src/cv/ a cada 1000 iterações com nomes como cv/checkpoint_1000.t7 .

Para amostrar dados com 2000 caracteres do ponto de verificação treinado (digamos após 3000 iterações), execute o seguinte comando:

th sample.lua -checkpoint cv/checkpoint_3000.t7 -length 2000

Em caso de erros, falta de dependências ou mais informações, consulte a Torch-rnn.

Contribuições e Todos

Os dados compilados da utils/friends.py contêm muitos cabeçalhos extras, que foram removidos manualmente. Seria ótimo se essa tarefa pudesse ser automatizada.
Foi tentado manter o conjunto de dados o mais limpo possível. Portanto, adições relevantes ao conjunto de dados de piadas são bem -vindas.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-07
tamanho 87.86MB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos