funnybot下載 - funnybot源代碼下載

funnybot

Ai源碼

1.0.0

下載

有趣的機器人

這是一種創建一個有趣的機器人，該機器人在笑話中訓練。該項目的目的是從字符級別的LSTM模型中繪製實際上很有趣的樣本。

閱讀我的博客文章以進行詳細分析和結果。

該項目還獲得了TED想法的報導：https：//ideas.ted.com/can-you-teach-a-computer-to-be-funny/

數據集

簡短的笑話：它包含231,657個短笑話和小伙子。對於語言模型，將處理數據集的CSV文件並寫入帶有utils/csv_to_text.py的單獨的文本文件data/shortjokes.txt 。
朋友：作為一項有趣的任務，使用utils/friends.py腳本將電視系列朋友的所有情節的成績單編譯為4.79mb（ /data/friends.txt ）的單個文本文件。目的是生成與該系列中的對話類似的有趣文本。截至目前，該腳本是臨時的，因此歡迎貢獻。

依賴性

Python-預處理數據集。
火炬- 語言模型用火炬編寫。

運行模型

導航到/src/文件夾並運行以下命令：

python scripts/preprocess.py --input_txt ../data/shortjokes.txt  --output_h5 my_data.h5  --output_json my_data.json
th train.lua -input_h5 my_data.h5 -input_json my_data.json -model_type lstm -num_layers 3 -rnn_size 512

這將在笑話數據集上開始的50個時期的培訓會話，然後將檢查點保存在src/cv/文件夾中，每1000次迭代使用cv/checkpoint_1000.t7等名稱。

要從受過訓練的檢查點中使用2000個字符的數據採樣（例如3000個迭代後），請運行以下命令：

th sample.lua -checkpoint cv/checkpoint_3000.t7 -length 2000

如果有任何錯誤，則缺失依賴項或更多信息，請參閱Torch-RNN。

貢獻和招待

從utils/friends.py收集的數據包含許多額外的標題，這些標頭已手動刪除。如果可以自動化此任務，那將是很棒的。
它已嘗試使數據集盡可能清潔。因此，歡迎對笑話數據集的相關補充。

展開

附加信息

版本 1.0.0
類型 Ai源碼
更新時間 2025-09-07
大小 87.86MB
來自於 Github

相關應用

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
pywin_contextmenu

Ai源碼

Version update
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部