Unduh funnybot - Unduh Kode Sumber funnybot

funnybot

Kode Sumber AI

1.0.0

Unduh

Funnybot

Ini adalah upaya untuk membuat bot lucu yang dilatih pada kumpulan lelucon. Tujuan dari proyek ini adalah untuk menggambar sampel yang sebenarnya lucu, dari model LSTM tingkat karakter.

Baca posting blog saya untuk analisis dan hasil terperinci.

Proyek ini juga mendapat liputan di TED Ideas: https://ideas.ted.com/can-you-tach-a-computer-to-te-funny/

Kumpulan data

Lelucon pendek : berisi 231.657 lelucon pendek dan oneliner. Untuk model bahasa, file CSV dari dataset diproses dan ditulis ke data/shortjokes.txt dengan utils/csv_to_text.py .
Teman : Sebagai tugas yang menyenangkan, transkrip dari semua episode serial TV teman dikompilasi menjadi satu file teks 4.79MB ( /data/friends.txt ) menggunakan skrip utils/friends.py . Maksudnya adalah untuk menghasilkan teks lucu yang mirip dengan dialog dalam seri. Scriptnya ad-hoc sampai sekarang, jadi kontribusi dipersilakan.

Dependensi

Python - preprocessing dataset.
Torch - Model bahasa ditulis dalam obor.

Model berjalan

Arahkan ke /src/ folder dan jalankan perintah berikut:

python scripts/preprocess.py --input_txt ../data/shortjokes.txt  --output_h5 my_data.h5  --output_json my_data.json
th train.lua -input_h5 my_data.h5 -input_json my_data.json -model_type lstm -num_layers 3 -rnn_size 512

Ini akan memulai sesi pelatihan 50 zaman pada dataset lelucon dan pos pemeriksaan disimpan dalam src/cv/ folder setiap 1000 iterasi dengan nama seperti cv/checkpoint_1000.t7 .

Untuk mencicipi data dengan 2000 karakter dari pos pemeriksaan terlatih (katakanlah setelah 3000 iterasi), jalankan perintah berikut:

th sample.lua -checkpoint cv/checkpoint_3000.t7 -length 2000

Dalam hal kesalahan apa pun, dependensi yang hilang atau info lebih lanjut, lihat Torch-RNN.

Kontribusi dan Todo

Data yang dikumpulkan dari utils/friends.py berisi banyak header tambahan, yang secara manual dihapus. Akan lebih bagus jika tugas ini dapat diotomatisasi.
Telah berusaha menjaga dataset sebersih mungkin. Jadi, penambahan yang relevan untuk dataset lelucon dipersilakan.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-07
ukuran 87.86MB
Berasal dari Github

Aplikasi Terkait

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua