Unduh TinyStories - Unduh Kode Sumber TinyStories

TinyStories

Kode sumber lainnya

1.0.0

Unduh

Repositori berisi kode untuk mengonfigurasi model 28m Pamam GPT-2 untuk melatihnya pada dataset TinyStories seperti kertas TinyStories. Di koran, mereka menggunakan beberapa variasi model GPT-2 dan GPT-NEO , tetapi GPT-2 adalah versi sorotan. Mereka mencoba menunjukkan bahwa Anda dapat membuat SLM (model bahasa kecil) hingga params ukuran kecil sampai masuk akal dan bersaing dengan LLMS.

Saya hanya menyediakan kode untuk mengonfigurasi model 28m sebagai transformator saat ini memiliki masalah untuk menginstal versi favorit saya transformers==4.2.2 dan Transformers Baru memerlukan Accelerate jika Anda menggunakan Pytorch dan memerlukan partial state , saya tidak yakin bagaimana Anda menyelesaikan kesalahan keadaan parsial setidaknya sekarang. Tapi, saya ingin metode ini mengkonfigurasi model 28m secepatnya! Itulah sebabnya, saya hanya menyediakan kode konfigurasi. Nantinya akan memperbarui repo untuk menambahkan kode pelatihan.

Pembaruan yang akan datang:

Memberikan skrip pelatihan
~~Memberikan dataset TinyStories dalam format .txt~~

Pembaruan Saat Ini:

Metode Pustaka Torchscale Ditambahkan untuk pengkodean LLM dari jumlah apa pun Params yang nyaman. Notebook: https://github.com/sleepingcat4/tinystories/blob/master/alright!_calculated_param.ipynb

Dataset: Dataset TinyStories memiliki dua bagian `` `1. GPT-3.5 Turbo yang dihasilkan Dataset and 2.GPT-4 Dataset yang dihasilkan`` termasuk keduanya akan mengambil sejumlah ruang yang mengapa, saya hanya memberikan dataset GPT-3.5 Turbo . Tautan Google Drive

Di tautan Google Drive yang disediakan di bagian Dataset, Anda menemukan dataset GPT-3.5 (Turbo) dan GPT-4 yang digunakan oleh Autors Kertas '

Tolong, bintangi repositori jika Anda merasa bermanfaat dan bantu orang lain untuk menemukannya. Tautan kertas

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-03-06
ukuran 4.94KB
Berasal dari Github

Aplikasi Terkait

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua