Download gpt light - Unduh Kode Sumber gpt light

gpt light

Kode Sumber AI

1.0.0

Unduh

GPT-LIGHT

Tldr

Tujuan repo ini adalah untuk memberikan implementasi sederhana dari model GPT yang dapat digunakan untuk aplikasi produksi. Kode saat ini mendukung kasus penggunaan berikut:

Melatih arsitektur GPT dari awal.
Menyempurnakan model GPT yang ada (misalnya model GPT2 open source) pada data baru.
Menggunakan model GPT terlatih untuk membuat prediksi batch.
Menyebarkan model GPT terlatih sebagai API REST untuk disajikan.

Jangan ragu untuk membayar repo ini dan menggunakannya sebagai templat untuk mengembangkan aplikasi GPT Anda sendiri.

Pekerjaan di masa depan

Kami ingin akhirnya termasuk penyetelan chatgpt berbasis RL. Secara umum ini tidak mengubah model pengetahuan yang mendasarinya tetapi membuat interaksi dengan model lebih seperti manusia.

Pengaturan

Menyiapkan kode cukup minim dan dapat dengan mudah direproduksi di lingkungan VM lokal atau cloud.*

Instal Pytorch (dengan dukungan GPU opsional)
Buat Lingkungan Conda:

 conda create -n python38 python=3.8
conda activate python38

Instal dependensi:

 conda install --file requirements.txt

* Di masa depan kami akan mencoba memberikan versi Docker dari pengaturan ini.

Menjalankan barang

Mempersiapkan data kecil-shakespeare

Kami memberikan kode sampel yang mengunduh dan melakukan preprocess di dataset Tiny-Shakespeare untuk pelatihan dan penyempurnaan. Gunakan kode ini sebagai templat untuk membuat pemrosesan data untuk data Anda sendiri.

 python src/data_io/fetch_shakespeare.py

Melatih Tiny-Shakespeare

Melatih model GPT yang sangat kecil dari awal pada dataset Tiny-Shakespeare yang dibuat pada langkah sebelumnya. Model yang dihasilkan tidak akan sangat digeneralisasikan karena agak kecil dan terlatih pada dataset yang sangat kecil tetapi dapat menghasilkan kutipan seperti Shakespeare.

Ubah file konfigurasi dan untuk melatih model dari awal pada data Anda sendiri. Pada titik ini Anda dapat secara teknis skala ke ukuran model yang sangat besar sesuai dengan ukuran data dan sumber daya Anda.*

 python src/training/train_main.py --config_file config/train_shakespeare_small.yml

* Untuk langkah ini Anda mungkin akan membutuhkan satu atau beberapa GPU.

Fine-tuning gpt2 di shakespeare

Menyempurnakan model GPT2 open source pada data Anda sendiri. Dimungkinkan untuk menggunakan model seperti GPT open source (GPT2-Medium, GPT2-XL dll). Ini adalah opsi yang lebih umum karena membutuhkan lebih sedikit data dan sumber daya (dimungkinkan untuk menjalankan ini bahkan pada CPU) dan jauh lebih cepat daripada pelatihan dari awal.

 python src/training/train_main.py --config_file config/finetune_shakespeare.yml

Pengambilan sampel dari model Shakespeare

Contoh sejumlah output dari model terlatih yang diberikan prompt input. Ini dapat digunakan untuk inferensi batch.

 python src/inference/sample_main.py --config_file config/sample_shakespeare.yml

Mulai server

Server Lightweigth yang melayani model terlatih dalam API REST.

 uvicorn src.inference.service_main:app --reload --reload-include config/sample_gpt2.yml

Setelah server berjalan, Anda dapat meminta titik akhir dengan prompt (sebagai permintaan pos). Untuk detail lebih lanjut tentang spesifik kueri, lihat skrip pengujian berikut.

Uji titik akhir

Setelah server Anda berjalan, Anda dapat menguji titik akhir menggunakan skrip berikut.

 python src/inference/test_query.py

Pengujian

Repo ini telah dikerahkan memiliki aplikasi produksi dalam pikiran dan termasuk pengujian unit dan integrasi.

* Tesing bukanlah ATM yang luas tetapi kami akan mencoba meningkatkan cakupan di masa depan.

Jalankan tes unit

Tes unit telah dimasukkan untuk mencakup fungsionalitas utama. Anda dapat menjalankan suite pengujian unit lengkap dengan perintah berikut:

 pytest test/unit/

Jalankan tes integrasi

Selain tes unit, kami telah menyertakan beberapa tes integrasi untuk pelatihan, fine-tuning dan pengambilan sampel alur kerja.

 pytest test/integration/

* Pengujian integrasi saat ini membutuhkan data untuk bekerja (lihat di atas).

Pengaturan pra-komit

Secara umum disarankan untuk memungkinkan kait pra-komit saat bekerja dengan repo. Saat ini menjalankan beberapa pemeriksaan pemformatan dasar dan menjalankan rangkaian pengujian unit (tetapi bukan tes integrasi).

 conda install -c conda-forge pre-commit
pre-commit install

Ucapan Terima Kasih

Implementasi GPT dalam repo ini terinspirasi oleh repo Nanogpt oleh Andrej Karpathy. Tujuan kami adalah untuk mengimplementasikan kembali, menyusun kembali dan memperluasnya dengan modul yang membuatnya mudah untuk membangun berbagai jenis aplikasi produksi di atasnya.

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-09-10
ukuran 468.07KB
Berasal dari Github

Aplikasi Terkait

Film dan televisi GPT versi terbaru

2023-10-30
Perangkat Lunak Ringan Ringan

2023-07-11
Aplikasi BWEE Ringan

2023-06-17
Labirin Ringan versi Cina

2023-05-15
Drifter Sangat Ringan

2022-08-08
Cahaya Terakhir

2022-07-30

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
ML stack

Kode Sumber AI

1.0.0
awesome free chatgpt

Kode Sumber AI

1.0.0
pywin_contextmenu

Kode Sumber AI

Version update
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua