A Bro Who Code dengan Anda



Mengapa selalu Python? Mari kita finetune model pembuatan kode hanya untuk naskah!
Saya membuat dataset 20K instruct-instript. Ini 20.000 pasang {instruksi, output} yang tidak dapat Anda temukan dalam dataset LLMS pembuatan kode saat ini (atau mungkin Anda bisa)

Untuk outputnya, terima kasih HuggingFace, saya mendapatkan data kode TypeScript dari proyek tumpukan
Untuk instruksi, terima kasih Openai, saya membuat permintaan panggilan 20K API untuk menghasilkan instruksi dan penjelasan untuk data kode tersebut
Setiap hal lain tentang pelatihan (parameter, log, ...) Anda dapat melihatnya di sini (tautkan tautan metrik pelatihan huggingface nanti)
Saya menggunakan patokan multipl-e (Cassano et al., 2023) seperti kode model dasar yang digunakan dalam makalah mereka
(tautkan tabel hasil evaluasi nanti)
Anda dapat menemukan karya saya di sini:
Atau hubungi saya di sini: https://levuminhhuy.site/about