distily
1.0.0
pip install -U "git+https://github.com/lapp0/distily.git"
Distily memungkinkan Anda untuk menyaring model dengan
Contoh minimal: distily_gpt2
Perintah untuk membuat gpt2 suling dengan hanya 6 lapisan:
python3 -m distily.run
--teacher_model_name_or_path gpt2
--output_dir distily_gpt2
--hub_model_id "distily/distily_gpt2"
--push_to_hub True
--student_model_config {"n_layers": 6}
--student_model_as_bitnet True
Model distily_gpt2 yang dihasilkan memiliki (TODO: Jelaskan metrik).
Untuk contoh lebih lanjut, tinjau contoh dokumentasi.
Untuk mendorong ke hub, Anda harus menyiapkan token hub Anda
HF_WRITE=<your hub token> python3 -c "from huggingface_hub.hf_api import HfFolder; HfFolder.save_token('${HF_WRITE}')"
TODO: Komit dokumen yang ditautkan setelah selesai
Menggunakan disaring
Model yang tersedia
Berkontribusi
num_hidden_layers dengan mengimplementasikan pemetaan layer. intermediate_size , hidden_act ) dengan menggunakan proyektor. num_attention_heads yang dimodifikasi dan num_key_value_heads .