distily
1.0.0
pip install -U "git+https://github.com/lapp0/distily.git"
Destily permite que você destilar um modelo com
Exemplo mínimo: distily_gpt2
Comando para criar um gpt2 destilado com apenas 6 camadas:
python3 -m distily.run
--teacher_model_name_or_path gpt2
--output_dir distily_gpt2
--hub_model_id "distily/distily_gpt2"
--push_to_hub True
--student_model_config {"n_layers": 6}
--student_model_as_bitnet True
O modelo distily_gpt2 resultante possui (TODO: Explique métricas).
Para mais exemplos, revise a documentação dos exemplos.
Para empurrar para o hub, você deve preparar seu token hub
HF_WRITE=<your hub token> python3 -c "from huggingface_hub.hf_api import HfFolder; HfFolder.save_token('${HF_WRITE}')"
TODO: Compreenda os documentos vinculados uma vez concluídos
Usando disty
Modelos disponíveis
Contribuindo
num_hidden_layers implementando mapeadores de camada. intermediate_size , hidden_act ) empregando projetores. num_attention_heads modificado e num_key_value_heads .