FineInfer
1.0.0
| Papel |
O FineInfer é um protótipo de pesquisa para ajustar e servir grandes modelos de idiomas.
O FineInfer suporta o ajuste fino e a inferência com eficiência de parâmetro simultâneos através dos seguintes recursos:
Instalação e exemplos
A versão atual remove alguns recursos e funcionalidades anteriores. Se você precisar deles, faça o download das versões anteriores.
@inproceedings{FineInfer,
author = {He, Yongjun and Lu, Yao and Alonso, Gustavo},
title = {Deferred Continuous Batching in Resource-Efficient Large Language Model Serving},
year = {2024},
booktitle = {Proceedings of the 4th Workshop on Machine Learning and Systems},
pages = {98–106},
series = {EuroMLSys '24}
}