FineInfer
1.0.0
- กระดาษ |
FineInfer เป็นต้นแบบการวิจัยสำหรับการปรับแต่งและให้บริการแบบจำลองภาษาขนาดใหญ่
FineInfer รองรับการปรับจูนพารามิเตอร์ที่มีประสิทธิภาพพร้อมกันและการอนุมานผ่านคุณสมบัติดังต่อไปนี้:
การติดตั้งและตัวอย่าง
เวอร์ชันปัจจุบันจะลบคุณสมบัติและฟังก์ชันก่อนหน้านี้บางส่วน หากคุณต้องการโปรดดาวน์โหลดเวอร์ชันก่อนหน้า
@inproceedings{FineInfer,
author = {He, Yongjun and Lu, Yao and Alonso, Gustavo},
title = {Deferred Continuous Batching in Resource-Efficient Large Language Model Serving},
year = {2024},
booktitle = {Proceedings of the 4th Workshop on Machine Learning and Systems},
pages = {98–106},
series = {EuroMLSys '24}
}