Galore pytorch
1.0.0
GALORE의 비공식 구현 : 그라디언트 저 순위 투영에 의한 메모리 효율적인 LLM 교육
@article{zhao2024galore,
title = {GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection},
author = {Jiawei Zhao and Zhenyu Zhang and Beidi Chen and Zhangyang Wang and Anima Anandkumar and Yuandong Tian},
year = {2024},
journal = {arXiv preprint arXiv: 2403.03507}
}