Fine tuning an LLM using LoRA Fine tuning an LLM using LoRA

Fine tuning an LLM using LoRA

Ai源碼

1.0.0

下載

微調an-llm using-lora

該存儲庫的靈感來自文章“微調大語言模型（LLM）”，並包含使用斯坦福情緒Treebank（SST-2）數據集和LORA（大型語言模型的低級改編）訓練文本分類模型的代碼。洛拉（Lora）是使語言模型更加適應性和高效的一種方式。洛拉沒有再次訓練整個模型，而是凍結了預訓練的模型，並在每個模型層中添加了較小的可訓練矩陣。這些矩陣有助於模型適應不同的任務，而無需更改所有參數。

安裝

在此存儲庫中使用代碼之前，您需要安裝所需的庫。您可以通過運行以下命令來執行此操作：

 ! pip install datasets
! pip install transformers
! pip install peft
! pip install evaluate

這些命令將安裝必要的Python庫，用於使用數據集，變壓器，LORA和評估指標。

用法

這是在此存儲庫中使用代碼的方法：

加載SST-2數據集：
該代碼使用擁抱面部datasets集庫加載SST-2數據集。 SST-2由電影評論的句子組成，並帶有情感標籤註釋。您可以在此處找到有關SST-2數據集的更多信息。
定義Lora模型體系結構：
該代碼使用LORA技術來微調用於文本分類的預訓練的語言模型。洛拉通過利用重量差異的低級別特性來有效地適應該模型。可以在代碼中找到LORA的實現。
tokenize數據集：
使用模型的令牌化數據集對數據集進行了令牌化，並且如果尚不存在，則添加了[PAD]之類的特殊令牌。
訓練洛拉模型：
該代碼定義了訓練超參數，並使用提供的數據集訓練洛拉適應的模型。可以在training_args變量中調整諸如學習率，批量規模和時期數量之類的培訓論點。
通過訓練有素的洛拉模型推斷：
訓練後，您可以使用訓練有素的洛拉適應模型來推斷新文本輸入。該代碼演示瞭如何加載模型並在示例句子列表中進行預測。