Finetune_LLMs下載Finetune_LLMs源代碼下載

下載

Finetune LLM

此存儲庫包含使用著名報價數據集微調大語言模型（LLM）的代碼。

鑑定的支持方法是深速，洛拉或Qlora。

最初，當尚未將其添加到HuggingFace Transformer軟件包中時，存儲庫下載並轉換了GPTJ的模型權重。該代碼仍然可以在Branch original_youtube下看到。

/quotes_dataset包含適當格式進行微調的數據集。請參閱repo以在此處製作此數據集

/finetuning_repo包含最初來自此處的存儲庫的代碼，我已修改過這些代碼，以使用更多模型和更多方法。

如果需要付費專業幫助，可以通過此電子郵件獲得

在此處查看原始回購代碼的舊視頻以獲取視頻教程。

可以在此處看到一個更新的視頻，用於使用HuggingFace模型

轉到original_youtube分支您想查看代碼，但我強烈建議您使用更多現代方法

更新的演練使用NVIDIA-DOCKER使頭痛擺脫了大部分時間。

如果您有一個64位Linux系統，並且需要A100的驅動程序，則可以運行這樣的命令來設置。

wget https://us.download.nvidia.com/tesla/515.86.01/NVIDIA-Linux-x86_64-515.86.01.run

然後，您將使用sudo運行下載的程序。

chmod 777 NVIDIA-Linux-x86_64-515.86.01.run

sudo ./NVIDIA-Linux-x86_64-515.86.01.run

首先，通過運行build_image.sh構建docker映像。如果您收到有關無法找到Docker映像的錯誤，請更新到更新的CUDA版本。圖像定期棄用。然後打開PR，以便您可以為他人解決此問題。構建Docker圖像可能需要幾分鐘。
run run_image.sh 。該腳本運行剛剛構建的Docker映像，並將當前目錄安裝到Docker容器內部的/workspace 。系統中的所有GPU將通過。此外，為了防止每次運行此容器時下載模型，您的.cache也將通過。
現在，該圖像可用於使用GPU或使用DeepSpeed推斷的模型進行列式。導航到另一個文件夾以獲取更多信息

展開

附加信息

相關應用

爲您推薦

相關資訊全部