Finetune_LLMs
1.0.0
此存儲庫包含使用著名報價數據集微調大語言模型(LLM)的代碼。
鑑定的支持方法是深速,洛拉或Qlora。
最初,當尚未將其添加到HuggingFace Transformer軟件包中時,存儲庫下載並轉換了GPTJ的模型權重。該代碼仍然可以在Branch original_youtube下看到。
/quotes_dataset包含適當格式進行微調的數據集。請參閱repo以在此處製作此數據集
/finetuning_repo包含最初來自此處的存儲庫的代碼,我已修改過這些代碼,以使用更多模型和更多方法。
如果需要付費專業幫助,可以通過此電子郵件獲得
在此處查看原始回購代碼的舊視頻以獲取視頻教程。
可以在此處看到一個更新的視頻,用於使用HuggingFace模型
轉到original_youtube分支您想查看代碼,但我強烈建議您使用更多現代方法
更新的演練使用NVIDIA-DOCKER使頭痛擺脫了大部分時間。
如果您有一個64位Linux系統,並且需要A100的驅動程序,則可以運行這樣的命令來設置。
wget https://us.download.nvidia.com/tesla/515.86.01/NVIDIA-Linux-x86_64-515.86.01.run
然後,您將使用sudo運行下載的程序。
chmod 777 NVIDIA-Linux-x86_64-515.86.01.run
sudo ./NVIDIA-Linux-x86_64-515.86.01.run
build_image.sh構建docker映像。如果您收到有關無法找到Docker映像的錯誤,請更新到更新的CUDA版本。圖像定期棄用。然後打開PR,以便您可以為他人解決此問題。構建Docker圖像可能需要幾分鐘。run_image.sh 。該腳本運行剛剛構建的Docker映像,並將當前目錄安裝到Docker容器內部的/workspace 。系統中的所有GPU將通過。此外,為了防止每次運行此容器時下載模型,您的.cache也將通過。