BachelorProject
1.0.0
該存儲庫為使用預訓練的語言模型提供了一個基於及時分類的框架,重點是波斯文本分類任務。它包括用於生成提示的腳本和筆記本,進行分類的微調提示,評估結果以及分析模型性能指標,例如F1得分,精度和召回。存儲庫還支持K-Shot學習,以通過合併相關示例來增強模型適應性。
代碼:包含用於模型培訓,及時生成和評估的核心代碼和筆記本。
AYA-Colab.ipynb :培訓和微調提示的主要筆記本,並在Colab上使用AYA模型。Classification_report.ipynb :生成分類指標,包括不同提示設置的F1分數,精度和召回。Creating_dataset.ipynb :數據準備和數據集創建,用於及時的學習。f1-calculation.py腳本以計算和可視化F1分數。news-aya-symbol-tuning.ipynb :基於符號的調諧筆記本,使用AYA模型用於文本分類。news-aya-system-user-prompt.ipynb提示的腳本。Symbol_tuning_aya.ipynb :用於優化及時有效性的符號調整筆記本。數據集:包含用於培訓和評估的數據集。
提示:包含用於各種分類任務的提示模板。
幻燈片:文檔和演示文件,解釋了秘密學習,及時設計,K-shot學習和符號調整。
In-Context Learning.pptx & In-Context Learning.pdf :有關使用文字內在學習進行模型調整的詳細信息。System-User Prompt Design.pptx和System-User Prompt Design.pdf :設計系統和用戶提示指南。Symbol Tuning.pptx和Symbol Tuning.pdf :使用符號調整提高及時性能的說明。 克隆存儲庫:
git clone https://github.com/ShayanSalehi81/BachelorProject
cd BachelorProject安裝所需的軟件包:
pip install -r requirements.txt用擁抱面(如有必要)進行身份驗證,並安裝其他庫:
huggingface-cli login --token YOUR_HUGGINGFACE_TOKEN在Codes目錄中運行任何筆記本或Python腳本,以執行諸如DataSet創建,及時調整或評估之類的任務。
Generator類加載預訓練的語言模型,格式提示並生成預測。該腳本支持4位量化,以進行有效的內存使用情況,並利用用戶提供的提示將波斯新聞數據分類為“重要”或“不重要”。news-aya-symbol-tuning.ipynb和Symbol_tuning_aya.ipynb之類的筆記本旨在微調提示符號,這可以提高模型可解釋性和響應一致性。符號調整引入了對提示的小調整,從而增強了模型對細微疑問的理解。 Creating_dataset.ipynb進行預處理和格式化數據集。news-aya-system-user-prompt.ipynb來定義系統和用戶提示,並在數據集上運行分類。Classification_report.ipynb來計算準確性和f1得分和f1-calculation.py等指標可視化性能。news-aya-symbol-tuning.ipynb以使用符號調整來完善及時設計。 該項目已根據MIT許可獲得許可。
歡迎捐款!隨時提交問題,功能請求或提取請求以增強該項目。