BachelorProject
1.0.0
该存储库为使用预训练的语言模型提供了一个基于及时分类的框架,重点是波斯文本分类任务。它包括用于生成提示的脚本和笔记本,进行分类的微调提示,评估结果以及分析模型性能指标,例如F1得分,精度和召回。存储库还支持K-Shot学习,以通过合并相关示例来增强模型适应性。
代码:包含用于模型培训,及时生成和评估的核心代码和笔记本。
AYA-Colab.ipynb :培训和微调提示的主要笔记本,并在Colab上使用AYA模型。Classification_report.ipynb :生成分类指标,包括不同提示设置的F1分数,精度和召回。Creating_dataset.ipynb :数据准备和数据集创建,用于及时的学习。f1-calculation.py脚本以计算和可视化F1分数。news-aya-symbol-tuning.ipynb :基于符号的调谐笔记本,使用AYA模型用于文本分类。news-aya-system-user-prompt.ipynb :用于使用预训练的语言模型生成系统和用户提示的脚本。Symbol_tuning_aya.ipynb :用于优化及时有效性的符号调整笔记本。数据集:包含用于培训和评估的数据集。
提示:包含用于各种分类任务的提示模板。
幻灯片:文档和演示文件,解释了秘密学习,及时设计,K-shot学习和符号调整。
In-Context Learning.pptx & In-Context Learning.pdf :有关使用文字内在学习进行模型调整的详细信息。System-User Prompt Design.pptx和System-User Prompt Design.pdf :设计系统和用户提示指南。Symbol Tuning.pptx和Symbol Tuning.pdf :使用符号调整提高及时性能的说明。 克隆存储库:
git clone https://github.com/ShayanSalehi81/BachelorProject
cd BachelorProject安装所需的软件包:
pip install -r requirements.txt用拥抱面(如有必要)进行身份验证,并安装其他库:
huggingface-cli login --token YOUR_HUGGINGFACE_TOKEN在Codes目录中运行任何笔记本或Python脚本,以执行诸如DataSet创建,及时调整或评估之类的任务。
Generator类加载预训练的语言模型,格式提示并生成预测。该脚本支持4位量化,以进行有效的内存使用情况,并利用用户提供的提示将波斯新闻数据分类为“重要”或“不重要”。news-aya-symbol-tuning.ipynb和Symbol_tuning_aya.ipynb之类的笔记本旨在微调提示符号,这可以提高模型可解释性和响应一致性。符号调整引入了对提示的小调整,从而增强了模型对细微疑问的理解。 Creating_dataset.ipynb进行预处理和格式化数据集。news-aya-system-user-prompt.ipynb来定义系统和用户提示,并在数据集上运行分类。Classification_report.ipynb来计算准确性和f1得分和f1-calculation.py等指标可视化性能。news-aya-symbol-tuning.ipynb以使用符号调整来完善及时设计。 该项目已根据MIT许可获得许可。
欢迎捐款!随时提交问题,功能请求或提取请求以增强该项目。