Esse repositório fornece uma estrutura para classificação rápida baseada em modelos de idiomas pré-treinados, com foco nas tarefas de classificação de texto persa. Inclui scripts e notebooks para gerar instruções, avisos de ajuste fino para classificação, avaliar resultados e analisar métricas de desempenho do modelo, como pontuação F1, precisão e recall. O repositório também suporta o aprendizado de K-Shot para aprimorar a adaptabilidade do modelo, incorporando exemplos relevantes.
Códigos : contém o código principal e os notebooks para treinamento de modelos, geração imediata e avaliação.
AYA-Colab.ipynb : Notebook principal para treinamento e ajuste fino com os modelos AYA no Colab.Classification_report.ipynb : gera métricas de classificação, incluindo pontuação F1, precisão e recall para diferentes configurações de prompt.Creating_dataset.ipynb : preparação de dados e criação de dados para aprendizado rápido.f1-calculation.py : script Python para calcular e visualizar as pontuações de F1.news-aya-symbol-tuning.ipynb : Notebook para ajuste baseado em símbolos com modelos AYA para classificação de texto.news-aya-system-user-prompt.ipynb : Script para gerar instruções de sistema e usuário usando um modelo de idioma pré-treinado.Symbol_tuning_aya.ipynb : notebook de ajuste do símbolo para otimizar a eficácia imediata.Conjuntos de dados : contém conjuntos de dados usados para treinamento e avaliação.
Prompts : contém modelos de prompt usados para várias tarefas de classificação.
Slides : Arquivos de documentação e apresentação explicando aprendizado no contexto, design rápido, aprendizado de K-Shot e ajuste de símbolos.
In-Context Learning.pptx & In-Context Learning.pdf : Detalhes sobre o uso do Aprendizagem no Contexto para o ajuste do modelo.System-User Prompt Design.pptx & System-User Prompt Design.pdf : Guia para projetar o sistema e os avisos do usuário.Symbol Tuning.pptx & Symbol Tuning.pdf : Instruções sobre o uso do ajuste do símbolo para melhorar o desempenho imediato. Clone o repositório:
git clone https://github.com/ShayanSalehi81/BachelorProject
cd BachelorProjectInstale os pacotes necessários:
pip install -r requirements.txtAutentique com o rosto abraçado (se necessário) e instalar bibliotecas adicionais:
huggingface-cli login --token YOUR_HUGGINGFACE_TOKEN Execute qualquer um dos notebooks ou scripts Python no diretório Codes para executar tarefas como criação de dados, ajuste imediato ou avaliação.
Generator carrega um modelo de idioma pré-treinado, os formatos solicita e gera previsões. O script suporta quantização de 4 bits para uso eficiente da memória e aproveita os avisos fornecidos pelo usuário para classificar os dados de notícias persas como "importantes" ou "não importantes".news-aya-symbol-tuning.ipynb e Symbol_tuning_aya.ipynb são projetados para ajustar símbolos imediatos, o que pode melhorar a interpretabilidade do modelo e a consistência da resposta. O ajuste do símbolo introduz pequenos ajustes nos avisos, aprimorando a compreensão do modelo de consultas diferenciadas. Creating_dataset.ipynb para pré -processamento e formatar seu conjunto de dados.news-aya-system-user-prompt.ipynb para definir os avisos do sistema e do usuário e executar a classificação no conjunto de dados.Classification_report.ipynb para calcular métricas como precisão e pontuação F1 e f1-calculation.py para visualizar o desempenho.news-aya-symbol-tuning.ipynb para refinar o design imediato com o ajuste do símbolo. Este projeto está licenciado sob a licença do MIT.
As contribuições são bem -vindas! Sinta -se à vontade para enviar questões, solicitações de recursos ou obter solicitações para aprimorar este projeto.