BachelorProject
1.0.0
이 저장소는 페르시아어 텍스트 분류 작업에 중점을 둔 미리 훈련 된 언어 모델을 사용하여 프롬프트 기반 분류를위한 프레임 워크를 제공합니다. 여기에는 프롬프트 생성을위한 스크립트 및 노트북, 분류를위한 미세 조정 프롬프트, 결과 평가 및 F1 점수, 정밀도 및 리콜과 같은 모델 성능 지표 분석이 포함됩니다. 이 저장소는 또한 관련 예제를 통합하여 모델 적응성을 향상시키는 K-Shot 학습을 지원합니다.
코드 : 모델 교육, 신속한 생성 및 평가를위한 핵심 코드 및 노트북이 포함되어 있습니다.
AYA-Colab.ipynb : Colab의 AYA 모델로 훈련 및 미세 조정 프롬프트를위한 메인 노트.Classification_report.ipynb : 다른 프롬프트 설정에 대한 F1 점수, 정밀도 및 리콜을 포함한 분류 메트릭을 생성합니다.Creating_dataset.ipynb : 프롬프트 기반 학습을위한 데이터 준비 및 데이터 세트 생성.f1-calculation.py : F1 점수를 계산하고 시각화하는 Python 스크립트.news-aya-symbol-tuning.ipynb : 텍스트 분류를위한 AYA 모델과 함께 기호 기반 튜닝을위한 노트.news-aya-system-user-prompt.ipynb : 미리 훈련 된 언어 모델을 사용하여 시스템 및 사용자 프롬프트를 생성하기위한 스크립트.Symbol_tuning_aya.ipynb : 신속한 효과를 최적화하기위한 Symbol Tuning Notebook.데이터 세트 : 교육 및 평가에 사용되는 데이터 세트가 포함되어 있습니다.
프롬프트 : 다양한 분류 작업에 사용되는 신속한 템플릿이 포함되어 있습니다.
슬라이드 : 텍스트 내 학습, 신속한 디자인, K- 샷 학습 및 기호 튜닝을 설명하는 문서 및 프레젠테이션 파일.
In-Context Learning.pptx 및 In-Context Learning.pdf : 모델 튜닝을위한 컨텍스트 학습 사용에 대한 세부 사항.System-User Prompt Design.pptx & System-User Prompt Design.pdf : 시스템 및 사용자 프롬프트 설계 가이드.Symbol Tuning.pptx 및 Symbol Tuning.pdf : 신속한 성능을 향상시키기 위해 기호 튜닝 사용에 대한 지침. 저장소 복제 :
git clone https://github.com/ShayanSalehi81/BachelorProject
cd BachelorProject필요한 패키지 설치 :
pip install -r requirements.txt포옹 얼굴로 인증하고 (필요한 경우) 추가 라이브러리를 설치하십시오.
huggingface-cli login --token YOUR_HUGGINGFACE_TOKEN Codes 디렉토리에서 노트북 또는 파이썬 스크립트를 실행하여 데이터 세트 작성, 프롬프트 튜닝 또는 평가와 같은 작업을 수행하십시오.
Generator 클래스는 미리 훈련 된 언어 모델을로드하고, 형식 프롬프트 및 예측을 생성합니다. 이 스크립트는 효율적인 메모리 사용을위한 4 비트 양자화를 지원하고 페르시아 뉴스 데이터를 "중요한"또는 "중요하지 않은"것으로 분류하기 위해 사용자가 제공 한 프롬프트를 활용합니다.news-aya-symbol-tuning.ipynb 및 Symbol_tuning_aya.ipynb 와 같은 노트북은 프롬프트 기호를 미세 조정하도록 설계되어 모델 해석 가능성과 응답 일관성을 향상시킬 수 있습니다. 기호 튜닝은 프롬프트에 대한 약간의 조정을 도입하여 미묘한 쿼리에 대한 모델의 이해를 향상시킵니다. Creating_dataset.ipynb 사용하여 데이터 세트를 전제 및 포맷하십시오.news-aya-system-user-prompt.ipynb 를로드하여 시스템 및 사용자 프롬프트를 정의하고 데이터 세트에서 분류를 실행합니다.Classification_report.ipynb 사용하여 정확도 및 F1 점수 및 f1-calculation.py 와 같은 메트릭을 계산하여 성능을 시각화하십시오.news-aya-symbol-tuning.ipynb 실행합니다. 이 프로젝트는 MIT 라이센스에 따라 라이센스가 부여됩니다.
기부금을 환영합니다! 이 프로젝트를 향상시키기위한 문제, 기능 요청 또는 요청을 자유롭게 제출하십시오.