Fine tuning an LLM using LoRA

Fine tuning an LLM using LoRA

AI 소스 코드

1.0.0

다운로드

미세 조정 앤 -llm-using-lora

이 저장소는 "LLMS (Lange Language Models)"기사에서 영감을 얻었으며 Stanford Sentiment TreeBank (SST-2) 데이터 세트와 LORA (대형 언어 모델의 낮은 순위 적응) 미세 조정을 사용하여 텍스트 분류 모델을 훈련하기위한 코드가 포함되어 있습니다. Lora는 언어 모델을보다 적응력 있고 효율적으로 만들 수있는 방법입니다. Lora는 각 작업마다 전체 모델을 다시 훈련하는 대신 사전 훈련 된 모델을 동결하고 각 모델 레이어에 작은 훈련 가능한 행렬을 추가합니다. 이 행렬은 모델이 모든 매개 변수를 변경하지 않고 다른 작업에 적응하는 데 도움이됩니다.

설치

이 저장소에서 코드를 사용하기 전에 필요한 라이브러리를 설치해야합니다. 다음 명령을 실행하여이를 수행 할 수 있습니다.

 ! pip install datasets
! pip install transformers
! pip install peft
! pip install evaluate

이 명령은 데이터 세트, 변압기, LORA 및 평가 측정 항목으로 작업하는 데 필요한 Python 라이브러리를 설치합니다.

용법

이 저장소에서 코드를 사용하는 방법은 다음과 같습니다.

SST-2 데이터 세트로드 :
코드는 Hugging Face datasets 라이브러리를 사용하여 SST-2 데이터 세트를로드합니다. SST-2는 감정 레이블로 주석이 달린 영화 리뷰의 문장으로 구성됩니다. SST-2 데이터 세트에 대한 자세한 내용은 여기를 참조하십시오.
LORA 모델 아키텍처 정의 :
이 코드는 LORA 기술을 사용하여 텍스트 분류를 위해 미리 훈련 된 언어 모델을 미세 조정합니다. LORA는 중량 차이의 낮은 순위 특성을 활용하여 모델을 작업에 효율적으로 조정합니다. LORA의 구현은 코드에서 찾을 수 있습니다.
데이터 세트 토큰 화 :
데이터 세트는 모델의 토큰 화기를 사용하여 토큰 화되었으며 [PAD] 와 같은 특수 토큰이 아직 존재하지 않으면 추가됩니다.
LORA 모델 교육 :
이 코드는 훈련 하이퍼 파라미터를 정의하고 제공된 데이터 세트를 사용하여 LORA 적응 모델을 훈련시킵니다. 학습 속도, 배치 크기 및 에포크 수와 같은 교육 논쟁은 training_args 변수에서 조정할 수 있습니다.
훈련 된 LORA 모델로 추론하십시오 .
훈련 후, 훈련 된 LORA 적응 모델을 사용하여 새로운 텍스트 입력에 대한 추론을 할 수 있습니다. 코드는 모델을로드하고 예제 문장 목록을 예측하는 방법을 보여줍니다.