llm applications
1.0.0
생산을위한 래그 기반 LLM 응용 프로그램 구축에 대한 포괄적 인 안내서.
이 안내서에서는 다음과 같은 방법을 배웁니다.
OpenAI를 사용하여 gpt-3.5-turbo , gpt-4 등과 같은 ChatGpt 모델 및 Llama-2-70b 와 같은 OSS LLM에 액세스하기위한 모든 스케일 엔드 포인트에 액세스 할 것입니다. 둘 다에 대한 계정을 만들고 자격 증명을 준비하십시오.
g3.8xlarge 헤드 노드를 사용하여 준비에 대한 새로운 스케일 작업 공간을 시작하십시오. 또한 워크로드를 더 빨리 실행하기 위해 GPU 작업자 노드를 추가 할 수도 있습니다. 스케일이 아닌 경우 클라우드에서 유사한 인스턴스를 구성 할 수 있습니다.default_cluster_env_2.6.2_py39 클러스터 환경을 사용하십시오.us-west-2 사용하십시오.git clone https://github.com/ray-project/llm-applications.git .
git config --global user.name < GITHUB-USERNAME >
git config --global user.email < EMAIL-ADDRESS > 우리의 us-east-1 /desired/output/directory 이미 /efs/shared_storage/goku/docs.ray.io/en/master/
git clone https://github.com/ray-project/llm-applications.git . 그런 다음 .env 파일의 값을 지정하고 종속성을 설치하여 환경을 올바르게 설정하십시오.
pip install --user -r requirements.txt
export PYTHONPATH= $PYTHONPATH : $PWD
pre-commit install
pre-commit autoupdatetouch .env
# Add environment variables to .env
OPENAI_API_BASE= " https://api.openai.com/v1 "
OPENAI_API_KEY= " " # https://platform.openai.com/account/api-keys
ANYSCALE_API_BASE= " https://api.endpoints.anyscale.com/v1 "
ANYSCALE_API_KEY= " " # https://app.endpoints.anyscale.com/credentials
DB_CONNECTION_STRING= " dbname=postgres user=postgres host=localhost password=postgres "
source .env이제 우리는 LLM 응용 프로그램을 개발하고 서비스하기 위해 rag.ipynb 대화식 노트북을 통과 할 준비가되었습니다!
Llama-3-70b 의 경우 $ 1/m 토큰)와 요청시 개인 종료점 (1M 무료 토큰 시험)을 갖춘 서빙 (+미세 조정) OSS LLMS를 시작하십시오.