llm applications
1.0.0
คู่มือที่ครอบคลุมเกี่ยวกับการสร้างแอพพลิเคชั่น LLM ที่ใช้ RAG สำหรับการผลิต
ในคู่มือนี้เราจะได้เรียนรู้วิธี:
เราจะใช้ OpenAI เพื่อเข้าถึงโมเดล ChatGPT เช่น gpt-3.5-turbo , gpt-4 ฯลฯ และจุดสิ้นสุดใด ๆ เพื่อเข้าถึง OSS LLMS เช่น Llama-2-70b อย่าลืมสร้างบัญชีของคุณสำหรับทั้งคู่และเตรียมข้อมูลรับรองของคุณให้พร้อม
g3.8xlarge ซึ่งมี 2 GPU และ 32 ซีพียู นอกจากนี้เรายังสามารถเพิ่มโหนดคนงาน GPU เพื่อเรียกใช้เวิร์กโหลดได้เร็วขึ้น หากคุณไม่ได้อยู่ใน OneScale คุณสามารถกำหนดค่าอินสแตนซ์ที่คล้ายกันบนคลาวด์ของคุณdefault_cluster_env_2.6.2_py39 สภาพแวดล้อมคลัสเตอร์us-west-2 หากคุณต้องการใช้สิ่งประดิษฐ์ในที่เก็บข้อมูลที่ใช้ร่วมกันของเรา (เอกสารต้นฉบับ, DB DB แบบเวกเตอร์ ฯลฯ )git clone https://github.com/ray-project/llm-applications.git .
git config --global user.name < GITHUB-USERNAME >
git config --global user.email < EMAIL-ADDRESS > ข้อมูลของเราพร้อมแล้วที่ /efs/shared_storage/goku/docs.ray.io/en/master/ (ในการแสดงละคร us-east-1 ) แต่ถ้าคุณต้องการโหลดด้วยตัวเองให้เรียกใช้คำสั่ง bash นี้ (เปลี่ยน /desired/output/directory
git clone https://github.com/ray-project/llm-applications.git . จากนั้นตั้งค่าสภาพแวดล้อมอย่างถูกต้องโดยระบุค่าในไฟล์ .env ของคุณและติดตั้งการอ้างอิง:
pip install --user -r requirements.txt
export PYTHONPATH= $PYTHONPATH : $PWD
pre-commit install
pre-commit autoupdatetouch .env
# Add environment variables to .env
OPENAI_API_BASE= " https://api.openai.com/v1 "
OPENAI_API_KEY= " " # https://platform.openai.com/account/api-keys
ANYSCALE_API_BASE= " https://api.endpoints.anyscale.com/v1 "
ANYSCALE_API_KEY= " " # https://app.endpoints.anyscale.com/credentials
DB_CONNECTION_STRING= " dbname=postgres user=postgres host=localhost password=postgres "
source .envตอนนี้เราพร้อมที่จะผ่านสมุดบันทึก Rag.ipynb Interactive เพื่อพัฒนาและให้บริการแอปพลิเคชัน LLM ของเรา!
Llama-3-70b ) และจุดสิ้นสุดส่วนตัวที่มีให้เมื่อมีการร้องขอ (การทดลองโทเค็นฟรี 1M)