Panduan komprehensif untuk membangun aplikasi LLM berbasis RAG untuk produksi.
Dalam panduan ini, kita akan belajar bagaimana:
Kami akan menggunakan OpenAi untuk mengakses model chatgpt seperti gpt-3.5-turbo , gpt-4 , dll. Dan titik akhir apa pun untuk mengakses OSS LLMS seperti Llama-2-70b . Pastikan untuk membuat akun Anda untuk keduanya dan menyiapkan kredensial Anda.
g3.8xlarge , yang memiliki 2 GPU dan 32 CPU. Kami juga dapat menambahkan node pekerja GPU untuk menjalankan beban kerja lebih cepat. Jika Anda tidak berada di Anyscale, Anda dapat mengonfigurasi instance serupa di cloud Anda.default_cluster_env_2.6.2_py39 .us-west-2 jika Anda ingin menggunakan artefak di penyimpanan bersama kami (sumber dokumen, dump vektor DB, dll.).git clone https://github.com/ray-project/llm-applications.git .
git config --global user.name < GITHUB-USERNAME >
git config --global user.email < EMAIL-ADDRESS > Data kami sudah siap di /efs/shared_storage/goku/docs.ray.io/en/master/ (pada pementasan, us-east-1 ) tetapi jika Anda ingin memuatnya sendiri, jalankan perintah bash ini (perubahan /desired/output/directory , tetapi pastikan itu pada penyimpanan yang dibagikan, sehingga dapat diakses oleh para pekerja)
git clone https://github.com/ray-project/llm-applications.git . Kemudian atur lingkungan dengan benar dengan menentukan nilai dalam file .env Anda, dan menginstal dependensi:
pip install --user -r requirements.txt
export PYTHONPATH= $PYTHONPATH : $PWD
pre-commit install
pre-commit autoupdatetouch .env
# Add environment variables to .env
OPENAI_API_BASE= " https://api.openai.com/v1 "
OPENAI_API_KEY= " " # https://platform.openai.com/account/api-keys
ANYSCALE_API_BASE= " https://api.endpoints.anyscale.com/v1 "
ANYSCALE_API_KEY= " " # https://app.endpoints.anyscale.com/credentials
DB_CONNECTION_STRING= " dbname=postgres user=postgres host=localhost password=postgres "
source .envSekarang kami siap melalui notebook interaktif Rag.ipynb untuk mengembangkan dan melayani aplikasi LLM kami!
Llama-3-70b ) dan titik akhir pribadi yang tersedia berdasarkan permintaan (uji coba Token Gratis).