Una guía completa para la construcción de aplicaciones LLM a base de Rag para la producción.
En esta guía, aprenderemos cómo:
Usaremos OpenAI para acceder a modelos ChatGPT como gpt-3.5-turbo , gpt-4 , etc. y los puntos finales de cualquier escala para acceder a OSS LLM como Llama-2-70b . Asegúrese de crear sus cuentas para ambas y tener sus credenciales listas.
g3.8xlarge , que tiene 2 GPU y 32 CPU. También podemos agregar nodos de trabajadores de GPU para ejecutar las cargas de trabajo más rápido. Si no está en AnyScale, puede configurar una instancia similar en su nube.default_cluster_env_2.6.2_py39 .us-west-2 si desea usar los artefactos en nuestro almacenamiento compartido (documentos de origen, vertederos de DB vectorial, etc.).git clone https://github.com/ray-project/llm-applications.git .
git config --global user.name < GITHUB-USERNAME >
git config --global user.email < EMAIL-ADDRESS > Nuestros datos ya están listos en /efs/shared_storage/goku/docs.ray.io/en/master/ (en staging, us-east-1 ) Pero si desea cargarlo usted mismo, ejecute este comando bash (cambio /desired/output/directory , pero asegúrese de que esté en el almacenamiento compartido, de modo que sea accesible para los trabajadores)
git clone https://github.com/ray-project/llm-applications.git . Luego configure el entorno correctamente especificando los valores en su archivo .env e instalando las dependencias:
pip install --user -r requirements.txt
export PYTHONPATH= $PYTHONPATH : $PWD
pre-commit install
pre-commit autoupdatetouch .env
# Add environment variables to .env
OPENAI_API_BASE= " https://api.openai.com/v1 "
OPENAI_API_KEY= " " # https://platform.openai.com/account/api-keys
ANYSCALE_API_BASE= " https://api.endpoints.anyscale.com/v1 "
ANYSCALE_API_KEY= " " # https://app.endpoints.anyscale.com/credentials
DB_CONNECTION_STRING= " dbname=postgres user=postgres host=localhost password=postgres "
source .env¡Ahora estamos listos para pasar por el cuaderno interactivo Rag.ipynb para desarrollar y servir nuestra aplicación LLM!
Llama-3-70b ) y puntos finales privados disponibles a pedido (prueba de tokens gratis de 1 m).