Un guide complet pour construire des applications LLM basées sur des chiffons pour la production.
Dans ce guide, nous apprendrons à:
Nous utiliserons OpenAI pour accéder aux modèles ChatGPT comme gpt-3.5-turbo , gpt-4 , etc. et tous les points de terminaison pour accéder aux LLMS OSS comme Llama-2-70b . Assurez-vous de créer vos comptes pour les deux et préparez vos informations d'identification.
g3.8xlarge , qui a 2 GPU et 32 CPU. Nous pouvons également ajouter des nœuds de travail GPU pour exécuter les charges de travail plus rapidement. Si vous n'êtes pas sur des échelons, vous pouvez configurer une instance similaire sur votre cloud.default_cluster_env_2.6.2_py39 .us-west-2 si vous souhaitez utiliser les artefacts dans notre stockage partagé (documents source, vidanges Vector DB, etc.).git clone https://github.com/ray-project/llm-applications.git .
git config --global user.name < GITHUB-USERNAME >
git config --global user.email < EMAIL-ADDRESS > Nos données sont déjà prêtes à /efs/shared_storage/goku/docs.ray.io/en/master/ (sur la mise en scène, us-east-1 ) mais si vous vouliez le charger vous-même, exécutez cette commande bash (modifier /desired/output/directory , mais assurez-vous qu'elle est sur le stockage partagé, afin qu'il soit accessible aux travailleurs)
git clone https://github.com/ray-project/llm-applications.git . Configurez ensuite correctement l'environnement en spécifiant les valeurs dans votre fichier .env et en installant les dépendances:
pip install --user -r requirements.txt
export PYTHONPATH= $PYTHONPATH : $PWD
pre-commit install
pre-commit autoupdatetouch .env
# Add environment variables to .env
OPENAI_API_BASE= " https://api.openai.com/v1 "
OPENAI_API_KEY= " " # https://platform.openai.com/account/api-keys
ANYSCALE_API_BASE= " https://api.endpoints.anyscale.com/v1 "
ANYSCALE_API_KEY= " " # https://app.endpoints.anyscale.com/credentials
DB_CONNECTION_STRING= " dbname=postgres user=postgres host=localhost password=postgres "
source .envMaintenant, nous sommes prêts à passer par le carnet interactif Rag.Ipynb pour développer et servir notre application LLM!
Llama-3-70b ) et des points de terminaison privés disponibles sur demande (essai de jetons gratuits 1M).