Um guia abrangente para a construção de aplicativos LLM baseados em RAG para produção.
Neste guia, aprenderemos a::
Usaremos o OpenAI para acessar modelos ChatGPT como gpt-3.5-turbo , gpt-4 , etc. e pontos de extremidade de qualquer escala para acessar o OSS LLMS como Llama-2-70b . Certifique -se de criar suas contas para ambos e ter suas credenciais prontas.
g3.8xlarge , que possui 2 GPUs e 32 CPUs. Também podemos adicionar nós do trabalhador da GPU para executar as cargas de trabalho mais rapidamente. Se você não estiver em qualquer escala, pode configurar uma instância semelhante em sua nuvem.default_cluster_env_2.6.2_py39 .us-west-2 se desejar usar os artefatos em nosso armazenamento compartilhado (documentos de origem, dumps vetoriais, etc.).git clone https://github.com/ray-project/llm-applications.git .
git config --global user.name < GITHUB-USERNAME >
git config --global user.email < EMAIL-ADDRESS > Nossos dados já estão prontos em /efs/shared_storage/goku/docs.ray.io/en/master/ (no staging, us-east-1 ), mas se você quiser carregá-los, execute este comando bash (alteração /desired/output/directory , mas verifique se está no armazenamento compartilhado, para que seja acessível aos trabalhadores)
git clone https://github.com/ray-project/llm-applications.git . Em seguida, configure o ambiente corretamente especificando os valores no seu arquivo .env e instalando as dependências:
pip install --user -r requirements.txt
export PYTHONPATH= $PYTHONPATH : $PWD
pre-commit install
pre-commit autoupdatetouch .env
# Add environment variables to .env
OPENAI_API_BASE= " https://api.openai.com/v1 "
OPENAI_API_KEY= " " # https://platform.openai.com/account/api-keys
ANYSCALE_API_BASE= " https://api.endpoints.anyscale.com/v1 "
ANYSCALE_API_KEY= " " # https://app.endpoints.anyscale.com/credentials
DB_CONNECTION_STRING= " dbname=postgres user=postgres host=localhost password=postgres "
source .envAgora, estamos prontos para passar pelo notebook interativo Rag.ipynb para desenvolver e servir nosso aplicativo LLM!
Llama-3-70b ) e pontos de extremidade privados disponíveis mediante solicitação (1M TOKENS FREKEN TRATE).