Комплексное руководство по строительству приложений LLM на основе тряпки для производства.
В этом руководстве мы узнаем, как:
Мы будем использовать OpenAI для доступа к моделям CHATGPT, таким как gpt-3.5-turbo , gpt-4 и т. Д., А также для получения конечных точек для доступа к LLMS, таким как Llama-2-70b . Обязательно создайте свои учетные записи для обоих и подготовьте свои учетные данные.
g3.8xlarge , который имеет 2 графические процессоры и 32 процессора. Мы также можем добавить узлы работников GPU, чтобы быстрее запустить рабочие нагрузки. Если вы не на Anmescale, вы можете настроить аналогичный экземпляр в своем облаке.default_cluster_env_2.6.2_py39 .us-west-2 если вы хотите использовать артефакты в нашем общем хранилище (исходные документы, векторные дампы DB и т. Д.).git clone https://github.com/ray-project/llm-applications.git .
git config --global user.name < GITHUB-USERNAME >
git config --global user.email < EMAIL-ADDRESS > Наши данные уже готовы по адресу /efs/shared_storage/goku/docs.ray.io/en/master/ goku/docs.ray.io/en/master/ (при постановке, us-east-1 ), но если вы хотите загрузить его самостоятельно, запустите эту команду BASH (измените /desired/output/directory , но убедитесь, что они находятся на общем хранилище, так что он доступен для работников)
git clone https://github.com/ray-project/llm-applications.git . Затем правильно настроите среду, указав значения в вашем файле .env и установив зависимости:
pip install --user -r requirements.txt
export PYTHONPATH= $PYTHONPATH : $PWD
pre-commit install
pre-commit autoupdatetouch .env
# Add environment variables to .env
OPENAI_API_BASE= " https://api.openai.com/v1 "
OPENAI_API_KEY= " " # https://platform.openai.com/account/api-keys
ANYSCALE_API_BASE= " https://api.endpoints.anyscale.com/v1 "
ANYSCALE_API_KEY= " " # https://app.endpoints.anyscale.com/credentials
DB_CONNECTION_STRING= " dbname=postgres user=postgres host=localhost password=postgres "
source .envТеперь мы готовы пройти через интерактивную ноутбук Rag.ipynb, чтобы разработать и обслуживать наше приложение LLM!
Llama-3-70b ) и частными конечными точками, доступными по запросу (1 м бесплатно испытание токенов).