Wandbot-это бот, отвечающий вопросам, разработанный специально для документации веса и предвзятости.
Этот релиз представляет ряд захватывающих обновлений и улучшений:
Эти обновления являются частью нашей постоянной приверженности повышению производительности и удобства использования.
Английский
| Версия Wandbot | Комментарий | Точность ответа |
|---|---|---|
| 1.0.0 | Наш базовый Вандбот | 53,8 % |
| 1.1.0 | улучшение по сравнению с исходным уровнем; в производстве за самые длинные | 72,5 % |
| 1.2.0 | Наш новый усовершенствованный Wandbot | 81,6 % |
Японский
| Версия Wandbot | Комментарий | Точность ответа |
|---|---|---|
| 1.2.0 | Наш новый усовершенствованный Wandbot | 56,3 % |
| 1.2.1 | Добавить процесс перевода | 71,9 % |
Проект построен с версией Python >=3.10.0,<3.11 и использует поэзию для управления зависимостями. Следуйте приведенным ниже шагам, чтобы установить необходимые зависимости:
git clone [email protected]:wandb/wandbot.git
pip install poetry
cd wandbot
poetry install --all-extras
# Depending on which platform you want to run on run the following command:
# poetry install --extras discord # for discord
# poetry install --extras slack # for slack
# poetry install --extras api # for api Модуль проглатывания данных вытаскивает код и отметки от репозиториев Weews & Biases Docodile, а примеры внедряют их в Vectorstores для получения трубопровода из поиска. Для проглатывания данных запустить следующую команду из корня репозитория
poetry run python -m src.wandbot.ingestion Вы заметите, что данные принимаются в каталог data/cache и хранятся в трех различных каталогах raw_data , vectorstore с отдельными файлами для каждого этапа процесса приема. Эти наборы данных также хранятся в виде артефактов WANDB в проекте, определенном в переменной среды WANDB_PROJECT , и можно получить доступ с панели панели WANDB.
Перед запуском бота в вопросах и ответе убедитесь, что установлены следующие переменные среды:
OPENAI_API_KEY
COHERE_API_KEY
SLACK_EN_APP_TOKEN
SLACK_EN_BOT_TOKEN
SLACK_EN_SIGNING_SECRET
SLACK_JA_APP_TOKEN
SLACK_JA_BOT_TOKEN
SLACK_JA_SIGNING_SECRET
WANDB_API_KEY
DISCORD_BOT_TOKEN
COHERE_API_KEY
WANDBOT_API_URL= " http://localhost:8000 "
WANDB_TRACING_ENABLED= " true "
WANDB_PROJECT= " wandbot-dev "
WANDB_ENTITY= " wandbot "Как только эти переменные среды установлены, вы можете запустить приложение для бот и ответов, используя следующие команды:
(poetry run uvicorn wandbot.api.app:app --host= " 0.0.0.0 " --port=8000 > api.log 2>&1 ) &
(poetry run python -m wandbot.apps.slack -l en > slack_en_app.log 2>&1 ) &
(poetry run python -m wandbot.apps.slack -l ja > slack_ja_app.log 2>&1 ) &
(poetry run python -m wandbot.apps.discord > discord_app.log 2>&1 )Возможно, вам придется позвонить в конечную точку, чтобы запустить окончательную инициализацию приложения Wandbot:
curl http://localhost:8000/Для получения более подробных инструкций по установке и запуску бота, пожалуйста, обратитесь к файлу run.sh, расположенному в корне репозитория.
Выполнение этих команд запустит приложения API, Slackbot и Discord Bot, что позволит вам взаимодействовать с ботом и задавать вопросы, связанные с документацией Weews & Mizees.
Обязательно установите среды в вашем терминале.
set -o allexport; source .env; set +o allexport
Запустите Wandbot с 8 работниками. Это ускоряет оценку
WANDBOT_EVALUATION=1 gunicorn wandbot.api.app:app --bind 0.0.0.0:8000 --timeout=200 --workers=8 --worker-class uvicorn.workers.UvicornWorker
Настройка для оценки
Wandbot/src/wandbot/evaluation/config.py
evaluation_strategy_name : имя атрибута в панели панели оценки плетенияeval_dataset :eval_judge_model : модель, используемая для судьиwandb_entity : имя объекта Wandb для записиwandb_project : имя проекта Wandb для записиЗапуск w & b Оценка переплетения
python src/wandbot/evaluation/weave_eval/main.py
Вы можете отслеживать использование бота в следующем проекте: https://wandb.ai/wandbot/wandbot_public