Wandbot เป็นบอทตอบคำถามที่ออกแบบมาโดยเฉพาะสำหรับเอกสารน้ำหนักและอคติ
รุ่นนี้แนะนำการอัปเดตและการปรับปรุงที่น่าตื่นเต้นจำนวนหนึ่ง:
การอัปเดตเหล่านี้เป็นส่วนหนึ่งของความมุ่งมั่นอย่างต่อเนื่องในการปรับปรุงประสิทธิภาพและการใช้งาน
ภาษาอังกฤษ
| เวอร์ชัน Wandbot | การแสดงความคิดเห็น | ความแม่นยำในการตอบสนอง |
|---|---|---|
| 1.0.0 | Wandbot พื้นฐานของเรา | 53.8 % |
| 1.1.0 | การปรับปรุงพื้นฐาน ในการผลิตนานที่สุด | 72.5 % |
| 1.2.0 | Wandbot ที่ปรับปรุงใหม่ของเรา | 81.6 % |
ญี่ปุ่น
| เวอร์ชัน Wandbot | การแสดงความคิดเห็น | ความแม่นยำในการตอบสนอง |
|---|---|---|
| 1.2.0 | Wandbot ที่ปรับปรุงใหม่ของเรา | 56.3 % |
| 1.2.1 | เพิ่มกระบวนการแปล | 71.9 % |
โครงการสร้างขึ้นด้วยรุ่น Python >=3.10.0,<3.11 และใช้บทกวีสำหรับการจัดการการพึ่งพา ทำตามขั้นตอนด้านล่างเพื่อติดตั้งการอ้างอิงที่จำเป็น:
git clone [email protected]:wandb/wandbot.git
pip install poetry
cd wandbot
poetry install --all-extras
# Depending on which platform you want to run on run the following command:
# poetry install --extras discord # for discord
# poetry install --extras slack # for slack
# poetry install --extras api # for api โมดูลการกลืนกินข้อมูลจะดึงรหัสและการทำเครื่องหมายจากน้ำหนักและอคติ repositories docodile และตัวอย่างนำเข้ามาในเวกเตอร์สโตร์สำหรับการดึงไปป์ไลน์การเพิ่มขึ้น ในการบริโภคข้อมูลเรียกใช้คำสั่งต่อไปนี้จากรูทของที่เก็บข้อมูล
poetry run python -m src.wandbot.ingestion คุณจะสังเกตเห็นว่าข้อมูลจะถูกนำเข้าสู่ไดเรกทอรี data/cache และเก็บไว้ในไดเรกทอรีที่แตกต่างกันสามไดเรกทอรี raw_data , vectorstore ที่มีไฟล์แต่ละไฟล์สำหรับแต่ละขั้นตอนของกระบวนการกลืนกิน ชุดข้อมูลเหล่านี้จะถูกจัดเก็บเป็นสิ่งประดิษฐ์ Wandb ในโครงการที่กำหนดไว้ในตัวแปรสภาพแวดล้อม WANDB_PROJECT และสามารถเข้าถึงได้จากแผงควบคุม WANDB
ก่อนที่จะเรียกใช้บอทถามตอบตรวจสอบให้แน่ใจว่ามีการตั้งค่าตัวแปรสภาพแวดล้อมต่อไปนี้:
OPENAI_API_KEY
COHERE_API_KEY
SLACK_EN_APP_TOKEN
SLACK_EN_BOT_TOKEN
SLACK_EN_SIGNING_SECRET
SLACK_JA_APP_TOKEN
SLACK_JA_BOT_TOKEN
SLACK_JA_SIGNING_SECRET
WANDB_API_KEY
DISCORD_BOT_TOKEN
COHERE_API_KEY
WANDBOT_API_URL= " http://localhost:8000 "
WANDB_TRACING_ENABLED= " true "
WANDB_PROJECT= " wandbot-dev "
WANDB_ENTITY= " wandbot "เมื่อตั้งค่าตัวแปรสภาพแวดล้อมเหล่านี้แล้วคุณสามารถเริ่มต้นแอปพลิเคชันคำถาม & คำตอบโดยใช้คำสั่งต่อไปนี้:
(poetry run uvicorn wandbot.api.app:app --host= " 0.0.0.0 " --port=8000 > api.log 2>&1 ) &
(poetry run python -m wandbot.apps.slack -l en > slack_en_app.log 2>&1 ) &
(poetry run python -m wandbot.apps.slack -l ja > slack_ja_app.log 2>&1 ) &
(poetry run python -m wandbot.apps.discord > discord_app.log 2>&1 )คุณอาจต้องโทรไปที่จุดสิ้นสุดเพื่อทริกเกอร์การเริ่มต้นแอป Wandbot ครั้งสุดท้าย: การเริ่มต้น:
curl http://localhost:8000/สำหรับคำแนะนำโดยละเอียดเพิ่มเติมเกี่ยวกับการติดตั้งและเรียกใช้บอทโปรดดูไฟล์ run.sh ที่อยู่ในรูทของที่เก็บ
การดำเนินการคำสั่งเหล่านี้จะเปิดตัวแอปพลิเคชัน API, SlackBot และ Discord Bot ทำให้คุณสามารถโต้ตอบกับบอทและถามคำถามที่เกี่ยวข้องกับเอกสารน้ำหนักและอคติ
ตรวจสอบให้แน่ใจว่าได้ตั้งค่าสภาพแวดล้อมในเทอร์มินัลของคุณ
set -o allexport; source .env; set +o allexport
เปิดตัว Wandbot กับคนงาน 8 คน การประเมินนี้จะเพิ่มความเร็ว
WANDBOT_EVALUATION=1 gunicorn wandbot.api.app:app --bind 0.0.0.0:8000 --timeout=200 --workers=8 --worker-class uvicorn.workers.UvicornWorker
ตั้งค่าสำหรับการประเมินผล
wandbot/src/wandbot/evaluation/config.py
evaluation_strategy_name : ชื่อแอตทริบิวต์ในแผงควบคุมการประเมินผลeval_dataset :eval_judge_model : โมเดลที่ใช้สำหรับผู้พิพากษาwandb_entity : ชื่อเอนทิตี Wandb สำหรับบันทึกwandb_project : ชื่อโครงการ WANDB สำหรับบันทึกเปิดตัวการประเมินผลการทอ
python src/wandbot/evaluation/weave_eval/main.py
คุณสามารถตรวจสอบการใช้งานของบอทในโครงการต่อไปนี้: https://wandb.ai/wandbot/wandbot_public