Download do wandbot - Download do código fonte wandbot

wandbot

Outro código-fonte

v1.2.0

Baixar

Wandbot

O Wandbot é um bot de resposta à pergunta projetado especificamente para documentação de pesos e preconceitos.

O que há de novo

Wandbot v1.2.0

Esta versão apresenta várias atualizações e melhorias interessantes:

Chamadas paralelas LLM : substituíram o índice de llama pelo LECL, permitindo que o LLM paralelo exige maior eficiência.
Integração do Chromadb : fez a transição do FAISS para o Chromadb para alavancar a filtragem e a velocidade dos metadados.
Otimização do intensificador de consulta : melhorou o intensificador de consulta para operar com uma única chamada LLM.
Oleoduto modular : divida o oleoduto RAG em três módulos distintos: aprimoramento da consulta, recuperação e síntese de resposta, para maior clareza e manutenção.
Recuperação de documentos dos pais : Introduziu a funcionalidade de recuperação de documentos dos pais no módulo de recuperação para melhorar a contextualidade.
Resposta da sub-interveio : Adicionado recursos de atendimento sub-quadro no módulo de síntese de resposta para lidar com consultas complexas de maneira mais eficaz.
Reestruturação da API : redesenhou a API em roteadores separados para operações de recuperação, banco de dados e bate -papo.

Essas atualizações fazem parte de nosso compromisso contínuo de melhorar o desempenho e a usabilidade.

Avaliação

Inglês

Versão do Wandbot	Comentário	precisão da resposta
1.0.0	Nosso wandbot de linha de base	53,8 %
1.1.0	melhoria em relação à linha de base; em produção por mais tempo	72,5 %
1.2.0	Nosso novo Wandbot aprimorado	81,6 %

japonês

Versão do Wandbot	Comentário	precisão da resposta
1.2.0	Nosso novo Wandbot aprimorado	56,3 %
1.2.1	Adicione o processo de tradução	71,9 %

Características

O Wandbot emprega a geração aumentada de recuperação com um back -end Chromadb, garantindo respostas eficientes e precisas às consultas do usuário, recuperando documentos relevantes.
Possui ingestão periódica de dados e geração de relatórios, contribuindo para a melhoria contínua do bot. Você pode visualizar o relatório de ingestão de dados mais recente aqui.
O bot é integrado à Discord e Slack, facilitando a integração perfeita com essas plataformas populares de colaboração.
O monitoramento de desempenho e a melhoria contínua são possíveis por meio da extração e análise com tabelas de pesos e preconceitos. Visite o espaço de trabalho para mais detalhes aqui.
O Wandbot possui um mecanismo de retorno para a seleção de modelos, que é usado quando o GPT-4 falha em gerar uma resposta.
O desempenho do BOT é avaliado usando uma mistura de métricas, incluindo precisão de recuperação, similaridade de cordas e correção das respostas geradas por modelo.
Curioso sobre o prompt de sistema personalizado usado pelo bot? Você pode ver o aviso completo aqui.

Instalação

O projeto é construído com a versão python >=3.10.0,<3.11 e utiliza poesia para gerenciar dependências. Siga as etapas abaixo para instalar as dependências necessárias:

git clone [email protected]:wandb/wandbot.git
pip install poetry
cd wandbot
poetry install --all-extras
# Depending on which platform you want to run on run the following command:
# poetry install --extras discord # for discord
# poetry install --extras slack # for slack
# poetry install --extras api # for api

Uso

Ingestão de dados

O módulo de ingestão de dados extrai o código e a marcação dos repositórios de pesos e preconceitos e os exemplos os ingerem em vetores para o pipeline de geração aumentada de recuperação. Para ingerir os dados executados o seguinte comando da raiz do repositório

poetry run python -m src.wandbot.ingestion

Você notará que os dados são ingeridos no diretório data/cache e armazenados em três diretórios diferentes raw_data , vectorstore com arquivos individuais para cada etapa do processo de ingestão. Esses conjuntos de dados também são armazenados como artefatos wandb no projeto definido no ambiente variável WANDB_PROJECT e podem ser acessados no painel Wandb.

Executando as perguntas e respostas

Antes de executar as perguntas e respostas, verifique se as seguintes variáveis de ambiente estão definidas:

OPENAI_API_KEY
COHERE_API_KEY
SLACK_EN_APP_TOKEN
SLACK_EN_BOT_TOKEN
SLACK_EN_SIGNING_SECRET
SLACK_JA_APP_TOKEN
SLACK_JA_BOT_TOKEN
SLACK_JA_SIGNING_SECRET
WANDB_API_KEY
DISCORD_BOT_TOKEN
COHERE_API_KEY
WANDBOT_API_URL= " http://localhost:8000 "
WANDB_TRACING_ENABLED= " true "
WANDB_PROJECT= " wandbot-dev "
WANDB_ENTITY= " wandbot "

Depois que essas variáveis de ambiente estiverem definidas, você pode iniciar o aplicativo de perguntas e respostas usando os seguintes comandos:

(poetry run uvicorn wandbot.api.app:app --host= " 0.0.0.0 " --port=8000 > api.log 2>&1 ) & 
(poetry run python -m wandbot.apps.slack -l en > slack_en_app.log 2>&1 ) & 
(poetry run python -m wandbot.apps.slack -l ja > slack_ja_app.log 2>&1 ) & 
(poetry run python -m wandbot.apps.discord > discord_app.log 2>&1 )

Pode ser necessário chamar o endpoint para acionar a inicialização final do aplicativo Wandbot:

curl http://localhost:8000/

Para obter instruções mais detalhadas sobre a instalação e a execução do bot, consulte o arquivo run.sh localizado na raiz do repositório.

A execução desses comandos iniciará os aplicativos API, Slackbot e Discord Bot, permitindo que você interaja com o bot e faça perguntas relacionadas à documentação de pesos e preconceitos.

Executando o pipeline de avaliação

Certifique -se de definir os ambientes em seu terminal.

 set -o allexport; source .env; set +o allexport

Lance o wandbot com 8 trabalhadores. Isso acelera a avaliação

 WANDBOT_EVALUATION=1 gunicorn wandbot.api.app:app --bind 0.0.0.0:8000 --timeout=200 --workers=8 --worker-class uvicorn.workers.UvicornWorker

Configurado para avaliação

wandbot/src/wandbot/avaliação/config.py

evaluation_strategy_name : nome do atributo no painel de avaliação de tecelagem
eval_dataset :
- Último conjunto de dados de avaliação em inglês: "weave: /// wandbot/wandbot -val/object/wandbot_eval_data: ecqq0gjm077wi4yktwyhlprpugiaxbmwugeb7iyhlfu"
- Último conjunto de dados de avaliação japonesa: "weave: /// wandbot/wandbot-eval-jp/object/wandbot_eval_data_jp: occiiCiatevcksjushp0boec5gnhsmuyxurwqznbekla"
eval_judge_model : Modelo usado para o juiz
wandb_entity : Wandb Nome da entidade para registro
wandb_project : Wandb Nome do projeto para registro

Lançar a avaliação de tecelagem W&B

 python src/wandbot/evaluation/weave_eval/main.py

Visão geral da implementação

Criando incorporações de documentos com Chromadb
Construindo a linha de perguntas e respostas
Seleção de modelos e implementação do mecanismo de fallback
Implantação das perguntas e respostas no FASTAPI, Discord e Slack
Utilizando tabelas de pesos e preconceitos para registro e análise
Avaliando o desempenho das perguntas e respostas

Você pode monitorar o uso do bot no seguinte projeto: https://wandb.ai/wandbot/wandbot_public

Expandir

Informações adicionais

Versão v1.2.0
Tipo Outro código-fonte
Data da Última Atualização 2025-03-03
tamanho 361.18KB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos