download embedding_studio - download de código fonte embedding

embedding_studio

Outro código-fonte

v0.0.1

Baixar

Site • Documentação • Desafios e soluções • Casos de uso

A incorporação de estúdio é uma estrutura inovadora de código aberto, projetado para converter perfeitamente um modelo de incorporação combinado e um banco de dados vetorial em um mecanismo de pesquisa abrangente. Com funcionalidades internas para a coleta de cliques, melhoria contínua das experiências de pesquisa e adaptação automática do modelo de incorporação, oferece uma solução pronta para uso para um mecanismo de pesquisa de ciclo completo.

Apoio da comunidade

A incorporação do estúdio cresce com o entusiasmo de nossa equipe. Sua estrela no repositório nos ajuda a continuar desenvolvendo.
Junte -se a nós para atingir nosso objetivo:

Características

Transforme seu banco de dados vetorial em um mecanismo de pesquisa de ciclo completo
? Aste Colete feedback dos usuários como clickstream
(*) Melhore a experiência de pesquisa na fly sem tempos de espera frustrantes
(*) Monitore sua qualidade de pesquisa
Melhore seu modelo de incorporação por meio de um procedimento de ajuste fino métrico iterativo
? (*) Use a nova versão do modelo de incorporação para inferência
(*) Antualmente ajuste sua incorporação nos dados do catálogo.
? (*) Use e melhore o analisador de consulta zero para misturar seu banco de dados estruturado com pesquisa não estruturada.

(*) - Recursos no desenvolvimento

A incorporação do estúdio é altamente personalizável, para que você possa trazer o seu próprio:

Fonte de dados
Banco de dados vetorial
Clickstream Database
Modelo de incorporação

Quando a incorporação do estúdio é o melhor ajuste?

Mais sobre isso aqui.

Empresas com catálogos extensos e dados não estruturados ricos.
? ️? Plataformas centradas no cliente priorizando experiências personalizadas.
Plataformas de conteúdo dinâmico com evolução de conteúdo e preferências do usuário.
? Plataformas lidando com consultas de pesquisa sutis e multifacetadas.
Integração de tipos de dados mistos em processos de pesquisa.
Plataformas que buscam otimização contínua por meio de interações do usuário.
? Organizações conscientes do orçamento buscando soluções poderosas, porém acessíveis.

Os desafios podem ser resolvidos

Isenção de responsabilidade: A incorporação do estúdio não é mais um banco de dados vetorial, é uma estrutura que permite transformar seu banco de dados vetorial em um mecanismo de pesquisa com todas as nuances.

Nada além de um catálogo, mas você quer uma demonstração rápida
Qualidade de pesquisa estática, mas você quer que seja melhorado com o tempo
A melhoria da experiência do usuário leva muito tempo e seus usuários se sentem frustrados
Atualização de índice esgotada lenta e de recursos
Mistura de pesquisa estruturada e não estruturada, e você não sabe como combiná -los
Pesquisa estruturada com consultas não estruturadas, e você deseja analisá -las corretamente
Itens frescos estão se perdendo

Mais sobre desafios e soluções aqui

Visão geral

Nossa estrutura permite que você ajuste continuamente seu modelo com base na experiência do usuário, permitindo que você forme os resultados da pesquisa para consultas de usuário mais rapidamente e com mais precisão.

$ color {Red} { textsf {Red:}} $ No gráfico, as soluções típicas de pesquisa sem aprimoramentos, como pesquisa de texto completo (FTS), Pesquisa de vizinho mais próxima (NNS) e outros, são marcados em vermelho. Sem o uso de ferramentas adicionais, a qualidade da pesquisa permanece inalterada ao longo do tempo.

$ color {Orange} { textsf {Orange:}} $ São retratadas soluções que acumulam alguns feedback (cliques, críticas, votos, discussões etc.) e, em seguida, iniciam uma reciclagem completa do modelo. O problema principal com essas soluções é que a reciclagem completa do modelo é um procedimento demorado e caro, sem ajustes reativos (por exemplo, quando um produto experimenta repentinamente o aumento da demanda, e o sistema de pesquisa ainda não se adaptou a ele).

$ color {#6666ff} { textsf {Indigo:}} $ Propomos uma solução que permita coletar feedback do usuário e recolhendo rapidamente o modelo sobre a diferença entre as versões antigas e novas. Isso permite uma curva de qualidade de pesquisa mais suave e mais relevante para o seu sistema.

Incorporando o gráfico de estúdio

Documentação

Veja nossa documentação oficial.

Começando

Olá, mundo não estruturado!

Para experimentar o incorporação do estúdio, você pode iniciar o projeto de demonstração pré-configurado. Preparamos um conjunto de dados armazenado em um balde público S3, um emulador para cliques de usuários e um script básico para ajustar o modelo. Ao adaptá-lo aos seus requisitos, você pode iniciar o ajuste fino para o seu modelo.

Certifique -se de ter o comando docker compose version funcionando em seu sistema:

Docker Compose version v2.23.3

Você também pode experimentar o comando Docker-Compompose Version. Avançando, usaremos o comando mais recente do Docker Compose Version, mas o comando Docker-Compose Version também pode funcionar com sucesso no seu sistema.

Em primeiro lugar, crie todos os serviços de incorporação de estúdio, executando o seguinte comando:

docker compose up -d

Depois que todos os serviços acabarem, você pode começar a usar o Incordending Studio. Vamos simular uma sessão de pesquisa de usuários. Vamos executar um script pré-construído que invocaremos a API de incorporação do estúdio e imitará o comportamento do usuário:

docker compose --profile demo_stage_clickstream up -d

Após a execução do script, você pode iniciar o ajuste fino do modelo. Execute o seguinte comando:

docker compose --profile demo_stage_finetuning up -d

Isso fará fila uma tarefa processada pelo trabalhador de ajuste fino. Para buscar todas as tarefas na fila de ajuste fino, envie uma solicitação GET para o endpoint /api/v1/fine-tuning/task :

curl -X GET http://localhost:5000/api/v1/fine-tuning/task

A resposta será algo como:

[
  {
    "fine_tuning_method" : " Default Fine Tuning Method " ,
    "status" : " processing " ,
    "created_at" : " 2023-12-21T14:30:25.823000 " ,
    "updated_at" : " 2023-12-21T14:32:16.673000 " ,
    "batch_id" : " 65844a671089823652b83d43 " ,
    "id" : " 65844c019fa7cf0957d04758 "
  }
]

Depois de ter o ID da tarefa, você pode monitorar diretamente o progresso do ajuste fino enviando uma solicitação GET para o endpoint /api/v1/fine-tuning/task/{task_id} :

curl -X GET http://localhost:5000/api/v1/fine-tuning/task/65844c019fa7cf0957d04758

O resultado será semelhante ao que você recebeu ao consultar todas as tarefas. Para uma maneira mais conveniente de rastrear o progresso, você pode usar o MLFlow em http: // localhost: 5001.

Também é benéfico verificar os logs do fine_tuning_worker para garantir que tudo esteja funcionando corretamente. Para fazer isso, liste todos os serviços usando o comando:

docker logs embedding_studio-fine_tuning_worker-1

Se tudo concluir com êxito, você verá logs semelhantes a:

Epoch 2: 100% | ██████████ | 13/13 [01: 17< 00:00,  0.17it/s, v_num = 8]
[2023-12-21 14:59:05,931] [PID 7] [Thread-6] [pytorch_lightning.utilities.rank_zero] [INFO] ` Trainer.fit ` stopped: ` max_epochs=3 ` reached.
Epoch 2: 100% | ██████████ | 13/13 [01: 17< 00:00,  0.17it/s, v_num = 8]
[2023-12-21 14:59:05,975] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.finetune_embedding_one_param] [INFO] Save model (best only, current quality: 8.426392069685529e-05)
[2023-12-21 14:59:05,975] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Save model for 2 / 9a9509bf1ed7407fb61f8d623035278e
[2023-12-21 14:59:06,009] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [WARNING] No finished experiments found with model uploaded, except initial
[2023-12-21 14:59:16,432] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Upload is finished
[2023-12-21 14:59:16,433] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.finetune_embedding_one_param] [INFO] Saving is finished
[2023-12-21 14:59:16,433] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Finish current run 2 / 9a9509bf1ed7407fb61f8d623035278e
[2023-12-21 14:59:16,445] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Current run is finished
[2023-12-21 14:59:16,656] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Finish current iteration 2
[2023-12-21 14:59:16,673] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.experiments.experiments_tracker] [INFO] Current iteration is finished
[2023-12-21 14:59:16,673] [PID 7] [Thread-6] [embedding_studio.workers.fine_tuning.worker] [INFO] Fine tuning of the embedding model was completed successfully !

Parabéns! Você melhorou com sucesso o modelo!

Para baixar o melhor modelo, você pode usar a API de estúdio de incorporação:

curl -X GET http://localhost:5000/api/v1/fine-tuning/task/65844c019fa7cf0957d04758

Se estiver tudo bem, você verá a seguinte saída:

{
  "fine_tuning_method" : " Default Fine Tuning Method " , 
  "status" : " done " , 
  "best_model_url" : " http://localhost:5001/get-artifact?path=model%2Fdata%2Fmodel.pth&run_uuid=571304f0c330448aa8cbce831944cfdd " , 
  ...
}

E o campo best_model_url contém arquivo model.pth acessível.

Você pode baixar o arquivo *.th, executando o seguinte comando:

wget http://localhost:5001/get-artifact ? path=model%2Fdata%2Fmodel.pth & run_uuid=571304f0c330448aa8cbce831944cfdd

Contribuindo

Congratulamo -nos com contribuições para a incorporação do estúdio!

Licença

A incorporação do Studio é licenciada sob a licença Apache, versão 2.0. Consulte a licença para o texto completo da licença.

Expandir

Informações adicionais

Versão v0.0.1
Tipo Outro código-fonte
Data da Última Atualização 2025-03-12
tamanho 10.51MB
Vindo de Github

Aplicativos Relacionados

PwR Studio

2024-11-14
studio

2024-11-13
langgraph studio

2024-11-09
DiffSynth Studio

2024-11-08
sam2 studio

2024-11-08
gb studio

2024-11-06

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos