download model_server - model_server Download de código fonte

model_server

Outro código-fonte

ver 2024.5

Baixar

Servidor de modelo OpenVino ™

O Model Server hospeda modelos e os torna acessíveis a componentes de software em protocolos de rede padrão: um cliente envia uma solicitação para o servidor de modelos, que executa a inferência do modelo e envia uma resposta de volta ao cliente. O Model Server oferece muitas vantagens para implantação eficiente de modelos:

A inferência remota permite o uso de clientes leves apenas com as funções necessárias para executar chamadas de API para implantações de ponta ou nuvem.
Os aplicativos são independentes da estrutura do modelo, dispositivo de hardware e infraestrutura.
Os aplicativos do cliente em qualquer linguagem de programação que suportem chamadas REST ou GRPC podem ser usadas para executar a inferência remotamente no servidor de modelos.
Os clientes exigem menos atualizações, pois as bibliotecas de clientes mudam muito raramente.
A topologia e os pesos do modelo não são expostos diretamente aos aplicativos do cliente, facilitando o controle do acesso ao modelo.
Arquitetura ideal para aplicativos e implantações baseados em microsserviços em ambientes em nuvem-incluindo Kubernetes e clusters OpenShift.
Utilização eficiente de recursos com escala de inferência horizontal e vertical.

Diagrama de OVMs

O OpenVino ™ Model Server (OVMS) é um sistema de alto desempenho para servir modelos. Implementado em C ++ para escalabilidade e otimizado para implantação em arquiteturas Intel, o Model Server usa a mesma arquitetura e API que o Tensorflow Serving e o Kserve enquanto aplica o OpenVino para execução de inferência. O serviço de inferência é fornecido via API GRPC ou REST, facilitando a implantação de novos algoritmos e experimentos de IA.

Imagem de OVMS

Os modelos usados pelo servidor precisam ser armazenados localmente ou hospedados remotamente por serviços de armazenamento de objetos. Para obter mais detalhes, consulte a preparação da documentação do repositório de modelos. O Model Server funciona dentro dos contêineres do Docker, no ambiente bare metal e no Kubernetes. Comece a usar o OpenVino Model Server com um exemplo de porção de avanço rápido dos recursos do QuickStart Guide ou Explore Model Server.

Leia as notas de lançamento para descobrir o que há de novo.

Principais recursos:

[Novo] incorporação de texto compatível com API OpenAi
[Novo] Reranking compatível com a API Cohere
[Novo] geração de texto eficiente via API OpenAi
Execução do código Python
GRPC Streaming
MediaPipe GRAFS SERVIÇÃO
Gerenciamento de modelos - incluindo versão do modelo e atualizações de modelo no tempo de execução
Entradas de modelo dinâmico
Agendador de gráficos aciclicos direcionados, juntamente com nós personalizados em pipelines DAG
Métricas - Métricas Compatíveis com o padrão Prometheus
Suporte para várias estruturas, como Tensorflow, Paddlepaddle e Onnx
Suporte para aceleradores de IA

Nota: OVMS foi testado no Redhat e Ubuntu. As mais recentes imagens do Docker divulgadas publicamente são baseadas no Ubuntu e no UBI. Eles são armazenados em:

DockerHub
Catálogo do ecossistema Redhat

Execute o OpenVino Model Server

Uma demonstração sobre como usar o OpenVino Model Server pode ser encontrada em nosso guia de partida rápida para o caso de uso da visão e a geração de texto LLM. Para obter mais informações sobre o uso do Model Server em vários cenários, você pode verificar os seguintes guias:

Configuração do repositório de modelos
Opções de implantação
Ajuste de desempenho
Agendador de gráficos aciclicos direcionados
Desenvolvimento de nós personalizados
Servindo modelos com estado
Implantar usando um gráfico de comando Kubernetes
Implantação usando o operador Kubernetes
Usando dados de entrada binária

Referências

Openvino ™
Serviço Tensorflow
GRPC
API repouso
Resultados de benchmarking
Velocidade e escala de operações de inferência de AI em várias arquiteturas - gravação de webinar
O que há de novo no servidor de modelos Openvino C ++
A Capital Health melhora o atendimento de AI com AI - exemplo de caso de uso

Contato

Se você tiver uma pergunta, uma solicitação de recurso ou um relatório de bug, fique à vontade para enviar um problema do GitHub.

* Outros nomes e marcas podem ser reivindicados como propriedade de outros.

Expandir

Informações adicionais

Versão ver 2024.5
Tipo Outro código-fonte
Data da Última Atualização 2025-02-26
tamanho 21MB
Vindo de Github

Aplicativos Relacionados

server

2024-11-05
Servidor SQL

2009-07-04
Servidor FileZilla

2009-07-03
Servidor FileZilla

2009-07-03
Servidor WinFtp

2009-07-03
Servidor FileZilla

2009-06-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0

Informações Relacionadas Todos