Download do bocoel - Download do código -fonte bocoel

bocoel

Código-Fonte de IA

1.0.0

Baixar

Bocoel

Otimização bayesiana como uma ferramenta de cobertura para avaliar grandes modelos de linguagem

? Por que bocoel?

Modelos de idiomas grandes são gigantes caros e lentos, e avaliá -los em conjuntos de dados modernos gigantescos apenas pioram.

Se apenas houver uma maneira de selecionar apenas um subconjunto significativo ( e pequeno ) do corpus e obter uma avaliação altamente precisa .....

Espere, parece otimização bayesiana!

O bocoel funciona nas seguintes etapas:

Codificar a entrada individual em incorporação (muito mais barato / mais rápido que o LLM e o reutilizável).
Use otimização bayesiana para selecionar consultas para avaliar.
Use as consultas para recuperar nosso corpus (com as incorporações codificadas).
Lucro.

As avaliações geradas são facilmente gerenciadas pelo utilitário de gerente fornecido.

Até onde sabemos, este é o primeiro trabalho com o objetivo de reduzir os custos de computação durante a avaliação (benchmarking) com um orçamento (possivelmente dinâmico).

Características

Avalie com precisão grandes modelos de idiomas com apenas dezenas de amostras do seu corpus selecionado.
? ‍♂️ Usa o poder da otimização bayesiana para selecionar um subconjunto ideal de amostras para o modelo de idioma avaliar.
? Avalie o corpus no modelo, além de avaliar o modelo no corpus.
? Suporte para GPT2 , Pythia , LLAMA e muito mais através da integração com Transformers e DataSets do Huggingface
? Design modular.
? Representação eficiente do corpus / conjunto de dados, como a representação n-esfera ou o clareamento do espaço latente para aumentar a qualidade da avaliação.

Dê -nos uma estrela!

Gosta do que você vê? Por favor, considere dar a isso uma estrela (★)!

Otimização bayesiana

Simplificando, a otimização bayesiana visa otimizar o objetivo de exploração (a área roxa na imagem) ou o objeto de exploração (a altura dos pontos pretos). Ele usa processos gaussianos como backbone para inferência e usa uma função de aquisição para decidir onde provar a seguir. Veja aqui uma introdução mais aprofundada.

Como a otimização bayesiana funciona bem com um modelo de caixa preta cara a avaliação (parafrase: LLM) , é perfeita para esse caso de uso específico. O Bocoel usa a otimização bayesiana como uma espinha dorsal para explorar o espaço de incorporação dado por nosso corpus, que permite selecionar um bom subconjunto atuando como um mini instantâneo do corpus.

? ️ Implicações de desempenho

Os LLMs são dolorosamente lentos, especialmente os generativos (que são geralmente chamados de LLM), pois a geração de sequência é seqüencial por natureza.

Apesar da exigência de bocoel de usar um incorporador para codificar todo o corpus, os incorporadores são mais rápidos que os LLMs por ordens de magnitude e o tempo é obtido de volta por praticamente qualquer economia na avaliação de LLMs.

Instalação

Eu não quero dependências opcionais:

 pip install bocoel

Dê -me a experiência completa (todas as dependências opcionais):

 pip install "bocoel[all]"

? Uso

Consulte os exemplos da pasta/finger_started para obter um uso simplista da biblioteca para começar com apenas algumas linhas de código.

✍️ Desenvolva com bocoel

Exemplos de uso estão nos examples de pastas. A referência da API pode ser encontrada aqui.

? Contribuindo

Colaboradores procurados! Não seja tímido. Sinta -se à vontade para arquivar problemas e PRs. Para o PRS, siga o guia sobre a contribuição e o código de conduta. Abertura e inclusão são levadas muito a sério.

? ️ Roadmap: Trabalho em andamento

? Uso mais simples. Devo fornecer um invólucro de alto nível para toda a biblioteca que as avaliações podem ser executadas em uma linha.
Módulo de visualização da avaliação.
? Integração de métodos alternativos (aleatórios, kmedoids ...) com processo gaussiano.
? Integração com mais back -end, como VLLM e API da OpenAI.
? Suporte ao Python 3.12+

? Sustct e citação

O código está disponível na licença BSD-3.

Se você achar este projeto útil em sua pesquisa, cite este trabalho em

 @misc{bocoel2024,
    title = {BoCoEL: Bayesian Optimization as a Coverage Tool for Evaluating Large Language Models},
    url = {https://bocoel.rentruewang.com/research/},
    author = {Wang, RenChu},
    month = {January},
    year = {2024}
}

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-08
tamanho 340.08KB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos