Download do cappr - Download do código -fonte cappr

cappr

Código-Fonte de IA

v0.9.6 - fix Llama 3 tokenizer

Baixar

CAPP: conclusão após probabilidade imediata

Faça seu LLM escolher a partir de uma lista de opções.
Ou calcular a probabilidade de uma conclusão dada um aviso, o que pode ser útil.
Esprema mais do Open Source LLMS.

Uso

Use um modelo GGUF

 from llama_cpp import Llama
from cappr . llama_cpp . classify import predict

model = Llama ( "./TinyLLama-v0.Q8_0.gguf" , verbose = False )

prompt = """Gary told Spongebob a story:
There once was a man from Peru; who dreamed he was eating his shoe. He
woke with a fright, in the middle of the night, to find that his dream
had come true.

The moral of the story is to"""

completions = (
  "look at the bright side" ,
  "use your imagination" ,
  "eat shoes" ,
)

pred = predict ( prompt , completions , model )
print ( pred )
# use your imagination

Consulte esta página da documentação para obter mais informações sobre o uso de modelos GGUF.

Use um modelo de Transformers de rosto abraçado

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict

model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompt = "Which planet is closer to the Sun: Mercury or Earth?"
completions = ( "Mercury" , "Earth" )

pred = predict ( prompt , completions , model_and_tokenizer = ( model , tokenizer ))
print ( pred )
# Mercury

Consulte esta página da documentação para obter mais informações sobre o uso de modelos transformers .

Instruções de cache para economizar tempo

Muitos avisos começam com o mesmo conjunto de instruções, por exemplo, um prompt do sistema mais um punhado de pares de exemplo de entrada de entrada. Em vez de executar repetidamente o modelo em instruções comuns, cache -as para que os cálculos futuros sejam mais rápidos.

Aqui está um exemplo usando cappr.huggingface.classify.cache_model .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import cache_model , predict

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )
model_and_tokenizer = ( model , tokenizer )

# Create data
prompt_prefix = '''Instructions: complete the sequence.
Here are examples:
A, B, C => D
1, 2, 3 => 4

Complete this sequence:'''

prompts = [ "X, Y =>" , "10, 9, 8 =>" ]
completions = [ "7" , "Z" , "Hi" ]

# Cache prompt_prefix because it's used for all prompts
cached_model_and_tokenizer = cache_model (
    model_and_tokenizer , prompt_prefix
)

# Compute
preds = predict (
    prompts , completions , cached_model_and_tokenizer
)
print ( preds )
# ['Z', '7']

Computar computidades de log no nível do token

Aqui está um exemplo usando cappr.huggingface.classify.log_probs_conditional .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import log_probs_conditional

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )

# Create data
prompts = [ "x y" , "a b c" ]
completions = [ "z" , "d e" ]

# Compute
log_probs_completions = log_probs_conditional (
    prompts , completions , model_and_tokenizer = ( model , tokenizer )
)

# Outputs (rounded) next to their symbolic representation

print ( log_probs_completions [ 0 ])
# [[-4.5],        [[log Pr(z | x, y)],
#  [-5.6, -3.2]]   [log Pr(d | x, y),    log Pr(e | x, y, d)]]

print ( log_probs_completions [ 1 ])
# [[-9.7],        [[log Pr(z | a, b, c)],
#  [-0.2, -0.03]]  [log Pr(d | a, b, c), log Pr(e | a, b, c, d)]]

Agregue-se com eficiência essas probabilidades de log usando cappr.utils.classify.agg_log_probs .

Para uma demonstração um pouco mais avançada, consulte ./demos/huggingface/dpo.ipynb .

Extraia a resposta final de uma conclusão passo a passo

Os avisos passo a passo e de cadeia de pensamentos são maneiras altamente eficazes de conseguir um LLM para "raciocinar" sobre tarefas mais complexas. Mas se você precisar de uma saída estruturada, uma conclusão passo a passo será pesada. Use CAPPR para extrair a resposta final desses tipos de conclusões, dada uma lista de respostas possíveis.

Veja essa ideia em ação aqui na documentação.

Executar em lotes, prever probabilidades

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompts = [
    "Stephen Curry is a" ,
    "Martina Navratilova was a" ,
    "Dexter, from the TV Series Dexter's Laboratory, is a" ,
    "LeBron James is a" ,
]

# Each of the prompts could be completed with one of these:
class_names = ( "basketball player" , "tennis player" , "scientist" )
prior =       (      1 / 6 ,                1 / 6 ,            2 / 3    )
# Say I expect most of my data to have scientists

# Run CAPPr
pred_probs = predict_proba (
    prompts = prompts ,
    completions = class_names ,
    model_and_tokenizer = ( model , tokenizer ),
    batch_size = 2 ,  # whatever fits on your CPU/GPU
    prior = prior ,
)

# pred_probs[i,j] = probability that prompts[i] is classified as class_names[j]
print ( pred_probs . round ( 1 ))
# [[0.5 0.3 0.2]
#  [0.3 0.6 0.2]
#  [0.1 0.1 0.8]
#  [0.8 0.2 0. ]]

# For each prompt, which completion is most likely?
pred_class_idxs = pred_probs . argmax ( axis = - 1 )
preds = [ class_names [ pred_class_idx ] for pred_class_idx in pred_class_idxs ]
print ( preds )
# ['basketball player',
#  'tennis player',
#  'scientist',
#  'basketball player']

Executar em lotes, onde cada prompt tem um conjunto diferente de possíveis conclusões

Novamente, vamos prever probabilidades.

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba_examples
from cappr import Example

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

# Create a sequence of Example objects representing your classification tasks
examples = [
    Example (
        prompt = "Jodie Foster played" ,
        completions = ( "Clarice Starling" , "Trinity in The Matrix" ),
    ),
    Example (
        prompt = "Batman, from Batman: The Animated Series, was played by" ,
        completions = ( "Pete Holmes" , "Kevin Conroy" , "Spongebob!" ),
        prior =      (     1 / 3      ,      2 / 3     ,      0      ),
    ),
]

# Run CAPPr
pred_probs = predict_proba_examples (
    examples , model_and_tokenizer = ( model , tokenizer )
)

# pred_probs[i][j] = probability that examples[i].prompt is classified as
# examples[i].completions[j]
print ([ example_pred_probs . round ( 2 ) for example_pred_probs in pred_probs ])
# [array([0.7, 0.3]),
#  array([0.03, 0.97, 0.  ])]

# For each example, which completion is most likely?
pred_class_idxs = [
    example_pred_probs . argmax () for example_pred_probs in pred_probs
]
preds = [
    example . completions [ pred_class_idx ]
    for example , pred_class_idx in zip ( examples , pred_class_idxs )
]
print ( preds )
# ['Clarice Starling',
#  'Kevin Conroy']

Veja as demos para demonstrações de tarefas de classificação um pouco mais difíceis.

Para o CAPPR, os modelos GPTQ são os mais comuns. Esses modelos são compatíveis com cappr.huggingface.classify . Consulte esta página da documentação para obter mais informações sobre o uso desses modelos.

Documentação

https://capr.readthedocs.io

Instalação

Veja esta página da documentação.

Trabalho relacionado

Veja esta página da documentação.

Motivação

Reduza a complexidade da engenharia.

Consulte esta página da documentação para obter mais informações.

Desempenho

Desempenho estatístico

Desempenho computacional

Como funciona

Você insere uma string prompt , uma string end_of_prompt (um espaço em branco ou vazio) e um conjunto de seqüências completion de candidatos, de modo que a string -

{ prompt }{ end_of_prompt }{ completion }

- é um pensamento que flui naturalmente. CAPPR escolhe a completion que provavelmente seguirá prompt ao calcular o -

C ompleção
Depois
Incitar
PR Obutabilidade

- Como desenvolveu minha pergunta sobre o cruzamento validado.

Desenvolvimento local

Veja esta página da documentação.

Pendência

Estou despejando Todos aqui:

Mudanças de código

Experimentos de Reach

Sinta -se à vontade para levantar questões de C

Expandir

Informações adicionais

Versão v0.9.6 - fix Llama 3 tokenizer
Tipo Código-Fonte de IA
Data da Última Atualização 2025-07-01
tamanho 1.62MB
Vindo de Github

Aplicativos Relacionados

c ares

2024-11-10
Plano C

2023-07-06
C dirigindo um carro

2023-06-23
Jogo para celular Código C

2023-05-31
Código SC

2023-05-17
c婷婷 anime

2023-04-14

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
promptl

Código-Fonte de IA

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0

Informações Relacionadas Todos