Descargar cappr - Descargar código fuente de cappr

cappr

Código Fuente de IA

v0.9.6 - fix Llama 3 tokenizer

Descargar

CAPPR: finalización después de la probabilidad rápida

Haga que su LLM elija una lista de opciones.
O calcular la probabilidad de una finalización dada un aviso, que puede ser útil.
Expite más de LLM de código abierto.

Uso

Use un modelo Gguf

 from llama_cpp import Llama
from cappr . llama_cpp . classify import predict

model = Llama ( "./TinyLLama-v0.Q8_0.gguf" , verbose = False )

prompt = """Gary told Spongebob a story:
There once was a man from Peru; who dreamed he was eating his shoe. He
woke with a fright, in the middle of the night, to find that his dream
had come true.

The moral of the story is to"""

completions = (
  "look at the bright side" ,
  "use your imagination" ,
  "eat shoes" ,
)

pred = predict ( prompt , completions , model )
print ( pred )
# use your imagination

Consulte esta página de la documentación para obtener más información sobre el uso de modelos GGUF.

Use un modelo de transformadores de cara abrazando

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict

model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompt = "Which planet is closer to the Sun: Mercury or Earth?"
completions = ( "Mercury" , "Earth" )

pred = predict ( prompt , completions , model_and_tokenizer = ( model , tokenizer ))
print ( pred )
# Mercury

Consulte esta página de la documentación para obtener más información sobre el uso de modelos transformers .

Instrucciones de caché para ahorrar tiempo

Muchas indicaciones comienzan con el mismo conjunto de instrucciones, por ejemplo, un indicador del sistema más un puñado de pares de entrada-salida de ejemplo. En lugar de ejecutar repetidamente el modelo en instrucciones comunes, almacene en cachélos para que los cálculos futuros sean más rápidos.

Aquí hay un ejemplo usando cappr.huggingface.classify.cache_model .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import cache_model , predict

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )
model_and_tokenizer = ( model , tokenizer )

# Create data
prompt_prefix = '''Instructions: complete the sequence.
Here are examples:
A, B, C => D
1, 2, 3 => 4

Complete this sequence:'''

prompts = [ "X, Y =>" , "10, 9, 8 =>" ]
completions = [ "7" , "Z" , "Hi" ]

# Cache prompt_prefix because it's used for all prompts
cached_model_and_tokenizer = cache_model (
    model_and_tokenizer , prompt_prefix
)

# Compute
preds = predict (
    prompts , completions , cached_model_and_tokenizer
)
print ( preds )
# ['Z', '7']

COMPUTE

Aquí hay un ejemplo usando cappr.huggingface.classify.log_probs_conditional .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import log_probs_conditional

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )

# Create data
prompts = [ "x y" , "a b c" ]
completions = [ "z" , "d e" ]

# Compute
log_probs_completions = log_probs_conditional (
    prompts , completions , model_and_tokenizer = ( model , tokenizer )
)

# Outputs (rounded) next to their symbolic representation

print ( log_probs_completions [ 0 ])
# [[-4.5],        [[log Pr(z | x, y)],
#  [-5.6, -3.2]]   [log Pr(d | x, y),    log Pr(e | x, y, d)]]

print ( log_probs_completions [ 1 ])
# [[-9.7],        [[log Pr(z | a, b, c)],
#  [-0.2, -0.03]]  [log Pr(d | a, b, c), log Pr(e | a, b, c, d)]]

Agregue de manera eficiente estas probabilidades de registro utilizando cappr.utils.classify.agg_log_probs .

Para una demostración un poco más avanzada, ver ./demos/huggingface/dpo.ipynb .

Extraiga la respuesta final de una finalización paso a paso

Las indicaciones paso a paso y de la cadena de pensamiento son formas altamente efectivas de lograr que un LLM "razone" sobre tareas más complejas. Pero si necesita una salida estructurada, una finalización paso a paso es difícil de manejar. Use CAPPR para extraer la respuesta final de este tipo de finalizaciones, dada una lista de posibles respuestas.

Vea esta idea en acción aquí en la documentación.

Ejecutar en lotes, predecir las probabilidades

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompts = [
    "Stephen Curry is a" ,
    "Martina Navratilova was a" ,
    "Dexter, from the TV Series Dexter's Laboratory, is a" ,
    "LeBron James is a" ,
]

# Each of the prompts could be completed with one of these:
class_names = ( "basketball player" , "tennis player" , "scientist" )
prior =       (      1 / 6 ,                1 / 6 ,            2 / 3    )
# Say I expect most of my data to have scientists

# Run CAPPr
pred_probs = predict_proba (
    prompts = prompts ,
    completions = class_names ,
    model_and_tokenizer = ( model , tokenizer ),
    batch_size = 2 ,  # whatever fits on your CPU/GPU
    prior = prior ,
)

# pred_probs[i,j] = probability that prompts[i] is classified as class_names[j]
print ( pred_probs . round ( 1 ))
# [[0.5 0.3 0.2]
#  [0.3 0.6 0.2]
#  [0.1 0.1 0.8]
#  [0.8 0.2 0. ]]

# For each prompt, which completion is most likely?
pred_class_idxs = pred_probs . argmax ( axis = - 1 )
preds = [ class_names [ pred_class_idx ] for pred_class_idx in pred_class_idxs ]
print ( preds )
# ['basketball player',
#  'tennis player',
#  'scientist',
#  'basketball player']

Ejecutar en lotes, donde cada aviso tiene un conjunto diferente de posibles terminaciones

Nuevamente, predecir las probabilidades.

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba_examples
from cappr import Example

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

# Create a sequence of Example objects representing your classification tasks
examples = [
    Example (
        prompt = "Jodie Foster played" ,
        completions = ( "Clarice Starling" , "Trinity in The Matrix" ),
    ),
    Example (
        prompt = "Batman, from Batman: The Animated Series, was played by" ,
        completions = ( "Pete Holmes" , "Kevin Conroy" , "Spongebob!" ),
        prior =      (     1 / 3      ,      2 / 3     ,      0      ),
    ),
]

# Run CAPPr
pred_probs = predict_proba_examples (
    examples , model_and_tokenizer = ( model , tokenizer )
)

# pred_probs[i][j] = probability that examples[i].prompt is classified as
# examples[i].completions[j]
print ([ example_pred_probs . round ( 2 ) for example_pred_probs in pred_probs ])
# [array([0.7, 0.3]),
#  array([0.03, 0.97, 0.  ])]

# For each example, which completion is most likely?
pred_class_idxs = [
    example_pred_probs . argmax () for example_pred_probs in pred_probs
]
preds = [
    example . completions [ pred_class_idx ]
    for example , pred_class_idx in zip ( examples , pred_class_idxs )
]
print ( preds )
# ['Clarice Starling',
#  'Kevin Conroy']

Vea las demos para demostraciones de tareas de clasificación ligeramente más difíciles.

Para CAPPR, los modelos GPTQ son el rendimiento más computacional. Estos modelos son compatibles con cappr.huggingface.classify . Consulte esta página de la documentación para obtener más información sobre el uso de estos modelos.

Documentación

https://cappr.readthedocs.io

Instalación

Vea esta página de la documentación.

Trabajo relacionado

Vea esta página de la documentación.

Motivación

Reducir la complejidad de la ingeniería.

Vea esta página de la documentación para obtener más información.

Actuación

Rendimiento estadístico

Rendimiento computacional

Cómo funciona

Ingrese una cadena prompt , una cadena end_of_prompt (un espacio en blanco o vacío) y un conjunto de cadenas completion de candidatos de tal manera que la cadena—

{ prompt }{ end_of_prompt }{ completion }

—Es un pensamiento de flujo natural. CAPPR elige la completion , que es más probable que siga prompt al calcular el ...

Completo
Después
Inmediato
PRABILIDAD

—Se desarrollado en mi pregunta sobre cruzado.

Desarrollo local

Vea esta página de la documentación.

Hacer

Estoy dando a Todos aquí:

Cambios en el código

Experimentos de reiniciar

Siéntete libre de plantear problemas de CC

Expandir

Información adicional

Versión v0.9.6 - fix Llama 3 tokenizer
Tipo Código Fuente de IA
Fecha de actualización 2025-07-01
tamaño 1.62MB
Proviene de Github

Aplicaciones relacionadas

c ares

2024-11-10
Plan C

2023-07-06
C conduciendo un coche

2023-06-23
Juego móvil Código C

2023-05-31
Código SC

2023-05-17
c婷婷 anime

2023-04-14

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
promptl

Código Fuente de IA

1.0.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0

Información relacionada Todo