Téléchargement cappr - cappr CODE TÉLÉCHARGE

cappr

Code Source AI

v0.9.6 - fix Llama 3 tokenizer

Télécharger

CAPPR: Achèvement après une probabilité rapide

Faites votre choix LLM parmi une liste de choix.
Ou calculer la probabilité d'un achèvement étant donné une invite, qui peut être utile.
Sortez davantage des LLM open source.

Usage

Utilisez un modèle GGUF

 from llama_cpp import Llama
from cappr . llama_cpp . classify import predict

model = Llama ( "./TinyLLama-v0.Q8_0.gguf" , verbose = False )

prompt = """Gary told Spongebob a story:
There once was a man from Peru; who dreamed he was eating his shoe. He
woke with a fright, in the middle of the night, to find that his dream
had come true.

The moral of the story is to"""

completions = (
  "look at the bright side" ,
  "use your imagination" ,
  "eat shoes" ,
)

pred = predict ( prompt , completions , model )
print ( pred )
# use your imagination

Voir cette page de la documentation pour plus d'informations sur l'utilisation des modèles GGUF.

Utilisez un modèle de transformateurs de face étreintes

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict

model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompt = "Which planet is closer to the Sun: Mercury or Earth?"
completions = ( "Mercury" , "Earth" )

pred = predict ( prompt , completions , model_and_tokenizer = ( model , tokenizer ))
print ( pred )
# Mercury

Voir cette page de la documentation pour plus d'informations sur l'utilisation des modèles transformers .

Les instructions de cache pour gagner du temps

De nombreuses invites commencent par le même ensemble d'instructions, par exemple, une invite système plus une poignée d'exemples de paires d'entrée-sortie. Au lieu d'exécuter à plusieurs reprises le modèle sur des instructions courantes, mettez-les en cache afin que les calculs futurs soient plus rapides.

Voici un exemple à l'aide de cappr.huggingface.classify.cache_model .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import cache_model , predict

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )
model_and_tokenizer = ( model , tokenizer )

# Create data
prompt_prefix = '''Instructions: complete the sequence.
Here are examples:
A, B, C => D
1, 2, 3 => 4

Complete this sequence:'''

prompts = [ "X, Y =>" , "10, 9, 8 =>" ]
completions = [ "7" , "Z" , "Hi" ]

# Cache prompt_prefix because it's used for all prompts
cached_model_and_tokenizer = cache_model (
    model_and_tokenizer , prompt_prefix
)

# Compute
preds = predict (
    prompts , completions , cached_model_and_tokenizer
)
print ( preds )
# ['Z', '7']

Calculer les programmes de journaux de niveau de jeton

Voici un exemple utilisant cappr.huggingface.classify.log_probs_conditional .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import log_probs_conditional

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )

# Create data
prompts = [ "x y" , "a b c" ]
completions = [ "z" , "d e" ]

# Compute
log_probs_completions = log_probs_conditional (
    prompts , completions , model_and_tokenizer = ( model , tokenizer )
)

# Outputs (rounded) next to their symbolic representation

print ( log_probs_completions [ 0 ])
# [[-4.5],        [[log Pr(z | x, y)],
#  [-5.6, -3.2]]   [log Pr(d | x, y),    log Pr(e | x, y, d)]]

print ( log_probs_completions [ 1 ])
# [[-9.7],        [[log Pr(z | a, b, c)],
#  [-0.2, -0.03]]  [log Pr(d | a, b, c), log Pr(e | a, b, c, d)]]

Agréger efficacement ces programmes de log à l'aide de cappr.utils.classify.agg_log_probs .

Pour une démo un peu plus avancée, voir ./demos/huggingface/dpo.ipynb .

Extraire la réponse finale d'un achèvement étape par étape

Les invites étape par étape et de la chaîne de pensées sont des moyens très efficaces d'amener un LLM à "raisonner" sur les tâches plus complexes. Mais si vous avez besoin d'une sortie structurée, une réalisation étape par étape est lourde. Utilisez CAPPR pour extraire la réponse finale de ces types de compléments, compte tenu d'une liste de réponses possibles.

Voir cette idée en action ici dans la documentation.

Exécuter en lots, prédire les probabilités

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompts = [
    "Stephen Curry is a" ,
    "Martina Navratilova was a" ,
    "Dexter, from the TV Series Dexter's Laboratory, is a" ,
    "LeBron James is a" ,
]

# Each of the prompts could be completed with one of these:
class_names = ( "basketball player" , "tennis player" , "scientist" )
prior =       (      1 / 6 ,                1 / 6 ,            2 / 3    )
# Say I expect most of my data to have scientists

# Run CAPPr
pred_probs = predict_proba (
    prompts = prompts ,
    completions = class_names ,
    model_and_tokenizer = ( model , tokenizer ),
    batch_size = 2 ,  # whatever fits on your CPU/GPU
    prior = prior ,
)

# pred_probs[i,j] = probability that prompts[i] is classified as class_names[j]
print ( pred_probs . round ( 1 ))
# [[0.5 0.3 0.2]
#  [0.3 0.6 0.2]
#  [0.1 0.1 0.8]
#  [0.8 0.2 0. ]]

# For each prompt, which completion is most likely?
pred_class_idxs = pred_probs . argmax ( axis = - 1 )
preds = [ class_names [ pred_class_idx ] for pred_class_idx in pred_class_idxs ]
print ( preds )
# ['basketball player',
#  'tennis player',
#  'scientist',
#  'basketball player']

Exécuter en lots, où chaque invite a un ensemble différent d'achèvement possibles

Encore une fois, prédions les probabilités.

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba_examples
from cappr import Example

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

# Create a sequence of Example objects representing your classification tasks
examples = [
    Example (
        prompt = "Jodie Foster played" ,
        completions = ( "Clarice Starling" , "Trinity in The Matrix" ),
    ),
    Example (
        prompt = "Batman, from Batman: The Animated Series, was played by" ,
        completions = ( "Pete Holmes" , "Kevin Conroy" , "Spongebob!" ),
        prior =      (     1 / 3      ,      2 / 3     ,      0      ),
    ),
]

# Run CAPPr
pred_probs = predict_proba_examples (
    examples , model_and_tokenizer = ( model , tokenizer )
)

# pred_probs[i][j] = probability that examples[i].prompt is classified as
# examples[i].completions[j]
print ([ example_pred_probs . round ( 2 ) for example_pred_probs in pred_probs ])
# [array([0.7, 0.3]),
#  array([0.03, 0.97, 0.  ])]

# For each example, which completion is most likely?
pred_class_idxs = [
    example_pred_probs . argmax () for example_pred_probs in pred_probs
]
preds = [
    example . completions [ pred_class_idx ]
    for example , pred_class_idx in zip ( examples , pred_class_idxs )
]
print ( preds )
# ['Clarice Starling',
#  'Kevin Conroy']

Voir les demos pour des démonstrations de tâches de classification légèrement plus difficiles.

Pour CAPPR, les modèles GPTQ sont les plus performants les plus informatiques. Ces modèles sont compatibles avec cappr.huggingface.classify . Voir cette page de la documentation pour plus d'informations sur l'utilisation de ces modèles.

Documentation

https://cappr.readthedocs.io

Installation

Voir cette page de la documentation.

Travaux connexes

Voir cette page de la documentation.

Motivation

Réduire la complexité de l'ingénierie.

Voir cette page de la documentation pour plus d'informations.

Performance

Performance statistique

Performance informatique

Comment ça marche

Vous entrez une chaîne prompt , une chaîne end_of_prompt (un espace blanc ou vide) et un ensemble de chaînes completion candidat telles que la chaîne—

{ prompt }{ end_of_prompt }{ completion }

- est une pensée naturellement fluide. CAPPR choisit l' completion qui est principalement susceptible de suivre prompt en calculant le—

Achèvement
Après
Rapide
Protation

- comme étoffé dans ma question sur la croix validée.

Développement local

Voir cette page de la documentation.

Faire

Je jette des todos ici:

Modifications de code

Expériences de réside

N'hésitez pas à soulever des problèmes d'OFC

Développer

Informations supplémentaires

Version v0.9.6 - fix Llama 3 tokenizer
Type Code Source AI
Date de mise à jour 2025-07-01
taille 1.62MB
Provenant de Github

Applications connexes

c ares

2024-11-10
Plan C

2023-07-06
C conduire une voiture

2023-06-23
Jeu mobile Code C

2023-05-31
CodeSC

2023-05-17
c婷婷 anime

2023-04-14

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
promptl

Code Source AI

1.0.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0

Actualités connexes Tout