cappr -Download - cappr Source Code Download

cappr

AI-Quellcode

v0.9.6 - fix Llama 3 tokenizer

Herunterladen

Cappr: Fertigstellung nach der sofortigen Wahrscheinlichkeit

Machen Sie Ihre LLM -Auswahl aus einer Liste von Auswahlmöglichkeiten.
Oder berechnen Sie die Wahrscheinlichkeit einer Fertigstellung bei einer Eingabeaufforderung, die möglicherweise nützlich sein kann.
Drücken Sie mehr aus Open Source LLMs heraus.

Verwendung

Verwenden Sie ein GGUF -Modell

 from llama_cpp import Llama
from cappr . llama_cpp . classify import predict

model = Llama ( "./TinyLLama-v0.Q8_0.gguf" , verbose = False )

prompt = """Gary told Spongebob a story:
There once was a man from Peru; who dreamed he was eating his shoe. He
woke with a fright, in the middle of the night, to find that his dream
had come true.

The moral of the story is to"""

completions = (
  "look at the bright side" ,
  "use your imagination" ,
  "eat shoes" ,
)

pred = predict ( prompt , completions , model )
print ( pred )
# use your imagination

Weitere Informationen zur Verwendung von GGUF -Modellen finden Sie in dieser Seite der Dokumentation.

Verwenden Sie ein Modell mit umarmenden Gesichtstransformatoren

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict

model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompt = "Which planet is closer to the Sun: Mercury or Earth?"
completions = ( "Mercury" , "Earth" )

pred = predict ( prompt , completions , model_and_tokenizer = ( model , tokenizer ))
print ( pred )
# Mercury

Weitere Informationen zur Verwendung von transformers -Modellen finden Sie in dieser Seite der Dokumentation.

Cache -Anweisungen, um Zeit zu sparen

Viele Eingabeaufforderungen beginnen mit den gleichen Anweisungen, z. B. einer Systemaufforderung sowie einer Handvoll Beispiele für Eingabe-Output-Paare. Anstatt das Modell wiederholt auf gemeinsamen Anweisungen auszuführen, können Sie sie so schneller einschränken, dass zukünftige Berechnungen schneller sind.

Hier ist ein Beispiel mit cappr.huggingface.classify.cache_model .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import cache_model , predict

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )
model_and_tokenizer = ( model , tokenizer )

# Create data
prompt_prefix = '''Instructions: complete the sequence.
Here are examples:
A, B, C => D
1, 2, 3 => 4

Complete this sequence:'''

prompts = [ "X, Y =>" , "10, 9, 8 =>" ]
completions = [ "7" , "Z" , "Hi" ]

# Cache prompt_prefix because it's used for all prompts
cached_model_and_tokenizer = cache_model (
    model_and_tokenizer , prompt_prefix
)

# Compute
preds = predict (
    prompts , completions , cached_model_and_tokenizer
)
print ( preds )
# ['Z', '7']

Berechnen Sie token-Level-Protokollbücher

Hier ist ein Beispiel mit cappr.huggingface.classify.log_probs_conditional .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import log_probs_conditional

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )

# Create data
prompts = [ "x y" , "a b c" ]
completions = [ "z" , "d e" ]

# Compute
log_probs_completions = log_probs_conditional (
    prompts , completions , model_and_tokenizer = ( model , tokenizer )
)

# Outputs (rounded) next to their symbolic representation

print ( log_probs_completions [ 0 ])
# [[-4.5],        [[log Pr(z | x, y)],
#  [-5.6, -3.2]]   [log Pr(d | x, y),    log Pr(e | x, y, d)]]

print ( log_probs_completions [ 1 ])
# [[-9.7],        [[log Pr(z | a, b, c)],
#  [-0.2, -0.03]]  [log Pr(d | a, b, c), log Pr(e | a, b, c, d)]]

Effizient aggregieren Sie diese Protokollprobilitäten mit cappr.utils.classify.agg_log_probs .

Für eine etwas fortgeschrittenere Demo siehe ./demos/huggingface/dpo.ipynb .

Extrahieren Sie die endgültige Antwort aus einer Schritt-für-Schritt-Fertigstellung

Schritt-für-Schritt- und Kette des Gedächtnisses sind hochwirksame Möglichkeiten, um einen LLM zu "Vernunft" über komplexere Aufgaben zu bringen. Wenn Sie jedoch eine strukturierte Ausgabe benötigen, ist eine Schritt-für-Schritt-Fertigstellung unhandlich. Verwenden Sie CPPR, um die endgültige Antwort aus diesen Arten von Fertigstellungen zu extrahieren, wenn Sie eine Liste möglicher Antworten haben.

Sehen Sie sich diese Idee hier in der Dokumentation in Aktion an.

In Chargen laufen, Wahrscheinlichkeiten vorhersagen

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompts = [
    "Stephen Curry is a" ,
    "Martina Navratilova was a" ,
    "Dexter, from the TV Series Dexter's Laboratory, is a" ,
    "LeBron James is a" ,
]

# Each of the prompts could be completed with one of these:
class_names = ( "basketball player" , "tennis player" , "scientist" )
prior =       (      1 / 6 ,                1 / 6 ,            2 / 3    )
# Say I expect most of my data to have scientists

# Run CAPPr
pred_probs = predict_proba (
    prompts = prompts ,
    completions = class_names ,
    model_and_tokenizer = ( model , tokenizer ),
    batch_size = 2 ,  # whatever fits on your CPU/GPU
    prior = prior ,
)

# pred_probs[i,j] = probability that prompts[i] is classified as class_names[j]
print ( pred_probs . round ( 1 ))
# [[0.5 0.3 0.2]
#  [0.3 0.6 0.2]
#  [0.1 0.1 0.8]
#  [0.8 0.2 0. ]]

# For each prompt, which completion is most likely?
pred_class_idxs = pred_probs . argmax ( axis = - 1 )
preds = [ class_names [ pred_class_idx ] for pred_class_idx in pred_class_idxs ]
print ( preds )
# ['basketball player',
#  'tennis player',
#  'scientist',
#  'basketball player']

Führen Sie in Chargen aus, wobei jede Eingabeaufforderung einen anderen Satz möglicher Abschlüsse aufweist

Lassen Sie uns wieder die Wahrscheinlichkeiten vorhersagen.

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba_examples
from cappr import Example

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

# Create a sequence of Example objects representing your classification tasks
examples = [
    Example (
        prompt = "Jodie Foster played" ,
        completions = ( "Clarice Starling" , "Trinity in The Matrix" ),
    ),
    Example (
        prompt = "Batman, from Batman: The Animated Series, was played by" ,
        completions = ( "Pete Holmes" , "Kevin Conroy" , "Spongebob!" ),
        prior =      (     1 / 3      ,      2 / 3     ,      0      ),
    ),
]

# Run CAPPr
pred_probs = predict_proba_examples (
    examples , model_and_tokenizer = ( model , tokenizer )
)

# pred_probs[i][j] = probability that examples[i].prompt is classified as
# examples[i].completions[j]
print ([ example_pred_probs . round ( 2 ) for example_pred_probs in pred_probs ])
# [array([0.7, 0.3]),
#  array([0.03, 0.97, 0.  ])]

# For each example, which completion is most likely?
pred_class_idxs = [
    example_pred_probs . argmax () for example_pred_probs in pred_probs
]
preds = [
    example . completions [ pred_class_idx ]
    for example , pred_class_idx in zip ( examples , pred_class_idxs )
]
print ( preds )
# ['Clarice Starling',
#  'Kevin Conroy']

Die demos für Demonstrationen leicht härterer Klassifizierungsaufgaben finden Sie.

Für CapPR sind GPTQ -Modelle die rechenintensivsten. Diese Modelle sind mit cappr.huggingface.classify kompatibel. Weitere Informationen zur Verwendung dieser Modelle finden Sie in dieser Seite der Dokumentation.

Dokumentation

https://cupn.readthedocs.io

Installation

Siehe diese Seite der Dokumentation.

Motivation

Reduzieren Sie die Engineering -Komplexität.

Weitere Informationen finden Sie in dieser Seite der Dokumentation.

Leistung

Statistische Leistung

Rechenleistung

Wie es funktioniert

Sie geben eine prompt , eine end_of_prompt -Zeichenfolge (eine Weißespace oder leer) und eine Reihe von completion so ein, dass die Zeichenfolge -

{ prompt }{ end_of_prompt }{ completion }

- Ist ein natürlich fließender Gedanke. CapPR wählt die completion aus, die wahrscheinlich durch Berechnung der - prompt folgt, die -

Completion
Nach
P rompt
PR -Hehrbarkeit

- wie in meiner Frage auf Kreuzung validiert.

Lokale Entwicklung

Siehe diese Seite der Dokumentation.

Todo

Ich werde Todos hier abwerfen:

Codeänderungen

Reach -Experimente

Fühlen Sie sich frei, Probleme von C zu lenken

Expandieren

Zusätzliche Informationen

Version v0.9.6 - fix Llama 3 tokenizer
Typ AI-Quellcode
Aktualisierungszeit 2025-07-01
Größe 1.62MB
Kommt von Github

Ähnliche Anwendungen

c ares

2024-11-10
Plan C

2023-07-06
C Autofahren

2023-06-23
Code C-Handyspiel

2023-05-31
Code SC

2023-05-17
c婷婷 Anime

2023-04-14

cappr

Cappr: Fertigstellung nach der sofortigen Wahrscheinlichkeit

Verwendung

Dokumentation

Installation

Verwandte Arbeit

Motivation

Leistung

Wie es funktioniert

Lokale Entwicklung

Todo

c ares

Plan C

C Autofahren

Code C-Handyspiel

Code SC

c婷婷 Anime

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

promptl

Google Dorks

shepherd

hidusbf