скачать cappr - скачать исходный код cappr

cappr

AI Исходный код

v0.9.6 - fix Llama 3 tokenizer

Скачать

CAPPR: завершение после быстрого вероятности

Сделайте свой LLM из списка вариантов.
Или вычислить вероятность завершения, учитывая подсказку, которая может быть полезна.
Выжмите больше из LLMS с открытым исходным кодом.

Использование

Используйте модель GGUF

 from llama_cpp import Llama
from cappr . llama_cpp . classify import predict

model = Llama ( "./TinyLLama-v0.Q8_0.gguf" , verbose = False )

prompt = """Gary told Spongebob a story:
There once was a man from Peru; who dreamed he was eating his shoe. He
woke with a fright, in the middle of the night, to find that his dream
had come true.

The moral of the story is to"""

completions = (
  "look at the bright side" ,
  "use your imagination" ,
  "eat shoes" ,
)

pred = predict ( prompt , completions , model )
print ( pred )
# use your imagination

Смотрите эту страницу документации для получения дополнительной информации об использовании моделей GGUF.

Используйте модель Transformers Crantraging Face

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict

model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompt = "Which planet is closer to the Sun: Mercury or Earth?"
completions = ( "Mercury" , "Earth" )

pred = predict ( prompt , completions , model_and_tokenizer = ( model , tokenizer ))
print ( pred )
# Mercury

Смотрите эту страницу документации для получения дополнительной информации об использовании моделей transformers .

Кэш инструкции, чтобы сэкономить время

Многие подсказки начинаются с одного и того же набора инструкций, например, системной подсказки плюс несколько примеров пар ввода-вывода. Вместо того, чтобы неоднократно запускать модель по общим инструкциям, кэшируйте их так, чтобы будущие вычисления были быстрее.

Вот пример с использованием cappr.huggingface.classify.cache_model .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import cache_model , predict

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )
model_and_tokenizer = ( model , tokenizer )

# Create data
prompt_prefix = '''Instructions: complete the sequence.
Here are examples:
A, B, C => D
1, 2, 3 => 4

Complete this sequence:'''

prompts = [ "X, Y =>" , "10, 9, 8 =>" ]
completions = [ "7" , "Z" , "Hi" ]

# Cache prompt_prefix because it's used for all prompts
cached_model_and_tokenizer = cache_model (
    model_and_tokenizer , prompt_prefix
)

# Compute
preds = predict (
    prompts , completions , cached_model_and_tokenizer
)
print ( preds )
# ['Z', '7']

Вычислить журнал на уровне токена

Вот пример с использованием cappr.huggingface.classify.log_probs_conditional .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import log_probs_conditional

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )

# Create data
prompts = [ "x y" , "a b c" ]
completions = [ "z" , "d e" ]

# Compute
log_probs_completions = log_probs_conditional (
    prompts , completions , model_and_tokenizer = ( model , tokenizer )
)

# Outputs (rounded) next to their symbolic representation

print ( log_probs_completions [ 0 ])
# [[-4.5],        [[log Pr(z | x, y)],
#  [-5.6, -3.2]]   [log Pr(d | x, y),    log Pr(e | x, y, d)]]

print ( log_probs_completions [ 1 ])
# [[-9.7],        [[log Pr(z | a, b, c)],
#  [-0.2, -0.03]]  [log Pr(d | a, b, c), log Pr(e | a, b, c, d)]]

Эффективно агрегируйте эти логарифмические способности с помощью cappr.utils.classify.agg_log_probs .

Для немного более продвинутой демонстрации см ./demos/huggingface/dpo.ipynb .

Извлечь окончательный ответ из пошагового завершения

Пошаговые подсказки и цепочки мыслей являются очень эффективными способами получить LLM для «разума» о более сложных задачах. Но если вам нужен структурированный выход, пошаговое завершение является громоздким. Используйте CAPPR, чтобы извлечь окончательный ответ из этих типов завершений, учитывая список возможных ответов.

Смотрите эту идею в действии здесь, в документации.

Запустить партиями, прогнозировать вероятности

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompts = [
    "Stephen Curry is a" ,
    "Martina Navratilova was a" ,
    "Dexter, from the TV Series Dexter's Laboratory, is a" ,
    "LeBron James is a" ,
]

# Each of the prompts could be completed with one of these:
class_names = ( "basketball player" , "tennis player" , "scientist" )
prior =       (      1 / 6 ,                1 / 6 ,            2 / 3    )
# Say I expect most of my data to have scientists

# Run CAPPr
pred_probs = predict_proba (
    prompts = prompts ,
    completions = class_names ,
    model_and_tokenizer = ( model , tokenizer ),
    batch_size = 2 ,  # whatever fits on your CPU/GPU
    prior = prior ,
)

# pred_probs[i,j] = probability that prompts[i] is classified as class_names[j]
print ( pred_probs . round ( 1 ))
# [[0.5 0.3 0.2]
#  [0.3 0.6 0.2]
#  [0.1 0.1 0.8]
#  [0.8 0.2 0. ]]

# For each prompt, which completion is most likely?
pred_class_idxs = pred_probs . argmax ( axis = - 1 )
preds = [ class_names [ pred_class_idx ] for pred_class_idx in pred_class_idxs ]
print ( preds )
# ['basketball player',
#  'tennis player',
#  'scientist',
#  'basketball player']

Запустить партиями, где у каждого подсказки есть другой набор возможных завершений

Опять же, давайте предскажем вероятности.

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba_examples
from cappr import Example

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

# Create a sequence of Example objects representing your classification tasks
examples = [
    Example (
        prompt = "Jodie Foster played" ,
        completions = ( "Clarice Starling" , "Trinity in The Matrix" ),
    ),
    Example (
        prompt = "Batman, from Batman: The Animated Series, was played by" ,
        completions = ( "Pete Holmes" , "Kevin Conroy" , "Spongebob!" ),
        prior =      (     1 / 3      ,      2 / 3     ,      0      ),
    ),
]

# Run CAPPr
pred_probs = predict_proba_examples (
    examples , model_and_tokenizer = ( model , tokenizer )
)

# pred_probs[i][j] = probability that examples[i].prompt is classified as
# examples[i].completions[j]
print ([ example_pred_probs . round ( 2 ) for example_pred_probs in pred_probs ])
# [array([0.7, 0.3]),
#  array([0.03, 0.97, 0.  ])]

# For each example, which completion is most likely?
pred_class_idxs = [
    example_pred_probs . argmax () for example_pred_probs in pred_probs
]
preds = [
    example . completions [ pred_class_idx ]
    for example , pred_class_idx in zip ( examples , pred_class_idxs )
]
print ( preds )
# ['Clarice Starling',
#  'Kevin Conroy']

Смотрите demos для демонстраций немного более сложных задач классификации.

Для CAPPR модели GPTQ являются наиболее эффективными. Эти модели совместимы с cappr.huggingface.classify . Смотрите эту страницу документации для получения дополнительной информации об использовании этих моделей.

Документация

https://capp.readthedocs.io

Установка

Смотрите эту страницу документации.

Связанная работа

Смотрите эту страницу документации.

Мотивация

Уменьшить инженерную сложность.

Смотрите эту страницу документации для получения дополнительной информации.

Производительность

Статистическая производительность

Вычислительная производительность

Как это работает

Вы вводите строку prompt , строку end_of_prompt (пробелы или пустое) и набор строк completion кандидата, так что строка -

{ prompt }{ end_of_prompt }{ completion }

- Естественно текущая мысль. CAPPR выбирает completion которое, скорее всего, последует за prompt , вычисляя -

C ВОЗМОЖЕН
После
Быстрый
PR Способность

- как разбито в моем вопросе на проверке креста.

Местное развитие

Смотрите эту страницу документации.

Тодо

Я сбрасываю здесь Тодоса:

Код изменений

Reseach Experiments

Не стесняйтесь поднимать проблемы

Расширять

Дополнительная информация

Версия v0.9.6 - fix Llama 3 tokenizer
Тип AI Исходный код
Время обновления 2025-07-01
размер 1.62MB
От Github

Связанные приложения

cappr

CAPPR: завершение после быстрого вероятности

Использование

Документация

Установка

Связанная работа

Мотивация

Производительность

Как это работает

Местное развитие

Тодо

c ares

План С

С вождение автомобиля

Мобильная игра «Код C»

Код СК

c婷婷 аниме

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

promptl

Google Dorks

shepherd

hidusbf