تنزيل cappr - تنزيل رمز المصدر cappr

cappr

كود الذكاء الاصطناعي

v0.9.6 - fix Llama 3 tokenizer

تنزيل

CAPPR: الانتهاء بعد الاحتمال الفوري

اجعل LLM الخاص بك من قائمة الخيارات.
أو حساب احتمالية الانتهاء بالنظر إلى مطالبة ، والتي قد تكون مفيدة.
ضغط المزيد من LLMs Open Source.

الاستخدام

استخدم نموذج GGUF

 from llama_cpp import Llama
from cappr . llama_cpp . classify import predict

model = Llama ( "./TinyLLama-v0.Q8_0.gguf" , verbose = False )

prompt = """Gary told Spongebob a story:
There once was a man from Peru; who dreamed he was eating his shoe. He
woke with a fright, in the middle of the night, to find that his dream
had come true.

The moral of the story is to"""

completions = (
  "look at the bright side" ,
  "use your imagination" ,
  "eat shoes" ,
)

pred = predict ( prompt , completions , model )
print ( pred )
# use your imagination

راجع هذه الصفحة من الوثائق لمزيد من المعلومات حول استخدام نماذج GGUF.

استخدم نموذج محولات الوجه المعانقة

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict

model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompt = "Which planet is closer to the Sun: Mercury or Earth?"
completions = ( "Mercury" , "Earth" )

pred = predict ( prompt , completions , model_and_tokenizer = ( model , tokenizer ))
print ( pred )
# Mercury

راجع هذه الصفحة من الوثائق لمزيد من المعلومات حول استخدام نماذج transformers .

تعليمات ذاكرة التخزين المؤقت لتوفير الوقت

تبدأ العديد من المطالبات بنفس مجموعة الإرشادات ، على سبيل المثال ، موجه النظام بالإضافة إلى حفنة من أزواج الإدخال والمخرج. بدلاً من تشغيل النموذج بشكل متكرر على التعليمات الشائعة ، قم بتخزينها حتى تكون الحسابات المستقبلية أسرع.

إليك مثال باستخدام cappr.huggingface.classify.cache_model .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import cache_model , predict

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )
model_and_tokenizer = ( model , tokenizer )

# Create data
prompt_prefix = '''Instructions: complete the sequence.
Here are examples:
A, B, C => D
1, 2, 3 => 4

Complete this sequence:'''

prompts = [ "X, Y =>" , "10, 9, 8 =>" ]
completions = [ "7" , "Z" , "Hi" ]

# Cache prompt_prefix because it's used for all prompts
cached_model_and_tokenizer = cache_model (
    model_and_tokenizer , prompt_prefix
)

# Compute
preds = predict (
    prompts , completions , cached_model_and_tokenizer
)
print ( preds )
# ['Z', '7']

حساب عمليات السجل على مستوى الرمز المميز

إليك مثال باستخدام cappr.huggingface.classify.log_probs_conditional .

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import log_probs_conditional

# Load model and tokenizer
model = AutoModelForCausalLM . from_pretrained ( "gpt2" )
tokenizer = AutoTokenizer . from_pretrained ( "gpt2" )

# Create data
prompts = [ "x y" , "a b c" ]
completions = [ "z" , "d e" ]

# Compute
log_probs_completions = log_probs_conditional (
    prompts , completions , model_and_tokenizer = ( model , tokenizer )
)

# Outputs (rounded) next to their symbolic representation

print ( log_probs_completions [ 0 ])
# [[-4.5],        [[log Pr(z | x, y)],
#  [-5.6, -3.2]]   [log Pr(d | x, y),    log Pr(e | x, y, d)]]

print ( log_probs_completions [ 1 ])
# [[-9.7],        [[log Pr(z | a, b, c)],
#  [-0.2, -0.03]]  [log Pr(d | a, b, c), log Pr(e | a, b, c, d)]]

قم بتجميع هذه الإمكانيات السجل بكفاءة باستخدام cappr.utils.classify.agg_log_probs .

للحصول على عرض تجريبي أكثر تقدمًا قليلاً ، انظر ./demos/huggingface/dpo.ipynb .

استخراج الإجابة النهائية من الانتهاء خطوة بخطوة

تعد المطالبات خطوة بخطوة وسلسلة الفكر طرقًا فعالة للغاية للحصول على LLM لـ "العقل" حول المهام الأكثر تعقيدًا. ولكن إذا كنت بحاجة إلى إخراج منظم ، فإن الانتهاء من خطوة بخطوة غير عملي. استخدم CAPPR لاستخراج الإجابة النهائية من هذه الأنواع من الإكمال ، بالنظر إلى قائمة بالإجابات الممكنة.

انظر هذه الفكرة في العمل هنا في الوثائق.

تشغيل على دفعات ، توقع الاحتمالات

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

prompts = [
    "Stephen Curry is a" ,
    "Martina Navratilova was a" ,
    "Dexter, from the TV Series Dexter's Laboratory, is a" ,
    "LeBron James is a" ,
]

# Each of the prompts could be completed with one of these:
class_names = ( "basketball player" , "tennis player" , "scientist" )
prior =       (      1 / 6 ,                1 / 6 ,            2 / 3    )
# Say I expect most of my data to have scientists

# Run CAPPr
pred_probs = predict_proba (
    prompts = prompts ,
    completions = class_names ,
    model_and_tokenizer = ( model , tokenizer ),
    batch_size = 2 ,  # whatever fits on your CPU/GPU
    prior = prior ,
)

# pred_probs[i,j] = probability that prompts[i] is classified as class_names[j]
print ( pred_probs . round ( 1 ))
# [[0.5 0.3 0.2]
#  [0.3 0.6 0.2]
#  [0.1 0.1 0.8]
#  [0.8 0.2 0. ]]

# For each prompt, which completion is most likely?
pred_class_idxs = pred_probs . argmax ( axis = - 1 )
preds = [ class_names [ pred_class_idx ] for pred_class_idx in pred_class_idxs ]
print ( preds )
# ['basketball player',
#  'tennis player',
#  'scientist',
#  'basketball player']

تشغيل على دفعات ، حيث يكون لكل موجه مجموعة مختلفة من الإكمال المحتملة

مرة أخرى ، دعونا نتوقع الاحتمالات.

 from transformers import AutoModelForCausalLM , AutoTokenizer
from cappr . huggingface . classify import predict_proba_examples
from cappr import Example

# Load a model and its tokenizer
model_name = "gpt2"
model = AutoModelForCausalLM . from_pretrained ( model_name )
tokenizer = AutoTokenizer . from_pretrained ( model_name )

# Create a sequence of Example objects representing your classification tasks
examples = [
    Example (
        prompt = "Jodie Foster played" ,
        completions = ( "Clarice Starling" , "Trinity in The Matrix" ),
    ),
    Example (
        prompt = "Batman, from Batman: The Animated Series, was played by" ,
        completions = ( "Pete Holmes" , "Kevin Conroy" , "Spongebob!" ),
        prior =      (     1 / 3      ,      2 / 3     ,      0      ),
    ),
]

# Run CAPPr
pred_probs = predict_proba_examples (
    examples , model_and_tokenizer = ( model , tokenizer )
)

# pred_probs[i][j] = probability that examples[i].prompt is classified as
# examples[i].completions[j]
print ([ example_pred_probs . round ( 2 ) for example_pred_probs in pred_probs ])
# [array([0.7, 0.3]),
#  array([0.03, 0.97, 0.  ])]

# For each example, which completion is most likely?
pred_class_idxs = [
    example_pred_probs . argmax () for example_pred_probs in pred_probs
]
preds = [
    example . completions [ pred_class_idx ]
    for example , pred_class_idx in zip ( examples , pred_class_idxs )
]
print ( preds )
# ['Clarice Starling',
#  'Kevin Conroy']

انظر demos لمظاهرات مهام التصنيف الأكثر صعوبة.

بالنسبة إلى CAPPR ، فإن نماذج GPTQ هي الأكثر حسابيًا. هذه النماذج متوافقة مع cappr.huggingface.classify . راجع هذه الصفحة من الوثائق لمزيد من المعلومات حول استخدام هذه النماذج.

الوثائق

https://cappr.readthedocs.io

تثبيت

انظر هذه الصفحة من الوثائق.

العمل ذي الصلة

انظر هذه الصفحة من الوثائق.

تحفيز

تقليل التعقيد الهندسي.

انظر هذه الصفحة من الوثائق لمزيد من المعلومات.

أداء

الأداء الإحصائي

الأداء الحسابي

كيف تعمل

يمكنك إدخال سلسلة prompt ، سلسلة end_of_prompt (مساحة بيضاء أو فارغة) ومجموعة من سلاسل completion المرشح مثل السلسلة -

{ prompt }{ end_of_prompt }{ completion }

- هو فكر يتدفق بشكل طبيعي. CAPPR يختار completion الذي من المرجح أن يتبع prompt الغالب عن طريق حساب -

انتهاء
بعد
اِسْتَدْعَى
PR Propability

- كجسد في سؤالي على الصليب.

التنمية المحلية

انظر هذه الصفحة من الوثائق.

تودو

أنا ألقى تودوس هنا:

تغييرات الكود

تجارب التجارب

لا تتردد في إثارة قضايا OFC

يوسع

معلومات إضافية

الإصدار v0.9.6 - fix Llama 3 tokenizer
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-07-01
الحجم 1.62MB
من Github

تطبيقات ذات صلة

c ares

2024-11-10
الخطة ج

2023-07-06
ج قيادة السيارة

2023-06-23
لعبة كود سي للجوال

2023-05-31
كود SC

2023-05-17
ج أنيمي

2023-04-14

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
promptl

كود الذكاء الاصطناعي

1.0.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0

أخبار ذات صلة الكل