تنزيل ragcar - تنزيل رمز مصدر ragcar

ragcar

شفرة المصدر الأخرى

v0.1.4

تنزيل

Ragcar: رفيق توليني مقبول للاسترجاع للأبحاث المتقدمة

راجار؟ يعتمد على مكتبة معالجة اللغة الطبيعية في الهندسة المعمارية Kakaove Lane Pororo ، مضيفًا نموذجًا لغويًا كبيرًا (LLM) Openai GPT و Naver's Hyperclova X API. وهو يدعم الأدوات اللازمة لخرقة (خرقة).

تثبيت

python>=3.8 إنه يعمل بشكل طبيعي في بيئة.
يمكنك تثبيت الحزمة من خلال الأمر أدناه.

 pip install ragcar

يمكنك أيضًا تثبيته في بيئة محلية كما هو موضح أدناه.

 git clone https://github.com/leewaay/ragcar.git
cd ragcar
pip install -e .

الاستخدام

يمكنك استخدام Ragcar مع الأمر التالي:

أولاً ، من أجل استيراد Ragcar ، يجب عليك تشغيل الأمر التالي:

 > >> from ragcar import Ragcar

بعد الاستيراد ، يمكنك التحقق من المهام التي تدعمها Ragcar حاليًا من خلال الأمر التالي.

 > >> from ragcar import Ragcar
> >> Ragcar . available_tools ()
"Available tools are ['tokenization', 'sentence_embedding', 'sentence_similarity', 'semantic_search', 'text_generation', 'text_segmentation']"

لمعرفة النماذج التي تدعمها المهمة ، يمكنك المرور بالعملية أدناه.

 > >> Ragcar . available_models ( "text_generation" )
'Available models for text_generation are ([src]: openai, [model]: gpt-4-turbo-preview, gpt-4, gpt-3.5-turbo, MODELS_SUPPORTED(https://platform.openai.com/docs/models)), ([src]: clova, [model]: YOUR_MODEL(https://www.ncloud.com/product/aiService/clovaStudio))'

عندما تريد تنفيذ مهمة محددة ، يمكنك وضع نوع النموذج في اسم الأداة وحجة src التي تنظر إليها قبل عامل tool .

 > >> from ragcar . utils import PromptTemplate
> >> prompt_template = PromptTemplate ( "사용자: {input} 수도는? n AI:" )

> >> generator = Ragcar ( tool = "text_generation" , src = "openai" , prompt_template = prompt_template , formatting = True )

بعد إنشاء الكائن ، يمكن استخدامه عن طريق تمرير قيمة الإدخال على النحو التالي. يرجى الرجوع إلى كل مثال مهمة في أمثلة.

 > >> generator ( input = "대한민국" )
{
    'id' : 'openai-dad4969f-6f0d-4413-a748-26d05cc0e73d' , 
    'model' : 'gpt-4-turbo-preview' , 
    'content' : '대한민국의 수도는 서울입니다.' , 
    'finish_reason' : 'stop' , 
    'input_tokens' : 23 , 
    'output_tokens' : 15 , 
    'total_tokens' : 38 , 
    'predicted_cost' : 0.0015899999999999998 , 
    'response_time' : 1.0608701705932617
}

️ كيفية إعداد متغيرات البيئة

تتطلب بعض src متغيرات البيئة (على سبيل المثال

.env File: إنشاء ملف .env في المسار العلوي للمشروع وأدخل قيم متغير البيئة اللازمة.

التصدير: إعلان متغيرات البيئة اللازمة في المحطة.

 export OPENAI_API_KEY= ' sk-... '

قيمة عامل model : أدخل متغير البيئة المطلوب مباشرة إلى قيمة عامل النموذج. ( ضع نفس الشيء حتى لو كنت بحاجة إلى إضافته بالإضافة إلى model الافتراضي )

 > >> Ragcar . available_customizable_src ( "text_generation" )
"Available customizable src for text_generation are ['clova', 'openai']"

> >> Ragcar . available_model_fields ( "clova" )
'Available fields for clova are ([field]: model_n, [type]: str), ([field]: api_key, [type]: str), ([field]: app_key, [type]: str)'

 > >> generator = Ragcar (
    tool = "text_generation" , 
    src = "clova" , 
    model = {
        "model_n" : "YOUR_API_URL" , 
        "api_key" : "YOUR_APIGW-API-KEY" ,
        "app_key" : "YOUR_CLOVASTUDIO-API-KEY"
    }, 
    prompt_template = prompt_template , 
    formatting = True
)
> >> generator ( input = "대한민국" )
{
    'id' : 'clova-3c241fa1-f01e-4738-b208-5bcb35daad42' ,
    'model' : 'HCX-003' ,
    'content' : '대한민국 수도는 서울입니다.' ,
    'finish_reason' : 'stop_before' ,
    'input_tokens' : 12 ,
    'output_tokens' : 8 ,
    'total_tokens' : 20 ,
    'predicted_cost' : 0.6 ,
    'response_time' : 0.7090704441070557 ,
    'ai_filter' : []
 }

يرجى التحقق من الأمثلة لمزيد من الطرق التفصيلية!

️ ملاحظات حول استخدام `Tool` text_generation

1. إشعار من `predicted_cost`

يتم احتساب predicted_cost بشكل مختلف اعتمادًا على واجهة برمجة التطبيقات المستخدمة عند استخدام أداة text_generation . بالنسبة لـ Openai ، يتم حساب predicted_cost بواسطة الدولار (USD) ، ويتم حساب Clova على أنه الأصلي (KRW) . وذلك لأن نظام الفواتير لكل خدمة مختلف. يمكن العثور على معلومات شحن محددة وفقًا للنموذج الحالي في ملف base.py.

2. الاحتياطات عند استخدام Naver Hyperloba

عند استخدام tool text_generation مع Clova src ، كن حذرًا بشأن التغييرات التي تم تغييرها مقارنة ببعض المعلمات الرسمية:

تغيير اسم المعلمة :
- يرجى استخدام presence_penalty بدلاً من top_k .
- يرجى استخدام frequency_penalty بدلاً من repeat_penalty .
نطاق قيمة المعلمة :
- 0.0 < temperature < 1.0
- 0.0 < top_p < 1.0
- 0 < presence_penalty < 128
- 0.0 < frequency_penalty < 10.0

️ كيفية تحميل نموذج محرك Google

Sentence_embedding مثال تحقق

الوثائق

إذا كان لديك أي أسئلة أو آراء ، فيرجى ترك مشكلة.

الاعتراف

بوررو

 @misc { pororo ,
  author       = { Heo, Hoon and Ko, Hyunwoong and Kim, Soohwan and
                  Han, Gunsoo and Park, Jiwoo and Park, Kyubyong } ,
  title        = { PORORO: Platform Of neuRal mOdels for natuRal language prOcessing } ,
  howpublished = { url{https://github.com/kakaobrain/pororo} } ,
  year         = { 2021 } ,
}

محولات الجملة

 @inproceedings { reimers-2019-sentence-bert ,
    title = " Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks " ,
    author = " Reimers, Nils and Gurevych, Iryna " ,
    booktitle = " Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing " ,
    month = " 11 " ,
    year = " 2019 " ,
    publisher = " Association for Computational Linguistics " ,
    url = " https://arxiv.org/abs/1908.10084 " ,
}