سلسلة التفكير المتقدمة (COT) API مع تعلم التعزيز (RL)

Fragaria هي سلسلة من موظفي التفكير القوية والمرنة (COT) التي تستفيد من مزودي نموذج اللغة (LLM) وتتضمن تقنيات التعلم التعزيز (RL) لحل المشكلات المعقدة والإجابة على الأسئلة المعقدة. سميت Fragaria على اسم الجنس النباتي للفراولة ، تشيد بـ "كم عدد" R في الفراولة؟ " المشكلة ، ترمز إلى قدرتها على معالجة كل من الاستعلامات البسيطة والمعقدة مع براعة متساوية.
استنساخ المستودع:
git clone https://github.com/terraprompt/fragaria.git
cd fragaria
إنشاء بيئة افتراضية (اختياري ولكن موصى بها):
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
تثبيت التبعيات المطلوبة:
pip install -r requirements.txt
انسخ ملف config.yaml.example إلى config.yaml :
cp config.yaml.example config.yaml
افتح config.yaml وقم بتحديث الإعدادات التالية:
llm_provider المفضل لديك (Openai ، Groq ، أو معًا)ابدأ خادم Fragaria API:
python main.py
ستكون واجهة برمجة التطبيقات متاحة على http://localhost:8000 (أو المضيف/المنفذ المحدد في التكوين الخاص بك).
يمكنك الآن إرسال طلبات نشر إلى http://localhost:8000/v1/chat/completions لاستخدام سلسلة من إمكانيات التفكير في التفكير.
توفر Fragaria وثائق API شاملة:
http://localhost:8000/docshttp://localhost:8000/redochttp://localhost:8000/openapi.json فيما يلي بعض المشكلات التي يمكنك حلها باستخدام Fragaria:
مشكلة الفراولة الكلاسيكية:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " How many 'r's in strawberry? " }
]
}لغز أكثر تعقيدًا مرتبطًا بالعمر:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " A princess is as old as the prince will be when the princess is twice as old as the prince was when the princess's age was half the sum of their present age. What is the age of prince and princess? Provide all solutions to that question. " }
]
} لحل هذه المشكلات ، أرسل طلبًا منشورًا إلى /v1/chat/completions مع حمولات JSON أعلاه.
تستخدم Fragaria عملية تفكير متطورة (COT) معززة من خلال التعلم التعزيز:
تتيح هذه العملية المحسنة لـ RL لمصطلحة لمجموعة واسعة من المشاكل فحسب ، بل تتيح أيضًا تعلم استراتيجياتها وتكييفها مع مرور الوقت ، مما أصبح فعالًا بشكل متزايد في حل أنواع المشاكل المألوفة والجديدة.
نرحب بالمساهمات في Fragaria! يرجى اتباع هذه الخطوات للمساهمة:
يرجى التأكد من أن الرمز الخاص بك يلتزم بمعايير ترميز المشروع وإدراج اختبارات للميزات الجديدة.
يتم إصدار Fragaria تحت رخصة معهد ماساتشوستس للتكنولوجيا. انظر ملف الترخيص للحصول على التفاصيل.
إذا كنت تستخدم Fragaria في بحثك أو ترغب في الرجوع إليها في منشوراتك ، فيرجى استخدام إدخال Bibtex التالي:
@software { fragaria2024 ,
author = { {Dipankar Sarkar} } ,
title = { Fragaria: Advanced Chain of Thought Reasoning API with Reinforcement Learning } ,
year = 2024 ,
publisher = { GitHub } ,
journal = { GitHub repository } ,
howpublished = { url{https://github.com/terraprompt/fragaria} } ,
}بالنسبة للأوراق الأكاديمية ، يمكنك الاستشهاد بـ Fragaria على النحو التالي:
Dipankar Sarkar. (2024). Fragaria: سلسلة متطورة من التفكير في API مع تعلم التعزيز [برنامج الكمبيوتر]. https://github.com/terraprompt/fragaria
يتم الحفاظ على Fragaria من قبل فريق Terraprompt. لأي أسئلة أو دعم ، يرجى فتح مشكلة على مستودع GitHub.