高度な思考チェーン(COT)補強学習を備えたAPIの推論(RL)

Fragariaは、さまざまな言語モデル(LLM)プロバイダーを活用し、複雑な問題を解決し、複雑な質問に答えるために補強学習(RL)技術を組み込んださまざまな言語モデル(LLM)プロバイダーを組み込んだ強力で柔軟な思考チェーン(COT)APIです。イチゴの植物属にちなんで名付けられたFragariaは、有名な「 'rはイチゴにある' rは何ですか?」に敬意を表します。問題は、シンプルなクエリと複雑なクエリの両方に平等なフィネスに取り組む能力を象徴しています。
リポジトリをクローンします:
git clone https://github.com/terraprompt/fragaria.git
cd fragaria
仮想環境を作成します(オプションですが推奨):
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
必要な依存関係をインストールします。
pip install -r requirements.txt
config.yaml.exampleファイルをconfig.yamlにコピーします:
cp config.yaml.example config.yaml
config.yamlを開き、次の設定を更新します。
llm_provider (Openai、Groq、または一緒に設定する)Fragaria APIサーバーを開始します。
python main.py
APIはhttp://localhost:8000 (または構成で指定されたホスト/ポート)で利用できます。
これで、 http://localhost:8000/v1/chat/completionsに投稿リクエストを送信して、一連の思考推論機能を使用できます。
Fragariaは包括的なAPIドキュメントを提供します。
http://localhost:8000/docshttp://localhost:8000/redochttp://localhost:8000/openapi.json Fragariaを使用して解決できるサンプルの問題は次のとおりです。
古典的なイチゴの問題:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " How many 'r's in strawberry? " }
]
}より複雑な年齢に関連したパズル:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " A princess is as old as the prince will be when the princess is twice as old as the prince was when the princess's age was half the sum of their present age. What is the age of prince and princess? Provide all solutions to that question. " }
]
}これらの問題を解決するには、上記のJSONペイロードで/v1/chat/completionsにPOSTリクエストを送信します。
Fragariaは、強化学習によって強化された洗練された思考のチェーン(COT)推論プロセスを採用しています。
このRL強化プロセスにより、Fragariaは幅広い問題に取り組むだけでなく、時間の経過とともに戦略を学び、適応させることができ、馴染みのある問題と新しい問題の両方のタイプを解決するのにますます効率的になります。
フラガリアへの貢献を歓迎します!貢献するには、次の手順に従ってください。
コードがプロジェクトのコーディング基準に準拠していることを確認し、新機能のテストを含めてください。
FragariaはMITライセンスの下でリリースされます。詳細については、ライセンスファイルを参照してください。
研究でFragariaを使用したり、出版物でそれを参照したい場合は、次のBibtexエントリを使用してください。
@software { fragaria2024 ,
author = { {Dipankar Sarkar} } ,
title = { Fragaria: Advanced Chain of Thought Reasoning API with Reinforcement Learning } ,
year = 2024 ,
publisher = { GitHub } ,
journal = { GitHub repository } ,
howpublished = { url{https://github.com/terraprompt/fragaria} } ,
}アカデミックペーパーの場合、Fragariaを次のように引用できます。
Dipankar Sarkar。 (2024)。 Fragaria:補強学習を使用してAPIを推論する高度な思考チェーン[コンピューターソフトウェア]。 https://github.com/terraprompt/fragaria
FragariaはTerrapromptチームによって維持されています。質問やサポートについては、GitHubリポジトリで問題を開いてください。