Рассудивание API Advanced of Geand of Monder (COT) с обучением подкрепления (RL)

Fragaria - это мощная и гибкая цепочка мышления (COT) API, которая использует различные поставщики различных языковых моделей (LLM) и включает в себя методы обучения подкреплению (RL) для решения сложных проблем и ответа на сложные вопросы. Названная в честь ботанического рода клубники, Fragaria отдает дань уважения знаменитому «Сколько» в клубнике? » Проблема, символизируя его способность решать как простые, так и сложные запросы с равной изяществом.
Клонировать репозиторий:
git clone https://github.com/terraprompt/fragaria.git
cd fragaria
Создайте виртуальную среду (необязательно, но рекомендуется):
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
Установите требуемые зависимости:
pip install -r requirements.txt
Скопируйте файл config.yaml.example в config.yaml :
cp config.yaml.example config.yaml
Откройте config.yaml и обновите следующие настройки:
llm_provider (OpenAI, GROQ или вместе)Запустите сервер API Fragaria:
python main.py
API будет доступен по адресу http://localhost:8000 (или хост/порт, указанный в вашей конфигурации).
Теперь вы можете отправить запросы на почту на http://localhost:8000/v1/chat/completions чтобы использовать цепочку мышления мышления.
Fragaria предоставляет комплексную документацию API:
http://localhost:8000/docshttp://localhost:8000/redochttp://localhost:8000/openapi.json Вот некоторые проблемы примера, которые вы можете решить, используя Fragaria:
Классическая проблема с клубникой:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " How many 'r's in strawberry? " }
]
}Более сложная возрастная головоломка:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " A princess is as old as the prince will be when the princess is twice as old as the prince was when the princess's age was half the sum of their present age. What is the age of prince and princess? Provide all solutions to that question. " }
]
} Чтобы решить эти проблемы, отправьте запрос сообщения в /v1/chat/completions с приведенными выше полезными нагрузками JSON.
Fragaria использует сложную цепочку мышления (COT) процесс рассуждений, улучшенной за счет обучения подкреплением:
Этот процесс, усиленный RL, позволяет Fragaria не только решать широкий спектр проблем, но и учиться и адаптировать свои стратегии с течением времени, становясь все более эффективным в решении как знакомых, так и новых типов проблем.
Мы приветствуем вклад в Fragaria! Пожалуйста, следуйте этим шагам, чтобы внести свой вклад:
Пожалуйста, убедитесь, что ваш код придерживается стандартов кодирования проекта и включите тесты для новых функций.
Fragaria выпускается по лицензии MIT. Смотрите файл лицензии для получения подробной информации.
Если вы используете Fragaria в своем исследовании или хотите обратиться к ней в своих публикациях, используйте следующую запись Bibtex:
@software { fragaria2024 ,
author = { {Dipankar Sarkar} } ,
title = { Fragaria: Advanced Chain of Thought Reasoning API with Reinforcement Learning } ,
year = 2024 ,
publisher = { GitHub } ,
journal = { GitHub repository } ,
howpublished = { url{https://github.com/terraprompt/fragaria} } ,
}Что касается академических работ, вы можете цитировать Fragaria как:
Дипанк Саркар. (2024). Fragaria: передовая цепочка мышления API с учетом подкрепления [компьютерное программное обеспечение]. https://github.com/terraprompt/fragaria
Fragaria поддерживается командой Terraprompt. Для любых вопросов или поддержки, пожалуйста, откройте проблему в репозитории GitHub.