고급 사고 체인 (COT) 강화 학습 (RL)이있는 API 추론 API

Fragaria는 다양한 언어 모델 (LLM) 제공 업체를 활용하고 복잡한 문제를 해결하고 복잡한 질문에 대답하기 위해 강화 학습 (RL) 기술을 통합하는 강력하고 유연한 사고 체인 (COT) 추론 API입니다. Fragaria는 딸기의 식물 속의 이름을 따서 명명 된 유명한 "딸기에 몇 명의 R '?"에게 경의를 표합니다. 문제, 단순하고 복잡한 쿼리를 동등한 세밀하게 다루는 능력을 상징합니다.
저장소 복제 :
git clone https://github.com/terraprompt/fragaria.git
cd fragaria
가상 환경을 만듭니다 (선택 사항이지만 권장) :
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
필요한 종속성 설치 :
pip install -r requirements.txt
config.yaml.example 파일을 config.yaml 에 복사하십시오.
cp config.yaml.example config.yaml
config.yaml 열고 다음 설정을 업데이트하십시오.
llm_provider (OpenAi, Groq 또는 함께)를 설정하십시오.Fragaria API 서버 시작 :
python main.py
API는 http://localhost:8000 (또는 구성에 지정된 호스트/포트)에서 제공됩니다.
이제 사고 추론 기능을 사용하려면 http://localhost:8000/v1/chat/completions 에 게시물 요청을 보낼 수 있습니다.
Fragaria는 포괄적 인 API 문서를 제공합니다.
http://localhost:8000/docshttp://localhost:8000/redochttp://localhost:8000/openapi.json Fragaria를 사용하여 해결할 수있는 몇 가지 샘플 문제는 다음과 같습니다.
고전적인 딸기 문제 :
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " How many 'r's in strawberry? " }
]
}더 복잡한 연령 관련 퍼즐 :
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " A princess is as old as the prince will be when the princess is twice as old as the prince was when the princess's age was half the sum of their present age. What is the age of prince and princess? Provide all solutions to that question. " }
]
} 이러한 문제를 해결하려면 위의 JSON 페이로드와 함께 /v1/chat/completions 로 게시물 요청을 보내십시오.
Fragaria는 강화 학습에 의해 강화 된 정교한 사고 체인 (COT) 추론 프로세스를 사용합니다.
이 RL 강화 프로세스를 통해 Fragaria는 광범위한 문제를 해결할뿐만 아니라 시간이 지남에 따라 전략을 배우고 조정하여 친숙하고 새로운 문제 유형을 모두 해결하는 데 점점 효율적이됩니다.
우리는 Fragaria에 대한 기여를 환영합니다! 다음 단계를 수행하려면 다음을 수행하십시오.
코드가 프로젝트의 코딩 표준을 준수하고 새로운 기능에 대한 테스트를 포함하도록하십시오.
Fragaria는 MIT 라이센스에 따라 릴리스됩니다. 자세한 내용은 라이센스 파일을 참조하십시오.
연구에서 Fragaria를 사용하거나 간행물에서이를 참조하려면 다음 Bibtex 항목을 사용하십시오.
@software { fragaria2024 ,
author = { {Dipankar Sarkar} } ,
title = { Fragaria: Advanced Chain of Thought Reasoning API with Reinforcement Learning } ,
year = 2024 ,
publisher = { GitHub } ,
journal = { GitHub repository } ,
howpublished = { url{https://github.com/terraprompt/fragaria} } ,
}학술 논문의 경우 Fragaria를 다음과 같이 인용 할 수 있습니다.
Dipankar Sarkar. (2024). FRAGRARIA : 강화 학습 [컴퓨터 소프트웨어]와 함께 고급 사고 추론 API. https://github.com/terraprompt/fragaria
Fragaria는 Terraprompt 팀에 의해 유지됩니다. 질문이나 지원이 있으시면 Github 저장소에 문제를여십시오.