API de raciocínio avançado da cadeia de pensamento (COT) com aprendizado de reforço (RL)

A FraGaria é uma API de raciocínio poderosa e flexível da cadeia de pensamento (COT) que aproveita vários provedores de modelo de linguagem (LLM) e incorpora técnicas de aprendizado de reforço (RL) para resolver problemas complexos e responder a perguntas complexas. Nomeado após o gênero botânico de morangos, a Fragaria presta homenagem ao famoso "quantos 'r's em morango?" Problema, simbolizando sua capacidade de enfrentar consultas simples e complexas com igual requinte.
Clone o repositório:
git clone https://github.com/terraprompt/fragaria.git
cd fragaria
Crie um ambiente virtual (opcional, mas recomendado):
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
Instale as dependências necessárias:
pip install -r requirements.txt
Copie o arquivo config.yaml.example para config.yaml :
cp config.yaml.example config.yaml
Open config.yaml e atualize as seguintes configurações:
llm_provider PREFERIDO (OPENAI, GROQ ou juntos)Inicie o FraGaria API Server:
python main.py
A API estará disponível em http://localhost:8000 (ou o host/porta especificado em sua configuração).
Agora você pode enviar solicitações de postagem para http://localhost:8000/v1/chat/completions para usar a cadeia de recursos de raciocínio de pensamento.
A FraGaria fornece documentação abrangente da API:
http://localhost:8000/docshttp://localhost:8000/redochttp://localhost:8000/openapi.json Aqui estão alguns problemas de amostra que você pode resolver usando FraGaria:
O problema clássico de morango:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " How many 'r's in strawberry? " }
]
}Um quebra-cabeça mais complexo relacionado à idade:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " A princess is as old as the prince will be when the princess is twice as old as the prince was when the princess's age was half the sum of their present age. What is the age of prince and princess? Provide all solutions to that question. " }
]
} Para resolver esses problemas, envie uma solicitação de postagem para /v1/chat/completions com as cargas úteis JSON acima.
A Fragaria emprega um processo de raciocínio sofisticado da cadeia de pensamento (COT), aprimorado pela aprendizagem de reforço:
Esse processo aprimorado pela RL permite que a Fragaria não apenas lide com uma ampla gama de problemas, mas também aprenda e adapte suas estratégias ao longo do tempo, tornando-se cada vez mais eficiente em resolver os tipos familiares e novos de problemas.
Congratulamo -nos com contribuições para a Fragaria! Siga estas etapas para contribuir:
Verifique se o seu código adere aos padrões de codificação do projeto e inclua testes para novos recursos.
A Fragaria é liberada sob a licença do MIT. Consulte o arquivo de licença para obter detalhes.
Se você usa a FraGaria em sua pesquisa ou deseja consultar em suas publicações, use a seguinte entrada do Bibtex:
@software { fragaria2024 ,
author = { {Dipankar Sarkar} } ,
title = { Fragaria: Advanced Chain of Thought Reasoning API with Reinforcement Learning } ,
year = 2024 ,
publisher = { GitHub } ,
journal = { GitHub repository } ,
howpublished = { url{https://github.com/terraprompt/fragaria} } ,
}Para trabalhos acadêmicos, você pode citar a FraGaria como:
Dipankar Sarkar. (2024). FraGaria: Cadeia avançada de API de raciocínio de pensamento com aprendizado de reforço [software de computador]. https://github.com/terraprompt/fragaria
A FraGaria é mantida pela equipe Terreprompt. Para qualquer dúvida ou suporte, abra um problema no repositório do GitHub.