API de raisonnement de chaîne avancée (COT) avec apprentissage par renforcement (RL)

Fragaria est une API de raisonnement de pensée puissante et flexible (COT) qui tire parti de divers fournisseurs de modèles de langage (LLM) et intègre des techniques d'apprentissage par renforcement (RL) pour résoudre des problèmes complexes et répondre à des questions complexes. Nommé d'après le genre botanique des fraises, Fragaria rend hommage au célèbre "Combien de R dans la fraise?" Problème, symbolisant sa capacité à s'attaquer à des requêtes simples et complexes avec une finesse égale.
Clone le référentiel:
git clone https://github.com/terraprompt/fragaria.git
cd fragaria
Créez un environnement virtuel (facultatif mais recommandé):
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
Installez les dépendances requises:
pip install -r requirements.txt
Copiez le fichier config.yaml.example sur config.yaml :
cp config.yaml.example config.yaml
Ouvrez config.yaml et mettez à jour les paramètres suivants:
llm_provider préféré (Openai, Groq ou ensemble)Démarrez le serveur API Fragaria:
python main.py
L'API sera disponible sur http://localhost:8000 (ou l'hôte / port spécifié dans votre configuration).
Vous pouvez désormais envoyer des demandes de poste à http://localhost:8000/v1/chat/completions pour utiliser les capacités de raisonnement de la chaîne de pensée.
Fragaria fournit une documentation API complète:
http://localhost:8000/docshttp://localhost:8000/redochttp://localhost:8000/openapi.json Voici quelques exemples de problèmes que vous pouvez résoudre à l'aide de Fragaria:
Le problème classique des fraises:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " How many 'r's in strawberry? " }
]
}Un puzzle plus complexe lié à l'âge:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " A princess is as old as the prince will be when the princess is twice as old as the prince was when the princess's age was half the sum of their present age. What is the age of prince and princess? Provide all solutions to that question. " }
]
} Pour résoudre ces problèmes, envoyez une demande de poste à /v1/chat/completions avec les charges utiles JSON ci-dessus.
Fragaria utilise un processus de raisonnement de pensée sophistiqué (COT) amélioré par l'apprentissage du renforcement:
Ce processus amélioré par RL permet à Fragaria non seulement de s'attaquer à un large éventail de problèmes, mais aussi d'apprendre et d'adapter ses stratégies au fil du temps, devenant de plus en plus efficace pour résoudre à la fois des types de problèmes familiers et nouveaux.
Nous saluons les contributions à Fragaria! Veuillez suivre ces étapes pour contribuer:
Veuillez vous assurer que votre code respecte les normes de codage du projet et incluez des tests pour de nouvelles fonctionnalités.
Fragaria est libéré sous la licence du MIT. Voir le fichier de licence pour plus de détails.
Si vous utilisez Fragaria dans vos recherches ou si vous souhaitez vous y référer dans vos publications, veuillez utiliser l'entrée Bibtex suivante:
@software { fragaria2024 ,
author = { {Dipankar Sarkar} } ,
title = { Fragaria: Advanced Chain of Thought Reasoning API with Reinforcement Learning } ,
year = 2024 ,
publisher = { GitHub } ,
journal = { GitHub repository } ,
howpublished = { url{https://github.com/terraprompt/fragaria} } ,
}Pour les documents académiques, vous pouvez citer Fragaria comme:
Dipankar Sarkar. (2024). Fragaria: API avancée de la chaîne de pensée avec apprentissage en renforcement [logiciel informatique]. https://github.com/terrapgrompt/fragaria
Fragaria est maintenue par l'équipe TerrapRomppt. Pour toute question ou support, veuillez ouvrir un problème sur le référentiel GitHub.