Fortgeschrittene Kette von Gedanken (COT) Argumentation API mit Verstärkungslernen (RL)

Fragaria ist eine leistungsstarke und flexible Kette von Denkweise (COT) Argumentation -API, die verschiedene Sprachmodellanbieter (LLM) nutzt und RL -Techniken (Verstärkungslernen) einbezieht, um komplexe Probleme zu lösen und komplizierte Fragen zu beantworten. Fragaria wurde nach der botanischen Gattung der Erdbeeren benannt und huldigt den berühmten "Wie viele" in Erdbeere? " Problem, symbolisiert seine Fähigkeit, sowohl einfache als auch komplexe Abfragen mit gleicher Finesse zu bekämpfen.
Klonen Sie das Repository:
git clone https://github.com/terraprompt/fragaria.git
cd fragaria
Erstellen Sie eine virtuelle Umgebung (optional, aber empfohlen):
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
Installieren Sie die erforderlichen Abhängigkeiten:
pip install -r requirements.txt
Kopieren Sie die Datei config.yaml.example in config.yaml :
cp config.yaml.example config.yaml
Öffnen Sie config.yaml und aktualisieren Sie die folgenden Einstellungen:
llm_provider (OpenAI, GROQ oder zusammen)Starten Sie den Fragaria -API -Server:
python main.py
Die API ist unter http://localhost:8000 (oder dem in Ihrer Konfiguration angegebenen Host/Port) erhältlich.
Sie können jetzt Postanfragen an http://localhost:8000/v1/chat/completions senden, um die Kette der Denkweise zu verwenden.
Fragaria liefert eine umfassende API -Dokumentation:
http://localhost:8000/docshttp://localhost:8000/redochttp://localhost:8000/openapi.json Hier sind einige Beispielprobleme, die Sie mit Fragaria lösen können:
Das klassische Strawberry -Problem:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " How many 'r's in strawberry? " }
]
}Ein komplexeres altersbedingteres Puzzle:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " A princess is as old as the prince will be when the princess is twice as old as the prince was when the princess's age was half the sum of their present age. What is the age of prince and princess? Provide all solutions to that question. " }
]
} Um diese Probleme zu lösen, senden Sie eine Postanforderung an /v1/chat/completions mit den oben genannten JSON -Nutzlasten.
Fragaria verwendet eine anspruchsvolle Kette von Denkkette (COT) Argumentationsprozess, die durch Verstärkungslernen verstärkt wird:
Dieser RL-verstärkte Prozess ermöglicht es Fragaria, nicht nur eine breite Palette von Problemen anzugehen, sondern auch seine Strategien im Laufe der Zeit zu lernen und anzupassen, was immer effizienter darin wird, sowohl bekannte als auch neuartige Problemtypen zu lösen.
Wir begrüßen Beiträge zu Fragaria! Bitte befolgen Sie diese Schritte, um einen Beitrag zu leisten:
Bitte stellen Sie sicher, dass Ihr Code die Codierungsstandards des Projekts hält und Tests für neue Funktionen eingeben.
Fragaria wird unter der MIT -Lizenz veröffentlicht. Weitere Informationen finden Sie in der Lizenzdatei.
Wenn Sie Fragaria in Ihrer Forschung verwenden oder sich in Ihren Veröffentlichungen darauf verweisen möchten, verwenden Sie bitte den folgenden Bibtex -Eintrag:
@software { fragaria2024 ,
author = { {Dipankar Sarkar} } ,
title = { Fragaria: Advanced Chain of Thought Reasoning API with Reinforcement Learning } ,
year = 2024 ,
publisher = { GitHub } ,
journal = { GitHub repository } ,
howpublished = { url{https://github.com/terraprompt/fragaria} } ,
}Für akademische Papiere können Sie Fragaria zitieren wie:
Dipankar Sarkar. (2024). Fragaria: Fortgeschrittene Kette der Denkweise API mit Verstärkungslernen [Computersoftware]. https://github.com/terraprompt/fragaria
Fragaria wird vom TerraPrompt -Team aufrechterhalten. Für Fragen oder Unterstützung öffnen Sie bitte ein Problem im Github -Repository.