API de razonamiento de la cadena de pensamiento avanzada (COT) con aprendizaje de refuerzo (RL)

Fragaria es una API de razonamiento de pensamiento (COT) potente y flexible que aprovecha los proveedores de varios modelos de lenguaje (LLM) e incorpora técnicas de aprendizaje de refuerzo (RL) para resolver problemas complejos y responder preguntas intrincadas. El nombre del género botánico de las fresas, Fragaria rinde homenaje a los famosos "¿Cuántos 'R en Strawberry?" Problema, simbolizando su capacidad para abordar consultas simples y complejas con igualdad igual.
Clon el repositorio:
git clone https://github.com/terraprompt/fragaria.git
cd fragaria
Crear un entorno virtual (opcional pero recomendado):
python -m venv venv
source venv/bin/activate # On Windows, use `venvScriptsactivate`
Instale las dependencias requeridas:
pip install -r requirements.txt
Copie el archivo config.yaml.example a config.yaml :
cp config.yaml.example config.yaml
Abra config.yaml y actualice la siguiente configuración:
llm_provider preferido (OpenAI, Groq o juntos)Inicie el servidor API de Fragaria:
python main.py
La API estará disponible en http://localhost:8000 (o el host/puerto especificado en su configuración).
Ahora puede enviar solicitudes de publicaciones a http://localhost:8000/v1/chat/completions para usar la cadena de capacidades de razonamiento de pensamiento.
Fragaria proporciona documentación integral de API:
http://localhost:8000/docshttp://localhost:8000/redochttp://localhost:8000/openapi.json Aquí hay algunos problemas de muestra que puede resolver usando Fragaria:
El clásico problema de fresa:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " How many 'r's in strawberry? " }
]
}Un rompecabezas más complejo relacionado con la edad:
{
"model" : " faragia-dev " ,
"messages" : [
{ "role" : " user " , "content" : " A princess is as old as the prince will be when the princess is twice as old as the prince was when the princess's age was half the sum of their present age. What is the age of prince and princess? Provide all solutions to that question. " }
]
} Para resolver estos problemas, envíe una solicitud de publicación a /v1/chat/completions con las cargas útiles de JSON anteriores.
Fragaria emplea una cadena de pensamiento sofisticada (COT) proceso de razonamiento mejorado por el aprendizaje de refuerzo:
Este proceso mejorado por RL permite a Fragaria no solo abordar una amplia gama de problemas, sino también aprender y adaptar sus estrategias con el tiempo, cada vez más eficiente para resolver tipos de problemas familiares y novedosos.
¡Agradecemos las contribuciones a Fragaria! Siga estos pasos para contribuir:
Asegúrese de que su código se adhiera a los estándares de codificación del proyecto e incluya pruebas para nuevas funciones.
Fragaria se libera bajo la licencia MIT. Consulte el archivo de licencia para obtener más detalles.
Si usa Fragaria en su investigación o desea referirse a ella en sus publicaciones, utilice la siguiente entrada de Bibtex:
@software { fragaria2024 ,
author = { {Dipankar Sarkar} } ,
title = { Fragaria: Advanced Chain of Thought Reasoning API with Reinforcement Learning } ,
year = 2024 ,
publisher = { GitHub } ,
journal = { GitHub repository } ,
howpublished = { url{https://github.com/terraprompt/fragaria} } ,
}Para los documentos académicos, puede citar Fragaria como:
Dipankar Sarkar. (2024). Fragaria: API de razonamiento avanzado de la cadena de pensamiento con aprendizaje de refuerzo [software de computadora]. https://github.com/terraprompt/fragaria
Fragaria es mantenida por el equipo de terraza. Para cualquier pregunta o soporte, abra un problema en el repositorio de GitHub.