Implémentation officielle de Paper LLMS en tant qu'acteurs de méthode: un modèle d'ingénierie et d'architecture rapides avec code, invites et échantillons de sorties.
Stockez votre touche API OpenAI dans la variable d'environnement OPENAI_API_KEY . (Pour en savoir plus sur la mise en place d'une clé API OpenAI, suivez ce lien). Si vous souhaitez utiliser des modèles anthropiques ou Gemini, stockez ces clés dans les variables environnementales ANTHROPIC_API_KEY et GEMINI_API_KEY .
pip install -r requirements.txt Cela installera toutes les dépendances répertoriées dans requirements.txt .
The Jupyter Notebook Tutorial.Ipynb peut vous guider à travers comment exécuter chacune des approches à partir de l'article sur n'importe quel puzzle de connexions.
Des exemples de sorties pour chacune des approches sont disponibles dans le dossier «Sample_Outputs» en tant que fichiers de marque. Pour les approches plus compliquées, des fichiers de démarrage sont inclus qui suivent les progrès intermédiaires pour chaque supposition qui a été considérée. Les fichiers de marquage nommés «Résumé» et «Summary_Detailed» résument le résultat global et les résultats des étapes intermédiaires.
Les sorties d'échantillons ont été créées en exécutant les scripts Python sur le puzzle des connexions à partir du jour où le papier a été annoncé sur arXiv.org, le 11 novembre 2024.
Les résultats étaient les suivants:
| Approche | Succès? | # Guessages corrects | # Guesstes incorrectes |
|---|---|---|---|
| Vanille | Non | 0 | 4 |
| Chaîne de pensées | Non | 1 | 4 |
| Chaîne de pensées (scénarisée) | Oui | 4 | 3 |
| Acteur | Oui | 4 | 0 |
| Acteur-2 | Oui | 4 | 1 |
| OneShot-O1 | Non | 2 | 2 |
| Vanilla-o1 | Oui | 4 | 0 |
| Acteur-O1 | Oui | 4 | 0 |
Veuillez citer le papier et jouer ce dépôt si vous le trouvez intéressant ou utile. N'hésitez pas à contacter [email protected] si vous avez des questions.
@misc { doyle2024method ,
title = { LLMs as Method Actors: A Model for Prompt Engineering and Architecture } ,
author = { Colin Doyle } ,
year = { 2024 } ,
eprint = { 2411.05778 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}