llms as method actors
1.0.0
Paper LLMS作为方法参与者的官方实施:使用代码,提示和样本输出的及时工程和体系结构的模型。
将您的OpenAI API密钥存储在环境变量OPENAI_API_KEY中。 (要了解有关设置OpenAI API密钥的更多信息,请遵循此链接)。如果您想使用人类或双子座模型,请将这些键存储在环境变量ANTHROPIC_API_KEY和GEMINI_API_KEY中。
pip install -r requirements.txt这将安装requirements.txt中列出的所有依赖项。
Jupyter Notebook Tutorial.ipynb可以引导您了解如何在任何连接拼图上从纸上运行每种方法。
每种方法的示例输出都在“ sample_output”文件夹中可用,作为markdown文件。对于更复杂的方法,包括标记文件,以跟踪所考虑的每个猜测的中介进度。名为“摘要”和“ summary_detailed”的降价文件总结了总体结果和中介步骤的结果。
样本输出是通过在2024年11月11日在Arxiv.org上宣布纸张的那一天的连接拼图上的Python脚本来创建的。
结果如下:
| 方法 | 成功? | #正确的猜测 | #不正确的猜测 |
|---|---|---|---|
| 香草 | 不 | 0 | 4 |
| 经过思考链 | 不 | 1 | 4 |
| 经过思考链(脚本) | 是的 | 4 | 3 |
| 演员 | 是的 | 4 | 0 |
| 演员2 | 是的 | 4 | 1 |
| Oneshot-O1 | 不 | 2 | 2 |
| 香草-O1 | 是的 | 4 | 0 |
| 演员-O1 | 是的 | 4 | 0 |
如果您觉得很有趣或有用,请引用纸张并将其播放。如果您有任何疑问,请随时联系[email protected]。
@misc { doyle2024method ,
title = { LLMs as Method Actors: A Model for Prompt Engineering and Architecture } ,
author = { Colin Doyle } ,
year = { 2024 } ,
eprint = { 2411.05778 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}