llm prompting practices ja
2024.03.12
根據高質量的參考材料,我們很容易編輯用於創建LLM(大規模語言模型)提示的提示。
僅提供概述。請參閱每個文檔以獲取詳細信息。
可以通過出版的材料在某種程度上學習及時的工程技術。如果您正在考慮購買有關及時工程的課程,商品或書籍(通常對於那些沒有信息的人),請務必先閱讀這些材料。
及時工程 - OpenAI API
六個策略
- 寫清晰的說明
- 包括詳細信息
- 分配角色
- 清楚地分配輸入語句的不同部分
- 指定完成任務所需的步驟
- 提出一個例子
- 指定您想要的答案的長度
- 提供參考文本
- 指示您使用參考文本響應
- 指示他們用參考文本的報價解開拉鍊
- 將復雜任務分為簡單的子任務
- 使用意圖分類確定用戶查詢的高度相關說明
- 在需要長時間對話的交互式應用程序中總結或過濾以前的交互
- 長文件以碎片為單位,然後遞歸構建整體摘要。
- 給模型時間思考
- 在得出結論之前,告訴模型本身要找到解決方案
- 使用內部獨白和一組查詢隱藏模型的推理過程
- 詢問模型是否缺少上次通行證
- 使用外部工具
- 使用基於嵌入的搜索進行有效的知識重演
- 使用代碼執行來進行更準確的計算和外部API調用
- 讓模型訪問特定功能
- 系統地測試您的更改
- 使用黃金標準答案評估模型的輸出
及時設計策略| Google AI針對開發人員
及時設計策略
- 給出明確而具體的說明
- 定義要執行的任務
- 指定所有約束
- 定義答案的格式
- 包括一些例子
- 零射擊和少量射擊提示
- 找到最佳示例數量
- 示例用於顯示模式,而不是反圖案。
- 提供的示例使用一致的格式
- 添加上下文信息
- 添加一個前綴
- 輸入前綴
- 輸出前綴
- 示例前綴
- 給出模型部分輸入以完成它
- 分解提示為簡單組件
- 分解說明
- 創建一個提示鏈(使上一個提示的輸出作為下一個提示的輸入)
- 匯總響應
- 嘗試不同的參數值
- 最大輸出令牌
- 溫度
- top-k
- 頂級
- 迅速改進週期策略
- 使用其他短語
- 切換到類似的任務
- 重新排序提示內容
- 後備響應
- 要避免的事情
- 避免依靠模型來生成事實信息
- 謹慎使用數學和邏輯問題
通用AI的及時工程|機器學習| Google for Developers
迅速生成AI的工程
及時創建最佳實踐
- 清楚地傳達哪些內容和信息最重要。
- 構建提示:從角色定義開始,提供上下文和輸入數據並提供指令。
- 使用具體和多樣的示例,使模型能夠以重點產生準確的結果。
- 給出約束以限制模型輸出的範圍。這樣做將避免偏離指示並提供不准確的信息。
- 複雜的任務分為簡單的序列。
- 指示模型在生成它們之前對自己的答案進行評分並檢查自己的答案(“響應應在3個句子之內”,“對輸出的簡短為1-10。”“您認為這是正確的嗎?”)。
提示類型
- 直接提示(零射)
- 提示一個示例(單桿/少射/多槍)
- COT(經營鏈)提示
- 零射床
- 迅速改進週期策略
及時的工程
- 定義任務和成功標準
- 要考慮的關鍵成功標準
- 性能和準確性
- 潛伏期
- 價格
- 創建一個測試用例
- 創建一個臨時提示
- 在測試案例上嘗試提示
- 提示提示
- 返回步驟4並重複改進
- 釋放拋光提示
首先從功能最強大的型號和長提示開始,一旦擁有所需的輸出質量,請嘗試較小的型號或較短的提示,以節省延遲和成本。
迅速的工程技術
- 清楚地告訴他們
- 使用示例
- 扮演模型
- 使用XML標籤(特定於Claude)
- 分開大提示
- 使模型逐步思考
- 指定預期輸出的開始
- 指定輸出格式
- 請重寫
- 帶有長上下文窗口的模型利用它
及時的工程指南
LLM設置
姓名 解釋 溫度 隨機程度。提高溫度會增加隨機性,而降低會降低隨機性。 頂部p 一種稱為核採樣的採樣方法。較高的頂部P增加了響應的多樣性。 最大長度 答案的最大長度。單位因模型而異,例如令牌和字符的數量。 停止序列 停止生成答案的字符串模式。 頻率罰款 特定令牌發生頻率的罰款。 存在處罰 任何令牌發生頻率的罰款。 提示組件
將以下內容視為提示的組成部分:
姓名 日本人 解釋 操作說明 指示 您要建模的任務 情境 情境 外部信息和其他上下文 輸入數據 輸入數據 輸入和問題要答案 輸出指示器 輸出指示器 輸出類型和格式 一般提示
- 簡單開始並重複改進
- 以有序的方式指示請求
- 具體來說,直接
- 避免不准確
- “這就是方式”而不是“不要這樣做”。
及時創建技術
- 零射擊提示
- 很少射擊
- COT(經營鏈)提示
- 自矛盾
- 產生的知識提示
- 及時鏈接
- TOT(思想樹)
- 抹布(檢索增強一代)
- 藝術(自動推理和工具使用)
- 猿(自動及時工程師)
- 主動提示
- 方向性刺激提示
- PAL(程序輔助語言模型)
- 反應提示
- 反射
- 多模式COT提示
- GraphPrompt
風險和濫用
- 敵對提示(及時攻擊)
- 提示注射
- 普羅普特國王
- 越獄(越獄)
- 真相
- 偏見