LLM security and privacy
1.0.0
從安全性和隱私的角度來看,涵蓋LLM威脅和漏洞的論文和工具的精心策劃清單。摘要,關鍵的外賣點以及每篇論文的其他詳細信息都在紙張夏姆文件夾中找到。
main.bib文件包含此處列出的論文的最新引用。
概述圖:當前對深度學習模型和連續大型語言模型(LLMS)的安全性和隱私威脅的分類法。
| 不。 | 紙張標題 | 場地 | 年 | 類別 | 代碼 | 概括 |
|---|---|---|---|---|---|---|
| 1。 | 注射:在工具集成的大型語言模型代理中進行基準測試間接提示 | 預印 | 2024 | 提示注射 | N/A。 | TBD |
| 2。 | LLM代理可以自主黑客網站 | 預印 | 2024 | 申請 | N/A。 | TBD |
| 3。 | 災難性AI風險的概述 | 預印 | 2023 | 一般的 | N/A。 | TBD |
| 4。 | 使用LLM的非法目的:威脅,預防措施和脆弱性 | 預印 | 2023 | 一般的 | N/A。 | TBD |
| 5。 | LLM審查制度:機器學習挑戰或計算機安全問題? | 預印 | 2023 | 一般的 | N/A。 | TBD |
| 6。 | 超越保障措施:探索Chatgpt的安全風險 | 預印 | 2023 | 一般的 | N/A。 | TBD |
| 7。 | 迅速注射攻擊針對LLM集成應用 | 預印 | 2023 | 提示注射 | N/A。 | TBD |
| 8。 | 識別和減輕生成AI的安全風險 | 預印 | 2023 | 一般的 | N/A。 | TBD |
| 9。 | 通行證:密碼建模和(指導)具有大語言模型的生成 | Esorics | 2023 | 申請 | TBD | |
| 10。 | 利用GPT-4來生成網絡安全GRC政策:專注於勒索軟件攻擊 | 計算機和安全性 | 2023 | 申請 | N/A。 | TBD |
| 11。 | 不是您註冊的內容:與間接及時注入的真實世界LLM集成應用 | 預印 | 2023 | 提示注射 | TBD | |
| 12。 | 使用大語言模型檢查零射擊脆弱性修復 | IEEE S&P | 2023 | 申請 | N/A。 | TBD |
| 13。 | LLM平台安全:將系統評估框架應用於OpenAI的Chatgpt插件 | 預印 | 2023 | 一般的 | N/A。 | TBD |
| 14。 | 驗證鏈減少了大語言模型的幻覺 | 預印 | 2023 | 幻覺 | N/A。 | TBD |
| 15。 | 流行測驗!大型語言模型可以幫助逆向工程嗎? | 預印 | 2022 | 申請 | N/A。 | TBD |
| 16。 | 從大語言模型中提取培訓數據 | USENIX安全 | 2021 | 數據提取 | TBD | |
| 17。 | AI蠕蟲:釋放零點擊蠕蟲,以Genai為目標的應用 | 預印 | 2024 | 提示注入 | TBD | |
| 18。 | 懸崖:在抽象摘要中改善忠誠和事實的對比學習 | emnlp | 2021 | 幻覺 | TBD |
如果您有興趣為此存儲庫做出貢獻,請參閱《貢獻》。MD有關指南的詳細信息。
此處找到當前貢獻者的列表。
有關此存儲庫和/或潛在(研究)合作的任何疑問,請聯繫Briland Hitaj。