LLM security and privacy
1.0.0
从安全性和隐私的角度来看,涵盖LLM威胁和漏洞的论文和工具的精心策划清单。摘要,关键的外卖点以及每篇论文的其他详细信息都在纸张夏姆文件夹中找到。
main.bib文件包含此处列出的论文的最新引用。
概述图:当前对深度学习模型和连续大型语言模型(LLMS)的安全性和隐私威胁的分类法。
| 不。 | 纸张标题 | 场地 | 年 | 类别 | 代码 | 概括 |
|---|---|---|---|---|---|---|
| 1。 | 注射:在工具集成的大型语言模型代理中进行基准测试间接提示 | 预印 | 2024 | 提示注射 | N/A。 | TBD |
| 2。 | LLM代理可以自主黑客网站 | 预印 | 2024 | 申请 | N/A。 | TBD |
| 3。 | 灾难性AI风险的概述 | 预印 | 2023 | 一般的 | N/A。 | TBD |
| 4。 | 使用LLM的非法目的:威胁,预防措施和脆弱性 | 预印 | 2023 | 一般的 | N/A。 | TBD |
| 5。 | LLM审查制度:机器学习挑战或计算机安全问题? | 预印 | 2023 | 一般的 | N/A。 | TBD |
| 6。 | 超越保障措施:探索Chatgpt的安全风险 | 预印 | 2023 | 一般的 | N/A。 | TBD |
| 7。 | 迅速注射攻击针对LLM集成应用 | 预印 | 2023 | 提示注射 | N/A。 | TBD |
| 8。 | 识别和减轻生成AI的安全风险 | 预印 | 2023 | 一般的 | N/A。 | TBD |
| 9。 | 通行证:密码建模和(指导)具有大语言模型的生成 | 美洲 | 2023 | 申请 | TBD | |
| 10。 | 利用GPT-4来生成网络安全GRC政策:专注于勒索软件攻击 | 计算机和安全性 | 2023 | 申请 | N/A。 | TBD |
| 11。 | 不是您注册的内容:与间接及时注入的真实世界LLM集成应用 | 预印 | 2023 | 提示注射 | TBD | |
| 12。 | 使用大语言模型检查零射击脆弱性修复 | IEEE S&P | 2023 | 申请 | N/A。 | TBD |
| 13。 | LLM平台安全:将系统评估框架应用于OpenAI的Chatgpt插件 | 预印 | 2023 | 一般的 | N/A。 | TBD |
| 14。 | 验证链减少了大语言模型的幻觉 | 预印 | 2023 | 幻觉 | N/A。 | TBD |
| 15。 | 流行测验!大型语言模型可以帮助逆向工程吗? | 预印 | 2022 | 申请 | N/A。 | TBD |
| 16。 | 从大语言模型中提取培训数据 | USENIX安全 | 2021 | 数据提取 | TBD | |
| 17。 | AI蠕虫:释放零点击蠕虫,以Genai为目标的应用 | 预印 | 2024 | 提示注入 | TBD | |
| 18。 | 悬崖:在抽象摘要中改善忠诚和事实的对比学习 | emnlp | 2021 | 幻觉 | TBD |
如果您有兴趣为此存储库做出贡献,请参阅《贡献》。MD有关指南的详细信息。
此处找到当前贡献者的列表。
有关此存储库和/或潜在(研究)合作的任何疑问,请联系Briland Hitaj。