Куративный список документов и инструментов, охватывающих угрозы LLM и уязвимости, как с точки зрения безопасности, так и с точки зрения конфиденциальности. Резюме, ключевые точки вывода и дополнительные детали для каждой бумаги находятся в папке Paper-Summary.
Файл main.bib содержит последние цитаты документов, перечисленных здесь.
Обзор рисунок: Таксономия текущих угроз безопасности и конфиденциальности в отношении моделей глубокого обучения и последовательно крупных языковых моделей (LLMS).
| Нет. | Название бумаги | Место проведения | Год | Категория | Код | Краткое содержание |
|---|---|---|---|---|---|---|
| 1 | InjectAgent: сравнительный анализ косвенных оперативных инъекций в интеграционных инструментах крупных языковых модельных агентов | предварительный отпечаток | 2024 | Быстрое впрыск | N/a | TBD |
| 2 | Агенты LLM могут автономно взломать веб -сайты | предварительный отпечаток | 2024 | Приложения | N/a | TBD |
| 3 | Обзор катастрофических рисков ИИ | предварительный отпечаток | 2023 | Общий | N/a | TBD |
| 4 | Использование LLM для незаконных целей: угрозы, меры по профилактике и уязвимости | предварительный отпечаток | 2023 | Общий | N/a | TBD |
| 5 | Цензура LLM: задача машинного обучения или проблема компьютерной безопасности? | предварительный отпечаток | 2023 | Общий | N/a | TBD |
| 6 | Помимо гарантий: изучение рисков безопасности CHATGPT | предварительный отпечаток | 2023 | Общий | N/a | TBD |
| 7 | Оперативная атака впрыска против применений, интегрированных LLM | предварительный отпечаток | 2023 | Быстрое впрыск | N/a | TBD |
| 8 | Выявление и смягчение рисков безопасности генеративного ИИ | предварительный отпечаток | 2023 | Общий | N/a | TBD |
| 9 | PassGPT: моделирование пароля и (управляемое) генерация с большими языковыми моделями | Эзорика | 2023 | Приложения | TBD | |
| 10 | Использование GPT-4 для генерации политик GRC в области кибербезопасности: сосредоточение внимания на смягчении атаки вымогателей | Компьютеры и безопасность | 2023 | Приложения | N/a | TBD |
| 11 | Не то, на что вы зарегистрировались: компрометирование реальных интегрированных приложений LLM с косвенной оперативной инъекцией | предварительный отпечаток | 2023 | Быстрое впрыск | TBD | |
| 12 | Изучение ремонта уязвимости с нулевым выстрелом с большими языковыми моделями | IEEE S & P. | 2023 | Приложения | N/a | TBD |
| 13 | Безопасность платформы LLM: применение систематической структуры оценки к плагинам OpenAI CHATGPT | предварительный отпечаток | 2023 | Общий | N/a | TBD |
| 14 | Цепь проверки уменьшает галлюцинацию в моделях крупных языков | предварительный отпечаток | 2023 | Галлюцинации | N/a | TBD |
| 15 | Поп -викторина! Может ли большая языковая модель помочь с обратной инженерией? | предварительный отпечаток | 2022 | Приложения | N/a | TBD |
| 16 | Извлечение данных обучения из моделей крупных языков | Usenix Security | 2021 | Извлечение данных | TBD | |
| 17 | Вот наступает червя ИИ: развязать червей с нулевым щелчком, которые нацелены на приложения на основе Genai | предварительный отпечаток | 2024 | Быстрое впрыск | TBD | |
| 18 | Cliff: Контрастное обучение для улучшения верности и фактической среды в абстрактной суммировании | Emnlp | 2021 | Галлюцинации | TBD |
Если вы заинтересованы в участии в этом репозитории, см. В соответствии с подробностями по рекомендациям.
Список текущих участников найден здесь.
По любым вопросам, касающимся этого хранилища и/или потенциального (исследовательского) сотрудничества, пожалуйста, свяжитесь с Брилендом Хитадж.