Скачать LLM security and privacy - LLM security and privacy .

LLM security and privacy

Другой исходный код

1.0.0

Скачать

LLM Безопасность и конфиденциальность

Куративный список документов и инструментов, охватывающих угрозы LLM и уязвимости, как с точки зрения безопасности, так и с точки зрения конфиденциальности. Резюме, ключевые точки вывода и дополнительные детали для каждой бумаги находятся в папке Paper-Summary.

Файл main.bib содержит последние цитаты документов, перечисленных здесь.

Таксономия угроз безопасности и конфиденциальности в отношении моделей глубокого обучения и последовательно LLMS Обзор рисунок: Таксономия текущих угроз безопасности и конфиденциальности в отношении моделей глубокого обучения и последовательно крупных языковых моделей (LLMS).

Документы

Нет.	Название бумаги	Место проведения	Год	Категория	Код	Краткое содержание
1	InjectAgent: сравнительный анализ косвенных оперативных инъекций в интеграционных инструментах крупных языковых модельных агентов	предварительный отпечаток	2024	Быстрое впрыск	N/a	TBD
2	Агенты LLM могут автономно взломать веб -сайты	предварительный отпечаток	2024	Приложения	N/a	TBD
3	Обзор катастрофических рисков ИИ	предварительный отпечаток	2023	Общий	N/a	TBD
4	Использование LLM для незаконных целей: угрозы, меры по профилактике и уязвимости	предварительный отпечаток	2023	Общий	N/a	TBD
5	Цензура LLM: задача машинного обучения или проблема компьютерной безопасности?	предварительный отпечаток	2023	Общий	N/a	TBD
6	Помимо гарантий: изучение рисков безопасности CHATGPT	предварительный отпечаток	2023	Общий	N/a	TBD
7	Оперативная атака впрыска против применений, интегрированных LLM	предварительный отпечаток	2023	Быстрое впрыск	N/a	TBD
8	Выявление и смягчение рисков безопасности генеративного ИИ	предварительный отпечаток	2023	Общий	N/a	TBD
9	PassGPT: моделирование пароля и (управляемое) генерация с большими языковыми моделями	Эзорика	2023	Приложения		TBD
10	Использование GPT-4 для генерации политик GRC в области кибербезопасности: сосредоточение внимания на смягчении атаки вымогателей	Компьютеры и безопасность	2023	Приложения	N/a	TBD
11	Не то, на что вы зарегистрировались: компрометирование реальных интегрированных приложений LLM с косвенной оперативной инъекцией	предварительный отпечаток	2023	Быстрое впрыск		TBD
12	Изучение ремонта уязвимости с нулевым выстрелом с большими языковыми моделями	IEEE S & P.	2023	Приложения	N/a	TBD
13	Безопасность платформы LLM: применение систематической структуры оценки к плагинам OpenAI CHATGPT	предварительный отпечаток	2023	Общий	N/a	TBD
14	Цепь проверки уменьшает галлюцинацию в моделях крупных языков	предварительный отпечаток	2023	Галлюцинации	N/a	TBD
15	Поп -викторина! Может ли большая языковая модель помочь с обратной инженерией?	предварительный отпечаток	2022	Приложения	N/a	TBD
16	Извлечение данных обучения из моделей крупных языков	Usenix Security	2021	Извлечение данных		TBD
17	Вот наступает червя ИИ: развязать червей с нулевым щелчком, которые нацелены на приложения на основе Genai	предварительный отпечаток	2024	Быстрое впрыск		TBD
18	Cliff: Контрастное обучение для улучшения верности и фактической среды в абстрактной суммировании	Emnlp	2021	Галлюцинации		TBD

Рамки и таксономии

OWASP Top 10 для приложений для крупных языковых моделей
Атлас Митра (ландшафт состязательной угрозы для систем искусственного интеллекта)
NIST AI 100-2 E2023: Совместное машинное обучение: таксономия и терминология атак и смягчений

Инструменты

Arsenal - плагин Caldera
Бдение - быстрое обнаружение инъекций

Новостные статьи, сообщения в блоге и разговоры

Опасен ли генеративный ИИ?
Состязательные примеры в эпоху Чатгпта
LLMS в безопасности: демонстрации против развертывания?
Исследователи говорят, что бесплатные программы искусственного интеллекта склонны к рискам безопасности
Почему «хороший ИИ», вероятно, является противоядием от новой эры киберпреступности ИИ
Познакомьтесь с Passgpt, ИИ, обученным миллионам просочившихся паролей