Téléchargement LLM security and privacy - Téléchargement du code source LLM security and privacy

LLM security and privacy

Autre code source

1.0.0

Télécharger

Sécurité et confidentialité LLM

Une liste organisée de papiers et d'outils couvrant les menaces et les vulnérabilités LLM, à la fois du point de vue de la sécurité et de la confidentialité. Des résumés, des points clés à retenir et des détails supplémentaires pour chaque article se trouvent dans le dossier papier-en été.

Le fichier main.bib contient les dernières citations des articles répertoriés ici.

Une taxonomie de la sécurité et des menaces de confidentialité contre les modèles d'apprentissage en profondeur et les LLM consécutivement Présentation Figure: Une taxonomie des menaces actuelles de sécurité et de confidentialité contre les modèles d'apprentissage en profondeur et les modèles de langage consécutivement grands (LLM).

Table des matières

Sécurité et confidentialité LLM
- Table des matières
- Papiers
- Cadres et taxonomies
- Outils
- Articles de presse, articles de blog et conférences
- Contributif
- Contact

Papiers

Non.	Titre de papier	Lieu	Année	Catégorie	Code	Résumé
1 et 1	InjectAgent: analyse comparative d'injections rapide indirectes dans les agents de modèle de grande langue intégrés à l'outil	pré-imprimer	2024	Injection rapide	N / A	TBD
2	Les agents LLM peuvent pirater de manière autonome les sites Web	pré-imprimer	2024	Applications	N / A	TBD
3 et 3	Un aperçu des risques de l'IA catastrophique	pré-imprimer	2023	Général	N / A	TBD
4	Utilisation des LLM à des fins illicites: menaces, mesures de prévention et vulnérabilités	pré-imprimer	2023	Général	N / A	TBD
5	Censure LLM: un défi d'apprentissage automatique ou un problème de sécurité informatique?	pré-imprimer	2023	Général	N / A	TBD
6.	Au-delà des garanties: explorer les risques de sécurité de Chatgpt	pré-imprimer	2023	Général	N / A	TBD
7	Attaque d'injection rapide contre les applications intégrées à LLM	pré-imprimer	2023	Injection rapide	N / A	TBD
8	Identifier et atténuer les risques de sécurité de l'IA générative	pré-imprimer	2023	Général	N / A	TBD
9.	Passgpt: modélisation de mot de passe et génération (guidée) avec de grands modèles de langue	Ésoric	2023	Applications		TBD
10	Exploitation du GPT-4 pour la génération de politiques de cybersécurité GRC: Focus sur l'atténuation des attaques des ransomwares	Ordinateurs et sécurité	2023	Applications	N / A	TBD
11	Pas ce pour quoi vous vous êtes inscrit: compromettre les applications réelles intégrées au monde LLM avec injection rapide indirecte	pré-imprimer	2023	Injection rapide		TBD
12	Examiner la réparation de vulnérabilité zéro avec de grands modèles de langue	IEEE S&P	2023	Applications	N / A	TBD
13	Sécurité de la plate-forme LLM: appliquant un cadre d'évaluation systématique aux plugins ChatGPT d'OpenAI	pré-imprimer	2023	Général	N / A	TBD
14	La chaîne de vérification réduit les hallucinations dans les modèles de grande langue	pré-imprimer	2023	Hallucinations	N / A	TBD
15	Quiz pop! Un modèle grand langage peut-il aider à l'ingénierie inverse?	pré-imprimer	2022	Applications	N / A	TBD
16	Extraction des données de formation à partir de modèles de gros langues	Sécurité Usenix	2021	Extraction de données		TBD
17	Voici le ver de l'IA: libérer des vers zéro cliquez sur les applications alimentées par Genai	pré-imprimer	2024	Injection rapide		TBD
18	Cliff: apprentissage contrastif pour améliorer la fidélité et la factualité dans le résumé abstractif	EMNLP	2021	Hallucinations		TBD

Cadres et taxonomies

OWASP Top 10 pour les applications de modèle de grande langue
MITER ATLAS (paysage des menaces contradictoires pour les systèmes d'intelligence artificielle)
NIST AI 100-2 E2023: Apprentissage automatique contradictoire: taxonomie et terminologie des attaques et des atténuations

Outils

Arsenal - Plugin Caldera
Vigil - Détection d'injection rapide

Articles de presse, articles de blog et conférences

L'IA générative est-elle dangereuse?
Exemples contradictoires à l'ère de Chatgpt
LLMS dans la sécurité: démos vs déploiement?
Programmes d'IA gratuits sujets aux risques de sécurité, disent les chercheurs
Pourquoi la «bonne IA» est probablement l'antidote de la nouvelle ère de l'IA Cybercrime
Rencontrez Passgpt, l'IA s'est formée sur des millions de mots de passe divulgués