LLM security and privacy
1.0.0
보안 및 개인 정보 보호 관점에서 LLM 위협 및 취약점을 다루는 용지 및 도구 목록. 요약, 주요 테이크 아웃 포인트 및 각 논문에 대한 추가 세부 사항은 종이 수사리 폴더에 있습니다.
main.bib 파일에는 여기에 나열된 논문의 최신 인용이 포함되어 있습니다.
개요 그림 : 딥 러닝 모델 및 연속적으로 큰 언어 모델 (LLM)에 대한 현재 보안 및 개인 정보 보호 위협의 분류.
| 아니요. | 종이 제목 | 장소 | 년도 | 범주 | 암호 | 요약 |
|---|---|---|---|---|---|---|
| 1. | Injectagent : 도구 통합 대형 언어 모델 에이전트에서 간접 신속한 주입 벤치마킹 | 사전 인쇄 | 2024 | 신속한 주입 | N/A | TBD |
| 2. | LLM 에이전트는 자율적으로 웹 사이트를 해킹 할 수 있습니다 | 사전 인쇄 | 2024 | 응용 프로그램 | N/A | TBD |
| 3. | 치명적인 AI 위험에 대한 개요 | 사전 인쇄 | 2023 | 일반적인 | N/A | TBD |
| 4. | 불법 목적으로 LLM 사용 : 위협, 예방 조치 및 취약점 | 사전 인쇄 | 2023 | 일반적인 | N/A | TBD |
| 5. | LLM 검열 : 기계 학습 과제 또는 컴퓨터 보안 문제? | 사전 인쇄 | 2023 | 일반적인 | N/A | TBD |
| 6. | 보호 조치 너머 : Chatgpt의 보안 위험 탐색 | 사전 인쇄 | 2023 | 일반적인 | N/A | TBD |
| 7. | LLM- 통합 응용 분야에 대한 신속한 주입 공격 | 사전 인쇄 | 2023 | 신속한 주입 | N/A | TBD |
| 8. | 생성 AI의 보안 위험 식별 및 완화 | 사전 인쇄 | 2023 | 일반적인 | N/A | TBD |
| 9. | PassGpt : 대형 언어 모델로 비밀번호 모델링 및 (안내) 생성 | Esorics | 2023 | 응용 프로그램 | TBD | |
| 10. | 사이버 보안 생성 GRC 정책을위한 GPT-4 활용 : 랜섬웨어 공격 완화에 중점 | 컴퓨터 및 보안 | 2023 | 응용 프로그램 | N/A | TBD |
| 11. | 가입 한 내용 : 간접적 인 신속한 주입으로 실제 LLM 통합 응용 프로그램을 손상시킵니다. | 사전 인쇄 | 2023 | 신속한 주입 | TBD | |
| 12. | 큰 언어 모델로 제로 샷 취약성 수리를 검사합니다 | IEEE S & P | 2023 | 응용 프로그램 | N/A | TBD |
| 13. | LLM 플랫폼 보안 : OpenAI의 ChatGpt 플러그인에 체계적인 평가 프레임 워크 적용 | 사전 인쇄 | 2023 | 일반적인 | N/A | TBD |
| 14. | 검증 체인은 큰 언어 모델에서 환각을 줄입니다 | 사전 인쇄 | 2023 | 환각 | N/A | TBD |
| 15. | 팝 퀴즈! 대형 언어 모델이 리버스 엔지니어링에 도움이 될 수 있습니까? | 사전 인쇄 | 2022 | 응용 프로그램 | N/A | TBD |
| 16. | 대형 언어 모델에서 교육 데이터 추출 | Usenix 보안 | 2021 | 데이터 추출 | TBD | |
| 17. | 여기에 AI Worm이 온다 : Genai 기반 응용 프로그램을 대상으로 한 클릭 웜을 제로 클릭하는 벌레 | 사전 인쇄 | 2024 | 프롬프트 주입 | TBD | |
| 18. | Cliff : 추상적 요약에서 신실함과 사실을 향상시키기위한 대조적 학습 | emnlp | 2021 | 환각 | TBD |
이 저장소에 기여하는 데 관심이 있으시면 가이드 라인에 대한 자세한 내용은 Contributing.md를 참조하십시오.
현재 기고자 목록이 여기에 있습니다.
이 저장소 및/또는 잠재력 (연구) 협업에 관한 질문은 Briland Hitaj에 문의하십시오.