LLM security and privacy
1.0.0
รายการเอกสารและเครื่องมือที่รวบรวมไว้ซึ่งครอบคลุมถึงภัยคุกคามและช่องโหว่ LLM ทั้งจากมุมมองด้านความปลอดภัยและความเป็นส่วนตัว สรุปจุดซื้อกลับบ้านที่สำคัญและรายละเอียดเพิ่มเติมสำหรับกระดาษแต่ละชิ้นจะพบได้ในโฟลเดอร์ Paper-Summaries
ไฟล์ main.bib มีการอ้างอิงล่าสุดของเอกสารที่ระบุไว้ที่นี่
ภาพรวมรูป: อนุกรมวิธานของความปลอดภัยในปัจจุบันและภัยคุกคามความเป็นส่วนตัวกับรูปแบบการเรียนรู้ลึกและแบบจำลองภาษาขนาดใหญ่ติดต่อกันอย่างต่อเนื่อง (LLMs)
| เลขที่ | ชื่อกระดาษ | สถานที่จัดงาน | ปี | หมวดหมู่ | รหัส | สรุป |
|---|---|---|---|---|---|---|
| 1. | insjectagent: การเปรียบเทียบการฉีดโดยอ้อมโดยทางอ้อมในตัวแทนแบบจำลองภาษาขนาดใหญ่ที่รวมเข้าด้วยเครื่องมือ | พิมพ์ล่วงหน้า | 2024 | ฉีดทันที | N/A | TBD |
| 2. | ตัวแทน LLM สามารถแฮ็คเว็บไซต์อัตโนมัติ | พิมพ์ล่วงหน้า | 2024 | แอปพลิเคชัน | N/A | TBD |
| 3. | ภาพรวมของความเสี่ยง AI หายนะ | พิมพ์ล่วงหน้า | 2023 | ทั่วไป | N/A | TBD |
| 4. | การใช้ LLM เพื่อวัตถุประสงค์ที่ผิดกฎหมาย: ภัยคุกคามมาตรการป้องกันและช่องโหว่ | พิมพ์ล่วงหน้า | 2023 | ทั่วไป | N/A | TBD |
| 5. | LLM Censorship: ความท้าทายในการเรียนรู้ของเครื่องหรือปัญหาความปลอดภัยของคอมพิวเตอร์? | พิมพ์ล่วงหน้า | 2023 | ทั่วไป | N/A | TBD |
| 6. | นอกเหนือจากการป้องกัน: สำรวจความเสี่ยงด้านความปลอดภัยของ CHATGPT | พิมพ์ล่วงหน้า | 2023 | ทั่วไป | N/A | TBD |
| 7. | การโจมตีอย่างรวดเร็วจากแอพพลิเคชั่น LLM ที่รวมเข้าด้วยกัน | พิมพ์ล่วงหน้า | 2023 | ฉีดทันที | N/A | TBD |
| 8. | การระบุและบรรเทาความเสี่ยงด้านความปลอดภัยของ AI Generative | พิมพ์ล่วงหน้า | 2023 | ทั่วไป | N/A | TBD |
| 9. | PassGPT: การสร้างแบบจำลองรหัสผ่านและการสร้าง (ไกด์) ที่มีรูปแบบภาษาขนาดใหญ่ | การกวาดล้าง | 2023 | แอปพลิเคชัน | TBD | |
| 10. | การควบคุม GPT-4 สำหรับการสร้างนโยบายความปลอดภัยทางไซเบอร์ GRC: มุ่งเน้นไปที่การลดการโจมตี ransomware | คอมพิวเตอร์และความปลอดภัย | 2023 | แอปพลิเคชัน | N/A | TBD |
| 11. | ไม่ใช่สิ่งที่คุณสมัครใช้งาน: ประนีประนอมแอพพลิเคชั่น LLM ในโลกแห่งความเป็นจริงด้วยการฉีดทันทีทางอ้อม | พิมพ์ล่วงหน้า | 2023 | ฉีดทันที | TBD | |
| 12. | การตรวจสอบการซ่อมแซมช่องโหว่แบบไม่มีการยิงด้วยรูปแบบภาษาขนาดใหญ่ | IEEE S&P | 2023 | แอปพลิเคชัน | N/A | TBD |
| 13. | ความปลอดภัยแพลตฟอร์ม LLM: การใช้เฟรมเวิร์กการประเมินอย่างเป็นระบบกับปลั๊กอิน Chatgpt ของ OpenAI | พิมพ์ล่วงหน้า | 2023 | ทั่วไป | N/A | TBD |
| 14. | โซ่แห่งการตรวจสอบช่วยลดภาพหลอนในรูปแบบภาษาขนาดใหญ่ | พิมพ์ล่วงหน้า | 2023 | ภาพหลอน | N/A | TBD |
| 15. | แบบทดสอบป๊อป! รูปแบบภาษาขนาดใหญ่สามารถช่วยวิศวกรรมย้อนกลับได้หรือไม่? | พิมพ์ล่วงหน้า | 2022 | แอปพลิเคชัน | N/A | TBD |
| 16. | การแยกข้อมูลการฝึกอบรมจากแบบจำลองภาษาขนาดใหญ่ | ความปลอดภัยของ USENIX | 2021 | การสกัดข้อมูล | TBD | |
| 17. | AI Worm มาที่นี่: ปลดปล่อยเวิร์มที่ไม่มีการคลิกเป็นศูนย์ซึ่งกำหนดเป้าหมายแอปพลิเคชัน Genai-Powered | พิมพ์ล่วงหน้า | 2024 | การฉีดทันที | TBD | |
| 18. | หน้าผา: การเรียนรู้ที่แตกต่างกันเพื่อปรับปรุงความซื่อสัตย์และความเป็นจริงในการสรุปนามธรรม | emnlp | 2021 | ภาพหลอน | TBD |
หากคุณสนใจที่จะมีส่วนร่วมในที่เก็บข้อมูลนี้โปรดดูที่ MD สำหรับรายละเอียดเกี่ยวกับแนวทาง
รายชื่อผู้สนับสนุนปัจจุบันพบได้ที่นี่
สำหรับคำถามใด ๆ เกี่ยวกับที่เก็บข้อมูลและ/หรือความร่วมมือที่อาจเกิดขึ้น (การวิจัย) โปรดติดต่อ Briland Hitaj