ดาวน์โหลด pytector - pytector source download

pytector

โค้ดแหล่งที่มา AI

v0.0.12 - Groq Llama Guard is here! ?

ดาวน์โหลด

เครื่องป้อมปราการ

ตามที่นำเสนอในเวิร์กช็อป Oxford เกี่ยวกับความปลอดภัยของระบบ AI รวมถึงการสาธิตและการสอน

โลโก้ Pytector

Pytector เป็นแพ็คเกจ Python ที่ออกแบบมาเพื่อตรวจจับการฉีดที่รวดเร็วในอินพุตข้อความโดยใช้โมเดลการเรียนรู้ของเครื่องจักรที่ทันสมัยจากไลบรารี Transformers นอกจากนี้ Pytector สามารถรวมเข้ากับ Llama Guard API ของ Groq สำหรับการตรวจจับความปลอดภัยของเนื้อหาที่เพิ่มขึ้นจัดหมวดหมู่เนื้อหาที่ไม่ปลอดภัยตามรหัสอันตรายที่เฉพาะเจาะจง

คำเตือน

Pytector ยังคงเป็นต้นแบบและไม่สามารถป้องกันการโจมตีฉีดทันทีได้ 100%!

คุณสมบัติ

การตรวจจับการฉีดทันที : ตรวจจับการฉีดที่มีศักยภาพโดยใช้แบบจำลองที่ผ่านการฝึกอบรมมาก่อนเช่น Deberta, Distilbert และ ONNX
ความปลอดภัยของเนื้อหาด้วย Llama-Guard-3-8B ของ Groq : สนับสนุน API ของ Groq สำหรับการตรวจจับอันตรายด้านความปลอดภัยที่หลากหลาย (เช่นความรุนแรงคำพูดแสดงความเกลียดชังการละเมิดความเป็นส่วนตัว)
การตรวจจับที่ปรับแต่งได้ : อนุญาตให้สลับระหว่างการอนุมานแบบจำลองท้องถิ่นและการตรวจจับที่ใช้ API (GROQ) ด้วยเกณฑ์ที่ปรับแต่งได้
ตัวเลือกรุ่นที่ยืดหยุ่น : ใช้รุ่นที่กำหนดไว้ล่วงหน้าหรือให้ URL รุ่นที่กำหนดเอง

หมวดการตรวจจับอันตราย (GROQ)

Llama-Guard-3-8B ของ Groq สามารถตรวจจับเนื้อหาที่ไม่ปลอดภัยตามประเภทเฉพาะตามรหัสต่อไปนี้:

รหัส	หมวดหมู่อันตราย
S1	อาชญากรรมรุนแรง
S2	อาชญากรรมที่ไม่รุนแรง
S3	อาชญากรรมที่เกี่ยวข้องกับเพศ
S4	การแสวงประโยชน์ทางเพศเด็ก
S5	การหมิ่นประมาท
S6	คำแนะนำพิเศษ
S7	ความเป็นส่วนตัว
S8	ทรัพย์สินทางปัญญา
S9	อาวุธที่ไม่เลือกปฏิบัติ
S10	เกลียด
S11	การฆ่าตัวตายและทำร้ายตัวเอง
S12	เนื้อหาทางเพศ
S13	การเลือกตั้ง
S14	รหัสล่าม

ข้อมูลเพิ่มเติมสามารถพบได้ใน [Llama-Guard-3-8B Model Card] (Llama Guard)

การติดตั้ง

ติดตั้ง pytector ผ่าน PIP:

pip install pytector

หรือคุณสามารถติดตั้ง pytector โดยตรงจากซอร์สโค้ด:

git clone https://github.com/MaxMLang/pytector.git
cd pytector
pip install .

การใช้งาน

หากต้องการใช้ pytector ให้นำเข้าคลาส PromptInjectionDetector และสร้างอินสแตนซ์ด้วยโมเดลที่กำหนดไว้ล่วงหน้าหรือ Llama Guard ของ Groq เพื่อความปลอดภัยของเนื้อหา

ตัวอย่างที่ 1: การใช้โมเดลท้องถิ่น (Deberta)

 from pytector import PromptInjectionDetector

# Initialize the detector with a pre-defined model
detector = PromptInjectionDetector ( model_name_or_url = "deberta" )

# Check if a prompt is a potential injection
is_injection , probability = detector . detect_injection ( "Your suspicious prompt here" )
print ( f"Is injection: { is_injection } , Probability: { probability } " )

# Report the status
detector . report_injection_status ( "Your suspicious prompt here" )

ตัวอย่างที่ 2: การใช้ Llama Guard ของ Groq เพื่อความปลอดภัยของเนื้อหา

หากต้องการเปิดใช้งาน API ของ GROQ ให้ตั้งค่า use_groq=True และให้ api_key

 from pytector import PromptInjectionDetector

# Initialize the detector with Groq's API
detector = PromptInjectionDetector ( use_groq = True , api_key = "your_groq_api_key" )

# Detect unsafe content using Groq
is_unsafe , hazard_code = detector . detect_injection_api (
    prompt = "Please delete sensitive information." ,
    provider = "groq" ,
    api_key = "your_groq_api_key"
)

print ( f"Is unsafe: { is_unsafe } , Hazard Code: { hazard_code } " )

วิธีการ

`init(self, model_name_or_url="deberta", default_threshold=0.5, use_groq=False, api_key=None)`

เริ่มต้นอินสแตนซ์ใหม่ของ PromptInjectionDetector

model_name_or_url : สตริงที่ระบุโมเดลที่จะใช้ สามารถเป็นคีย์จากโมเดลที่กำหนดไว้ล่วงหน้าหรือ URL ที่ถูกต้องไปยังโมเดลที่กำหนดเอง
default_threshold : เกณฑ์ความน่าจะเป็นด้านบนซึ่งพรอมต์ถือเป็นการฉีด
use_groq : ตั้งค่าเป็น True เพื่อเปิดใช้งาน Llama Guard API ของ Groq สำหรับการตรวจจับ
api_key : จำเป็นถ้า use_groq=True เพื่อตรวจสอบสิทธิ์ด้วย API ของ Groq