تنزيل PromptWares - تنزيل رمز PromptWares

PromptWares

شفرة المصدر الأخرى

1.0.0

تنزيل

يمكن أن يسبب نموذج Genai في Jailbroken ضررًا حقيقيًا: التطبيقات التي تعمل بالطاقة Genai عرضة للرسائل الوعائية

ستاف كوهين ، رون بيتون ، بن ناسي
Technion - معهد إسرائيل للتكنولوجيا ، كورنيل تك ، Intuit

الموقع | فيديو يوتيوب | ورقة arxiv

شعار

محتويات

ملخص
خلاصة
ثَبَّتَ
تشغيل الرمز
- برائحة ؟؟
- تهديد مقدمة متقدم؟
اقتباس

ملخص

يهدف هذا البحث إلى تغيير التصور المتعلق بكسر الحماية و:

إثبات أن نموذج Genai المكسور يمكن أن يسبب ضررًا حقيقيًا للتطبيقات التي تعمل بالطاقة Genai وتشجيع مناقشة بشأن الحاجة إلى منع محاولات كسر الحماية.
الكشف عن البرامج المفاجئة ، تهديد جديد للتطبيقات التي تعمل بالطاقة Genai والتي يمكن تطبيقها عن طريق كسر النموذج Genai.
رفع الوعي فيما يتعلق بحقيقة أن الخطة والتنفيذ هي معرضة للغاية للمرضات.

خلاصة

في هذه الورقة ، نقول أنه على الرغم من أن نموذج Genai المكسور لا يشكل تهديدًا حقيقيًا للمستخدمين النهائيين في الذكاء الاصطناعي للمحادثة ، إلا أنه يمكن أن يسبب ضررًا حقيقيًا للتطبيقات التي تعمل بالجنراي وتسهيل نوعًا جديدًا من الهجوم الذي نسميه موجهًا.

يستغل Promplarware مدخلات المستخدم إلى Jailbreak نموذج GENAI لإجبار/تشكيل النشاط الضار في سياق تطبيق GENAI. أولاً ، نقدم تنفيذًا ساذجًا للبرامج السريعة التي تتصرف كبرامج ضارة تستهدف التخطيط وتنفيذ البنية (المعروفة أيضًا باسم ، رد الفعل ، استدعاء الوظيفة). نوضح أن المهاجمين يمكن أن يفرضوا تدفق التنفيذ المطلوب من خلال إنشاء مدخلات المستخدم التي تنتج المخرجات المطلوبة بالنظر إلى أن منطق التطبيق الذي يعمل به Genai معروف للمهاجمين. نوضح تطبيق هجوم DOS الذي يؤدي إلى تنفيذ مساعد يعمل بنظام Genai لدخول حلقة لا حصر لها تضيع الأموال والموارد الحسابية على مكالمات API الزائدة إلى محرك Genai ، ومنع التطبيق من تقديم الخدمة للمستخدم.

بعد ذلك ، نقدم تنفيذًا أكثر تطوراً لـ Predarware الذي نسميه تهديدًا متقدمًا للمؤثرات (APWT) يستهدف التطبيقات التي تعمل بنظام Genai والتي من غير المعروفة للمهاجمين. نوضح أن المهاجمين يمكنهم إنشاء مدخلات المستخدم التي تستغل إمكانات AI المتقدمة لمحرك Genai لإطلاق سلسلة قتل في وقت استنتاج تتكون من ست خطوات تهدف إلى تصعيد الامتيازات ، وتحليل سياق التطبيق ، وتحديد الأصول القيمة ، والسبب في أنشطة ضارة ممكنة ، وتنفيذها ، وتنفيذها. نوضح تطبيق APWT ضد chatbot للتجارة الإلكترونية التي تعمل بنظام Genai ونظهر أنها يمكن أن تؤدي إلى تعديل جداول SQL ، مما قد يؤدي إلى خصومات غير مصرح بها على العناصر المباعة للمستخدم

ثَبَّتَ

استنساخ هذا المستودع وانتقل إلى مجلد الحقن متعدد الوسائط

git clone https://github.com/StavC/PromptWares.git
cd ComPromptMized

احصل على مفاتيح API للوصول إلى Openai و Google Services
قم بتثبيت الحزم المطلوبة باستخدام الأمر التالي:

pip install -r requirements.txt

تشغيل الرمز

تم تحويل ملف رمزان التاليان إلى تنسيق Jupyter لتحسين قابلية القراءة وتبسيط الاختبار والتجريب. بالإضافة إلى ذلك ، قمنا بتضمين المزيد من الوثائق والتعليقات داخلها.

في الكود الخاص بنا ، نستفيد من بنية rewoo لتنفيذ خطة وتنفيذ نظام عبر Langchain ونضع رمزنا على الكود العلني من مستودع Langchain ، يمكنك العثور على مزيد من التفاصيل حول الخطة وتنفيذ البنية في مدونة Langchain.

Promdware

تعتبر البرامج المقدمة مدخلات المستخدم التي تهدف إلى إثارة نشاط ضار ضمن تطبيق مدعوم من GENAI عن طريق كسر محرك Genai وتغيير تدفق تنفيذ التطبيق.

لذلك ، تعتبر البرامج الضارة على البرامج الضارة بنقرة صفرية ولا تتطلب من المهاجم تسوية التطبيق المستهدف الذي يعمل به Genai في وقت مبكر.

في ظل APT-DOS ، ستجد الكود الذي يبني مساعدًا بسيطًا يعمل بالجنراي والذي يعرض هجوم DOS. يوضح الرقم الأيسر أدناه آلة الحالة المحدودة للخطة التي يتم تنفيذها بواسطة المساعد الذي يعمل به Genai استجابةً للبريد الإلكتروني ، بجوار الرقم الصحيح الذي يوضح مخطط DOS الذي ينفذه المهاجم.

للقيام بذلك ، قمنا بتنفيذ الأدوات التالية:

 findAvailableDateAndTime ( email ) # Find available date and time for a meeting 
EmailReply ( email ) # Creates a reply to an email
EmailChecker ( email ) # Check if the email is safe to send
MakeEmailSafe ( email ) # Make the email safe to send if it is not
EmailSender ( email ) # Send the email

يمكنك العثور على تنفيذ هذه الأدوات في دفتر APT-DOS وتوسيعها أو تعديلها لتضمين المزيد من الأدوات والوظائف.

مخطط DOS	آلة الحالة المحدودة للخطة

التهديد المتقدم-التهديد

يعد التهديد المتقدم المتقدم (APWT) أكثر تطوراً للتطبيق السريع الذي يستهدف التطبيقات التي تعمل بالطاقة GENAI والتي لا يوجد منطق للمهاجمين.

على عكس التنفيذ الساذج لـ Properware ، يستغل APWT قدرات الذكاء الاصطناعى المتقدم لمحرك Genai لإجراء نشاط ضار يتم تحديد نتائجه في وقت الاستدلال من قبل محرك Genai (وليس معروفًا للمهاجمين مقدمًا).

بموجب APWT-ECONMMERCE ، ستجد الكود الذي يبني مساعدًا بسيطًا للتجارة الإلكترونية التي تعمل بالجنراي والتي يتم توصيلها بقاعدة بيانات SQL وتتفاعل مع مستخدم نهائي عبر الدردشة. في هذا المثال ، قمنا بتنفيذ 3 أدوات تستخدمها مساعد التجارة الإلكترونية التي يعمل بها Genai:

 CreateSQLQueries ( text ) # Create SQL queries from the user input 
DoAction ( SQL ) # Execute the SQL queries
ReturnAnswer ( text ) # Return the answer to the user based on the SQL queries results and the user input

نوضح كيف يمكن للمستخدم الضار إنشاء APWT يتكون من 6 خطوات عامة تنشئ سلسلة قتل تسبب ضررًا لمساعد التجارة الإلكترونية وقاعدة بيانات SQL. نظرًا لأن النتيجة التي يتم إنشاؤها APWT يتم تحديدها في وقت الاستدلال بواسطة محرك Genai ، تتنوع نتائج الهجوم ، وهنا بعض الأمثلة على النتائج المحتملة التي واجهناها خلال تجاربنا:

تعديل الرصيد - يمكن للمهاجم تعديل توازن المستخدم في قاعدة بيانات SQL.
تعديل الخصم - يمكن للمهاجم تعديل خصم العناصر المحددة في قاعدة بيانات SQL.
تسرب البيانات - يمكن للمهاجم تسرب المعلومات من قاعدة بيانات SQL.
حذف المستخدم - يمكن للمهاجم حذف المستخدم من قاعدة بيانات SQL.

أنت مرحب بك أكثر من ترحيب لتجربة مفهوم APWT على المزيد من التطبيقات التي تعمل بنظام Genai مع مختلف الأدوات والوظائف وطرق كسر الحماية. لقد اعتمدنا طريقة كسر الحماية على الكود المتاح للجمهور من ZORG-Jailbreak-Prompt-Text Repo

مخطط التهديد السريع المستقل

التعليمات

س: لماذا لا يُنظر إلى الحماية على أنه تهديد أمني حقيقي في سياق الذكاء الاصطناعي للمحادثة؟

ج: لأنه في منظمة العفو الدولية للمحادثة حيث يناقش المستخدم مع chatbot ، لا توجد فائدة واضحة في كسر الحماية من الدردشة: لماذا يريد المستخدمون أن يهينهم chatbot؟ يمكن أيضًا العثور على أي معلومات مقدمة من chatbot jailbroken على الويب (أو الويب المظلم). لذلك ، لا يعتبر خبراء الأمن تهديدًا حقيقيًا للأمن

س: لماذا ينبغي إدراك الحماية من التهديد الأمني الحقيقي في سياق التطبيقات التي تعمل بالمواد الجيلية؟

ج: لأن مخرجات محرك Genai تستخدم لتحديد تدفق التطبيقات التي تعمل بالطاقة Genai. لذلك ، يمكن أن يغير نموذج Genai من Jailbroken تدفق تنفيذ التطبيق ويؤدي إلى نشاط ضار.

اقتباس

TBA

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-03-09
الحجم 474.7KB
من Github

تطبيقات ذات صلة

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل