تحقق شركة Amazon Web Services (AWS) في شركة Perplexity AI الناشئة للبحث في مجال الذكاء الاصطناعي بدعوى انتهاك شروط خدمة AWS عن طريق حذف محتوى موقع الويب في محاولة لمنعها من القيام بذلك. تبلغ قيمة شركة Perplexity AI 3 مليارات دولار أمريكي، وتدعمها مؤسسة عائلة جيف بيزوس وشركة Nvidia. أثار التحقيق قلقًا واسع النطاق بشأن الطريقة التي تحصل بها شركات الذكاء الاصطناعي على البيانات، بما في ذلك النزاعات حول اتفاقيات استبعاد الروبوتات، وقضايا حقوق النشر ودور مقدمي خدمات الطرف الثالث. سيكون للتطور اللاحق للحادث تأثير عميق على لوائح الحصول على البيانات وأخلاقيات صناعة الذكاء الاصطناعي.
تحقق شركة Amazon Web Services (AWS) في شركة Perplexity AI الناشئة للبحث في مجال الذكاء الاصطناعي بدعوى انتهاك شروط خدمة AWS عن طريق استخراج المحتوى من مواقع الويب التي حاولت منعها من القيام بذلك، وفقًا لتقارير Wired.
بلغت قيمة شركة Perplexity AI، وهي شركة ناشئة تدعمها مؤسسة عائلة جيف بيزوس وشركة Nvidia، 3 مليارات دولار مؤخرًا. وجدت Wired أن الشركة يبدو أنها تعتمد على استخراج المحتوى من مواقع الويب المحظورة من خلال اتفاقية استبعاد الروبوتات. بروتوكول استبعاد الروبوتات هو معيار ويب يشير إلى الصفحات التي لا ينبغي الوصول إليها بواسطة الروبوتات وبرامج الزحف الآلية. على الرغم من أن الاتفاقية ليست ملزمة قانونًا، إلا أن معظم الشركات التزمت بها تقليديًا.

وقال متحدث باسم AWS إن شروط الخدمة الخاصة بالشركة تحظر على العملاء استخدام خدماتها للقيام بأي أنشطة غير قانونية، ويتحمل العملاء مسؤولية الالتزام بالشروط وجميع القوانين المعمول بها. يجب على عملاء AWS الالتزام بمعيار robots.txt عند الزحف إلى مواقع الويب.
وجد التحقيق أن شركة Perplexity تمكنت من الوصول إلى خادم باستخدام عنوان IP لم يتم الكشف عنه والذي تمكن من الوصول إلى العقارات المملوكة لشركة Condé Nast مئات المرات على الأقل خلال الأشهر الثلاثة الماضية، وذلك على ما يبدو لاستخراج محتوى محظور. وقال متحدثون باسم صحيفة الغارديان وفوربس ونيويورك تايمز إنه تم اكتشاف حالات مماثلة.
وقال أرافيند سرينيفاس، الرئيس التنفيذي لشركة Perplexity، إن عملية الاستخلاص التي تم اكتشافها تم تنفيذها من قبل شركة خارجية تقدم خدمات استخلاص الويب وفهرستها، لكنه رفض ذكر اسم الشركة. قالت المتحدثة باسم Perplexity، سارة بلاتنيك، إن الشركة استجابت لاستفسار أمازون وقالت إن PerplexityBot الخاص بها يحترم ملف robots.txt ولكنه يتجاهل البروتوكول عندما يقوم المستخدمون بإدخال عنوان URL محدد.
ويعتقد جيسون كينت، الرئيس التنفيذي لشركة Digital Content Next، وهي رابطة تجارة صناعة المحتوى الرقمي، أنه إذا كانت الادعاءات ضد Perplexity صحيحة، فإن الشركة قد انتهكت عددًا من المبادئ لمنع الانتهاكات المحتملة لحقوق الطبع والنشر. وشدد على أنه بشكل افتراضي، لا ينبغي لشركات الذكاء الاصطناعي الوصول إلى محتوى الناشرين واستخدامه دون إذن.
حاليًا، أثار هذا الحادث اهتمامًا ونقاشًا واسع النطاق حول الطريقة التي تحصل بها شركات الذكاء الاصطناعي على البيانات. تتطلع الصناعة إلى إصدار نتائج تحقيق AWS والإجراءات الإضافية المحتملة ضد Perplexity.
تسلط حادثة Perplexity AI الضوء على التحديات والمعضلات الأخلاقية التي تواجهها شركات الذكاء الاصطناعي في الحصول على البيانات، كما تحذر صناعة الذكاء الاصطناعي من أنها بحاجة إلى إنشاء مواصفات بيانات وآليات إدارة أكثر اكتمالًا لضمان شرعية وامتثال عملية الحصول على البيانات وتعزيزها. الذكاء الاصطناعي التطور الصحي للتكنولوجيا.