في الآونة الأخيرة، علم محرر موقع Downcodes بوقوع حادثة سرقة بيانات واسعة النطاق على منصة التواصل الاجتماعي Bluesky، والتي جذبت اهتمامًا واسع النطاق. قام دانييل فان سترين، أمين مكتبة التعلم الآلي، بجمع أكثر من مليون مشاركة عامة للمستخدم من خلال واجهة برمجة التطبيقات الخاصة بـ Bluesky وقام بتحميلها إلى شركة Hugging Face للذكاء الاصطناعي. وأثارت هذه الخطوة جدلاً لأن مستخدمي Bluesky لم يوافقوا على استخدام المحتوى الخاص بهم بهذه الطريقة، على الرغم من أن المنصة لم تحظر صراحة مثل هذا السلوك. وسلط الحادث الضوء على التناقض بين أمن البيانات على المنصات المفتوحة وحماية خصوصية المستخدم.
في الآونة الأخيرة، واجهت منصة التواصل الاجتماعي Bluesky حادثة كبيرة لسحب البيانات. قام دانييل فان سترين، أمين مكتبة التعلم الآلي، بجمع أكثر من مليون مشاركة عامة للمستخدمين من واجهة برمجة تطبيقات Bluesky وتحميل البيانات إلى شركة Hugging Face للذكاء الاصطناعي.

تحتوي مجموعة البيانات على المعرف اللامركزي للمستخدم (DID) ومجموعة من الميزات التي تسمح بالبحث عن محتوى خاص بالمستخدم. وقال فان ستيرلينغ إن الغرض الرئيسي من مجموعة البيانات هذه هو تطوير نماذج اللغة ومعالجة اللغة الطبيعية، بالإضافة إلى تحليل اتجاهات وسائل التواصل الاجتماعي والإشراف على المحتوى والبحث في أنماط النشر.
تسببت عملية تجريف البيانات في إثارة قلق واسع النطاق لأن مستخدمي Bluesky لم يوافقوا على مثل هذا الاستخدام للمحتوى الخاص بهم. على الرغم من أن النظام الأساسي لا يحظر هذا السلوك بشكل صريح، إلا أن Fire API الخاص به يوفر "تدفق بيانات عامة مجمعة ومرتبة زمنيًا" بما في ذلك المنشورات والإعجابات والمتابعات وتغييرات الحساب وغيرها من المعلومات. ولذلك، فإن محتوى Bluesky مفتوح نظريًا لمطوري الطرف الثالث.
ردًا على ذلك، قال أحد ممثلي Bluesky: "Bluesky عبارة عن شبكة اجتماعية مفتوحة وعامة، تمامًا مثل المواقع الأخرى على الإنترنت.
على الرغم من أن ملف robots.txt لا يمنع دائمًا الشركات الخارجية من الزحف إلى هذه المواقع، إلا أن الوضع مشابه. نود أن نجد طريقة لمستخدمي Bluesky للتواصل مع المنظمات/المطورين الخارجيين سواء كانوا يوافقون على استخدام بياناتهم ويتوقعون أن تحترم المنظمة الخارجية موافقة المستخدم، ونحن نناقش بنشاط كيفية تحقيق هذا الهدف. "
وتسببت هذه الحادثة في قلق المستخدمين، خاصة العديد منهم الذين تحولوا إلى Bluesky بسبب سياسة تدريب الذكاء الاصطناعي الجديدة للمنصة المنافسة X. والجدير بالذكر أن فان سترين قام بإزالة مجموعة البيانات من Hugging Face بعد وقت قصير من نشر التقرير.

وقال على Bluesky: "لقد قمت بإزالة بيانات Bluesky من هذا المستودع. بينما أرغب في دعم تطوير الأدوات للمنصة، أدرك أن هذه الممارسة تنتهك مبادئ الشفافية والموافقة في جمع البيانات. أنا نادم بشدة على ذلك. آسف. "
أثار هذا الحادث مناقشات حول حقوق استخدام بيانات النظام الأساسي المفتوح وحماية خصوصية المستخدم. كما ذكرت Bluesky أنها تبحث بنشاط عن حلول لتحقيق توازن أفضل بين العلاقة بين الانفتاح وأمن بيانات المستخدم. ولهذا أيضًا أهمية مرجعية للمنصات المفتوحة الأخرى، والتي تتطلب جهودًا مشتركة على المستوى الفني ومستوى السياسات لحماية حقوق ومصالح المستخدمين بشكل أفضل.