أصدرت جامعة برينستون أول وكيل SWE-agent لمبرمج الذكاء الاصطناعي مفتوح المصدر في العالم، والذي يعتمد على تقنية GPT-4 ويمكنه إصلاح الأخطاء تلقائيًا في مستودعات GitHub. كان أداء SWE-agent جيدًا في مجموعة اختبار SWE-bench، حيث نجح في حل 12.29% من المشكلات، واستغرق متوسطه 93 ثانية فقط، وتمتع بدقة مماثلة لمبرمجي الذكاء الاصطناعي الحاليين. وقد سمحت لها طبيعتها مفتوحة المصدر بجذب الكثير من الاهتمام بسرعة، مما يدل على الإمكانات الهائلة للذكاء الاصطناعي في مجال هندسة البرمجيات. سوف تتعمق هذه المقالة في مبدأ العمل والأداء وتأثير وكيل SWE على هندسة البرمجيات المستقبلية.
أطلقت جامعة برينستون مؤخرًا مبرمجًا للذكاء الاصطناعي يسمى SWE-agent، وهو أول مبرمج ذكاء اصطناعي مفتوح المصدر في العالم يعتمد على تقنية GPT-4 ويمكنه إصلاح الأخطاء تلقائيًا في مستودعات GitHub. تمثل ولادة واجهة الكمبيوتر والوكيل هذه خطوة مهمة في تطبيق الذكاء الاصطناعي في مجال هندسة البرمجيات. كان أداء SWE-agent في مجموعة اختبار SWE-bench مثيرًا للإعجاب، فقد نجح في حل 12.29% من المشكلات، واستغرق دقته 93 ثانية فقط في المتوسط، وكانت دقته قابلة للمقارنة مع مبرمج الذكاء الاصطناعي Devin الذي تم إطلاقه مسبقًا. تعني طبيعة المصدر المفتوح لـ SWE-agent أنها اكتسبت بسرعة 1.6 ألف نجم و109 شوكات على GitHub، مما يدل على التقدير الكبير والاهتمام من مجتمع المصادر المفتوحة بهذه التكنولوجيا. يعمل وكيل SWE من خلال التفاعل مع محطة متخصصة يمكنها فتح الملفات وتمريرها والبحث فيها وتحرير سطور معينة وإجراء عمليات فحص بناء الجملة تلقائيًا وكتابة الاختبارات وتنفيذها. يشبه هذا التصميم واجهة المستخدم المصممة للبشر، مما يمنع الأخطاء ويقدم الملاحظات. على سبيل المثال، عند التعامل مع خطأ في عملية المصفوفة، يمكن لوكيل SWE إعادة إنتاج المشكلة وتحديد موقع رمز المشكلة وإجراء التعديلات وحل المشكلة بنجاح. صمم باحثو جامعة برينستون تعليمات موجزة وتنسيق ملاحظات لـ SWE-agent، مما يسهل على النموذج تصفح مستودع التعليمات البرمجية وعرض ملفات التعليمات البرمجية وتحريرها وتشغيلها. ينقسم سير عمل SWE-agent إلى مرحلتين: التفكير والتقييم. في مرحلة التفكير، يتعامل وكيل SWE مع المشكلات على GitHub ويولد حلول الإصلاح؛ وفي مرحلة التقييم، يؤكد ما إذا كان الحل يحل المشكلة بالفعل. المؤلفان الأساسيان لهذه الدراسة، جون يانغ وكارلوس إي. جيمينيز، كلاهما مساعدان باحثان وطلاب دكتوراه في جامعة برينستون. وتركز اهتماماتهم البحثية على أسس اللغة، والتفاعل، وقياس ماجستير اللغة، وهندسة البرمجيات، وتوليد التعليمات البرمجية. يوضح عملهم إمكانات الذكاء الاصطناعي في مجال هندسة البرمجيات ويثير تفكيرًا متعمقًا حول أدوار وقدرات الذكاء الاصطناعي والبشر في العملية الهندسية. مع تطور تكنولوجيا الذكاء الاصطناعي، شهدنا تقدم الذكاء الاصطناعي في مجال البرمجة، حيث لا يمكنهم تخطيط وتنفيذ المهام الهندسية المعقدة فحسب، بل يمكنهم أيضًا إصلاح الأخطاء ويكونون مسؤولين عن عملية تطوير المشروع بأكملها. ومع ذلك، على الرغم من التقدم الذي أحرزه الذكاء الاصطناعي في كتابة التعليمات البرمجية الآمنة، فإن الإشراف البشري يظل بالغ الأهمية. على الرغم من أن صعود الذكاء الاصطناعي لم يصل بعد إلى مرحلة استبدال مهندسي البرمجيات بشكل كامل، إلا أنه يغير وجه مجال التكنولوجيا واتجاهه المستقبلي. لا يجلب مبرمج الذكاء الاصطناعي مفتوح المصدر هذا من فريق برينستون آفاقًا جديدة للبحث والتطبيق في مجال هندسة البرمجيات فحسب، بل يوفر لنا أيضًا فرصة للتفكير في التعاون بين الذكاء الاصطناعي والبشر لخلق المستقبل. مع استمرار تقدم التكنولوجيا، قد نرى الذكاء الاصطناعي يلعب دورًا أكثر أهمية في مجال هندسة البرمجيات.يمثل ظهور وكيل SWE علامة فارقة جديدة في البرمجة المدعومة بالذكاء الاصطناعي. على الرغم من أن الإشراف البشري لا يزال مطلوبًا، إلا أنه لا يمكن تجاهل إمكاناته في تحسين كفاءة التطوير وجودة التعليمات البرمجية. في المستقبل، سيصبح التعاون التعاوني بين الذكاء الاصطناعي والمبرمجين البشريين اتجاهًا سائدًا في مجال هندسة البرمجيات، مما يعزز التقدم التكنولوجي بشكل مشترك.