في مجال الذكاء الاصطناعي (AI) ، على الرغم من أن نماذج اللغة الكبيرة (LLMs) تعمل بشكل جيد في معالجة اللغة الطبيعية ، إلا أنها غالبًا ما تبدو عديمية عند مواجهة مهام الاستدلال المعقدة. غالبًا ما تتضمن هذه المهام التفكير متعدد الخطوات أو المعرفة الخاصة بالمجال أو التكامل الفعال للأدوات الخارجية. للتغلب على هذه القيود ، كان الباحثون يستكشفون كيفية تعزيز قدرات LLM من خلال استخدام الأدوات الخارجية.
غالبًا ما تتطلب أساليب التحسين التقليدية ضبطًا دقيقًا أو تدريبًا إضافيًا للنموذج ، مما يؤدي إلى قيوده في قابلية التكيف والمرونة في المهمة. تميل الأطر الحالية إلى الاعتماد على مجموعات الأدوات الثابتة والمحددة مسبقًا ، وتفتقر إلى آليات تخطيط الأدوات الفعالة وآليات التخطيط ، والتي يمكن أن تتسبب بسهولة في أخطاء عند تنفيذ المهام ، وزيادة التكاليف الحسابية ، والضعف عند تطبيقها على مجالات جديدة.
لحل هذه المشكلة ، أطلق فريق الأبحاث في جامعة ستانفورد Octotools ، وهو إطار جديد مصمم لتعزيز قدرات الاستدلال من الذكاء الاصطناعي من خلال الأدوات الخارجية الديناميكية المنظمة. Octotools هو إطار معياري وخالي من التدريب وقابل للتطوير يتوحد لكيفية تفاعل نماذج الذكاء الاصطناعى مع الأدوات الخارجية. على عكس الأطر السابقة التي تتطلب تكوينات الأدوات المحددة مسبقًا ، أدخلت Octotools "بطاقات الأدوات" التي تغلف وظائف وبيانات التعريف للأداة ، مما يسمح لطرز الذكاء الاصطناعي بدمج الأدوات واستخدامها بشكل أكثر كفاءة.
تنقسم عملية تشغيل Octotools إلى ثلاث مراحل رئيسية: التخطيط والتنفيذ والتحقق. أولاً ، يحلل المخطط استعلامات المستخدم ويحدد الأدوات المطلوبة بناءً على البيانات الوصفية في بطاقة الأدوات. يقوم المنفذ بعد ذلك بتحويل القرارات عالية المستوى إلى أوامر قابلة للتنفيذ وتشغيلها بالتتابع لضمان معالجة النتائج الوسيطة بشكل صحيح. أخيرًا ، يقوم المدقق بتقييم اتساق الإخراج ، مما يضمن أنه يتطابق مع الاستعلام الأصلي ، وبالتالي تقليل الأخطاء.
أجرى فريق الأبحاث تقييمات واسعة النطاق من Octotools في مجالات متعددة ، بما في ذلك الرؤية ، والتفكير الرياضي ، والتحليل العلمي والتطبيقات الطبية. أظهرت النتائج أن Octotools أفضل بكثير من إطار الذكاء الاصطناعي الحالي في الأداء ، وخاصة في مهام التفكير الرياضي ، مع زيادة دقة 22.5 ٪. في التطبيقات الطبية ، حققت Octotools زيادة في الدقة بنسبة 20.7 ٪ ، مما يدل على فعاليته في التشخيص الذي تم مساعدة AI في العالم الحقيقي.
لا تتطلب Octotools تدريبًا إضافيًا ، مما يحسن بشكل كبير من دقة استنتاج الذكاء الاصطناعى ، بزيادة متوسط قدرها 9.3 ٪. يدعم الإطار ما يصل إلى 16 مهمة استدلال ، بما في ذلك التحليل البصري ، والعمليات الرياضية ، والتفكير الطبي ، وما إلى ذلك. يقوم نظام بطاقة أدوات Octotools بتبسيط تكامل الأدوات ، ويحسن عملية صنع القرار ، ويحسن كفاءة التنفيذ.
Github: https://github.com/octotools/octotools