| عنوان | app_file | SDK | sdk_version |
|---|---|---|---|
دولي-باني | app.py | غراد | 3.34.0 |
مساعد يعمل بذات الأوزان الخفيفة في Dolly-V2 يمكنه الإجابة على الأسئلة الخاصة بالمجال والاحتفاظ بمحادثة. إنها أنظمة الخبراء في عصر LLMS.
التقديم إلى "So You Think You Can Hack": Open Source LLMS (على سبيل المثال ، OpenAssistant ، MPT ، Dolly ، إلخ) DevPost Hackathon.

اعتادت أنظمة الخبراء لتكون كبيرة في الذكاء الاصطناعي. إنها تحاكي قدرات صنع القرار لخبير بشري في مجال معين ويمكن أن توفر قيمة كبيرة في العديد من حالات الاستخدام. كان العيب الرئيسي لأنظمة خبراء المدارس القديمة هو أنه يجب برمجته باستخدام بيانات منطقية أو منطق مماثل ، مع قضاء وقت وموارد كبيرة. في العديد من المناسبات ، هزم هذا النهج الغرض من وجود خبير متاح بسهولة للمهمة المطروحة.
تعد تطبيقات LLM المغلقة مثل ChatGPT3.5 و ChatGPT-4 نماذج عملاقة جيدة جدًا من المهام. لديهم قيود مثل الهلوسة عندما لا يعرفون كيفية الاستجابة أو عندما تكون الإجابة عبر الإنترنت ولا يمكنهم الوصول إلى الإنترنت أو الملفات. في بعض الأحيان ، سيتم إخبار هذه الهلوسة بطرق مقنعة للغاية ، وكلما حاول المرء تنفيذها ، سوف يتحول إلى كاذبة أو غير صحيحة. تحتوي هذه النماذج على نوافذ سياق هائلة حتى يتمكن الأشخاص من مساعدتهم على القيام بأي مهمة يكافحون من خلال توفير الكثير من المعلومات وتنفيذ تقنيات الهندسة السريعة. هذا يجعل أكثر من واحد يعتقد أن الشركات الكبرى التي لديها رمز مصدر مغلق فقط يمكنها تطوير ونشر تطبيقات LLM.
يقوم Dolly Expert Lite بتزويد Dolly-V2-3B ، الإصدار الخفيف من Dolly-V2-12B ، وهو نموذج لغة كبير مفتوح المصدر (LLM) للإجابة على الأسئلة الخاصة بالمجال باستخدام استرجاع قواعد بيانات المتجهات المخصصة. في هذا المثال النشر ، يسترجع Dolly-Expert-Builder المعلومات من رمز بناء أونتاريو (كندا) للإجابة على أسئلة محددة حول البناء والسباكة والأسلاك الكهربائية والتهوية وفقًا لقانون الحكومة الرسمي. يمكن أن يوفر Dolly-Expert-Builder معلومات متماسكة وصحيحة من الناحية الواقعية مع مصادر ويمكن أن تكون بمثابة إرشادات مناسبة للتجار (السباكين ، والكهربائيين ، والميكانيكيين ، وبناة المنازل) بالإضافة إلى المهندسين والمهندسين المعماريين للمساعدة في الامتثال التنظيمي أثناء أداء العمل.
باتباع هذه الطريقة ، يمكن للأفراد والمؤسسات استخدام بياناتهم المحلية لجعل مساعدي الخبراء قادرين على الإجابة على الأسئلة الخاصة بالمجال. تشمل حالات الاستخدام الممكنة:
نظرًا لأن الأدوات جديدة جدًا ، فإن بعض الاختلافات من حالات الاستخدام القياسية تسبب أخطاء. على سبيل المثال:
persists_directory في تهيئة Chromadb ولن يتم تحميلها لاحقًا في مثيل منفصل لأنه لم يتم استدعاء طريقة .persists (). كان يجب إعادة تشكيل هذا وارتكابها مرة أخرى لتوفير قاعدة البيانات في النهاية.أن تكون قادرًا على صنع نموذج أولي وظيفي خفيف الوزن لتطبيق LLM باستخدام نموذج مفتوح المصدر مثل Dolly ونشره كمساحة معانقة. أن تكون قادرًا على إظهار أن تطبيقات LLM مخصصة للجميع وأن النظام الإيكولوجي مفتوح المصدر قادر بنفس القدر مثل رواد المصدر المغلق.
فيما يتعلق بمعرفة تطوير البرمجيات العامة ، تعلمت استكشاف الحزم المتضاربة مع بعضها البعض ، وعلمت أنه يجب إعادة تشغيل Python اعتمادًا على التبعيات التي يتم تثبيتها أو أنه من الأفضل أحيانًا تقسيم المهام بدلاً من محاولة القيام بكل شيء مرة واحدة. لقد تعلمت أيضًا أساسيات Gradio لتتمكن من عمل التطبيق. والأهم من ذلك ، لقد تعلمت التنقل بشكل أفضل في مشكلات GitHub و ScackOverflow Costs للعثور على حلول للمشاكل التي واجهتها.
فيما يتعلق بالمعرفة المتعلقة بـ LLM ، تعلمت عن أهمية الهندسة السريعة وكيف يمكن أن تحسن نتائج الاستدلال بشكل كبير ، تعلمت التنقل في مصطلحات معالجة اللغة الطبيعية (NLP) أكثر من ذلك بكثير ، وتعلمت عن أنواع ذاكرة سلسلة الأسئلة. لقد تعلمت أيضًا أن النماذج المفتوحة المصدر تمنح إمكانية تطوير تطبيقات LLM ونشرها على من يهتم ويضع في الوقت المناسب للبحث في الوثائق واستكشاف الأخطاء وإصلاحها أو حل المشكلات الحالية.