أصدر فريق Alibaba Cloud Tongyi Qianwen مؤخرًا سلسلة جديدة من المصدر QWEN2.5-1M ، والتي تحتوي على نموذجين: QWEN2.5-7B-instruct-1M و QWEN2.5-14B-instruct-1M ، وأبرز ما هو أبرز ما في ذلك النشوجا. بدعم من الملايين من أطوال سياق الرمز المميز وتحسين سرعة الاستدلال بشكل كبير. هذا يمثل اختراقًا كبيرًا في معالجة النصوص الطويلة للغاية وكفاءة الاستدلال النموذجية ، مما يوفر إمكانية تطبيق نماذج كبيرة على مهام أكثر تعقيدًا وطويلة التنسيق. يوضح هذا الإصدار مرة أخرى قدرات Alibaba Cloud التقنية والابتكار في مجال الذكاء الاصطناعي ، والذي يستحق الاهتمام والتعلم من الصناعة.
لا يمكن لسلسلة QWEN2.5-1M التي تم إصدارها هذه المرة معالجة المستندات الطويلة للغاية ، مثل الكتب والتقارير والوثائق القانونية ، دون تقسيم مملة ؛ (مثل فهم الكود ، والتفكير المعقد ، وجولات متعددة من المحادثات ، وما إلى ذلك). بالإضافة إلى ذلك ، زاد إطار الاستدلال وآلية الانتباه المتفرقة القائمة على VLLM من سرعة استنتاج النموذج بمقدار 3 إلى 7 مرات ، مما يؤدي إلى تحسين تجربة المستخدم وكفاءة التطبيق بشكل كبير. إن إطلاق QWEN2.5-1M سيعزز بلا شك تطوير وتطبيق تكنولوجيا نموذج اللغة الكبيرة.

إن تسليط الضوء الأساسي لـ QWEN2.5-1M هو دعمه الأصلي لقدرة معالجة السياق الطويلة للغاية للملايين من الرموز. يتيح ذلك للنموذج التعامل بسهولة مع المستندات الطويلة جدًا مثل الكتب والتقارير الطويلة والوثائق القانونية وما إلى ذلك دون الحاجة إلى تجزئة مملة. في الوقت نفسه ، يدعم النموذج أيضًا محادثات أطول وأعمق ، والتي يمكن أن تتذكر تاريخ المحادثة الأطول وتحقيق تجربة تفاعلية أكثر تماسكًا وطبيعية. بالإضافة إلى ذلك ، يوضح QWEN2.5-1M أيضًا قدرات أقوى في فهم المهام المعقدة مثل فهم التعليمات البرمجية ، والتفكير المعقد ، وجولات حوار متعددة.
بالإضافة إلى طول السياق المروع للملايين من الرموز ، فإن QWEN2.5-1M يجلبون إنجازًا كبيرًا آخر: قام فريق Tongy Qianwen بتفتيت إطار الاستدلال القائم على VLLM تمامًا . يتيح هذا الإطار المبتكر QWEN2.5-1M زيادة السرعة بمقدار 3 إلى 7 مرات عند معالجة الملايين من المدخلات الرمزية!
إن إصدار QWEN2.5-1M ليس مجرد اختراق تكنولوجي ، ولكنه يفتح أيضًا موقفًا جديدًا للتطبيق العملي للنماذج الكبيرة. سيمكّن طول السياق وسرعة الاستدلال الفعالة سيناريوهات التطبيق وتعزيز تنفيذ تكنولوجيا الذكاء الاصطناعي في جميع مناحي الحياة. أعتقد أنه في المستقبل ، سنرى تطبيقات أكثر إبداعًا تعتمد على QWEN2.5-1M.