أصدرت شركة Deepseek ، بدء تشغيل الذكاء الاصطناعي الصيني مؤخرًا ، بهدوء أحدث نموذج لغوي كبير ، Deepseek-V3-0324 ، والذي جذبت اهتمامًا واسعًا في صناعة الذكاء الاصطناعي. يظهر النموذج على مكتبة موارد الذكاء الاصطناعى التي تعانق وجهها 641 جيجابايت ، مما يواصل أسلوب Deepseek المعتاد منخفض المفتاح. لا تنفذ دعاية واسعة النطاق ، ولا تأتي إلا مع ملف readme الفارغ والأوزان النموذجية.
تم ترخيص هذا النموذج باستخدام معهد ماساتشوستس للتكنولوجيا ، مما يسمح باستخدامه مجانًا لأغراض تجارية ويمكن تشغيله مباشرة على أجهزة من فئة المستهلك ، مثل Apple Mac Studio مع رقاقة M3 Ultra. كشف باحث AI Awni Hannun على وسائل التواصل الاجتماعي أن النسخة الكمية المكونة من 4 بت من Deepseek-V3-0324 تعمل بشكل أسرع من 20 رمزًا في الثانية على رقاقة Ultra 512GB M3. على الرغم من ارتفاع سعر Mac Studio ، فإن القدرة على تشغيل هذا النموذج على نطاق واسع يكسر محليًا الاعتماد السابق على أعلى الذكاء الاصطناعي على مراكز البيانات.

يعتمد Deepseek-V3-0324 بنية خبراء مختلطة (MOE) ، والتي لا تنشط سوى حوالي 37 مليار معلمة بدلاً من جميع المعلمة 685 مليار عند أداء المهام ، وبالتالي تحسين الكفاءة بشكل كبير. في الوقت نفسه ، يشتمل النموذج أيضًا على انتباه طويل (MLA) وتقنيات التنبؤ متعددة التنبؤ (MTP). MLA يعزز القدرة على فهم النموذج السياقي في النصوص الطويلة. تمكن MTP النموذج من توليد الرموز الرموز المتعددة في وقت واحد ، ويتم زيادة سرعة الإخراج بنسبة 80 ٪ تقريبًا. يقلل الإصدار الكمي المكون من 4 بت من الطلب على التخزين إلى 352 جيجابايت ، مما يجعل من الممكن تشغيل أجهزة من الدرجة المستهلك.
وفقًا للمختبرين الأوائل ، تحسن Deepseek-V3-0324 بشكل كبير مقارنة بالإصدار السابق. يدعي باحث الذكاء الاصطناعي Xeophon أن هذا النموذج حقق قفزة كبيرة في جميع مقاييس الاختبار ، متجاوزًا كلود سونيت 3.5 لتصبح أفضل نموذج غير مؤمن. علاوة على ذلك ، على عكس Sonnet التي يجب الاشتراك فيها ، يمكن تنزيل وزن Deepseek-V3-0324 مجانًا.

تتناقض استراتيجية إصدار Deepseek Open Source Perform بشكل حاد مع شركات الذكاء الاصطناعى الغربيين. حددت Openai والأنثروبور في الولايات المتحدة عتبات الدفع للنماذج ، في حين تميل شركات الذكاء الاصطناعى الصينيين بشكل متزايد إلى تراخيص المصادر المفتوحة. لقد تسارعت هذه الاستراتيجية في تطوير النظام الإيكولوجي في الصين ، وقد اتبع عمالقة التكنولوجيا مثل Baidu و Alibaba و Tencent حذوها وأصدرت نماذج AI مفتوحة المصدر. في مواجهة قيود رقائق NVIDIA ، حولت الشركات الصينية عيوبها إلى مزايا تنافسية من خلال التأكيد على الكفاءة والتحسين.
من المحتمل أن يكون Deepseek-V3-0324 أساس نموذج الاستدلال Deepseek-R2 القادم. طلب الحوسبة النموذجية للاستدلال الحالية ضخمة. إذا كان أداء Deepseek-R2 جيدًا ، فسيشكل تحديًا مباشرًا لـ GPT-5 المشاع لـ Openai.
بالنسبة للمستخدمين والمطورين الذين يرغبون في تجربة Deepseek-V3-0324 ، يمكن تنزيل وزن النموذج الكامل من Hugging Face ، ولكن الملفات كبيرة وتتطلب تخزينًا عالية وحوسًا. يمكنك أيضًا اختيار الخدمات السحابية ، مثل OpenRouter ، والتي توفر وصول API مجاني وواجهة دردشة ودية ؛ قد تم أيضًا تحديث واجهة الدردشة الخاصة بـ Deepseek لدعم الإصدارات الجديدة. يمكن للمطورين أيضًا دمج النموذج من خلال مقدمي خدمات التفكير مثل المختبرات الزائدين.
تجدر الإشارة إلى أن Deepseek-V3-0324 قد تغير في أسلوب الاتصال ، من نمط حوار يشبه الإنسان إلى نمط أكثر رسمية وتقنية. يهدف هذا التحول إلى التكيف مع سيناريوهات التطبيق المهني والتقني ، ولكنه قد يؤثر على جاذبيته في التطبيقات الموجهة للمستهلكين.
تتمثل استراتيجية Deepseek Open Source في إعادة تشكيل المشهد العالمي لمنظمة العفو الدولية. في السابق ، كانت فجوة الذكاء الاصطناعي في الصين مع الولايات المتحدة على بعد 1-2 سنوات ، لكنها الآن ضاقت بشكل كبير إلى 3-6 أشهر ، وقد حققت بعض المناطق اللحاق بالركب. مثلما تكتسب أنظمة Android هيمنة عالمية من خلال المصدر المفتوح ، من المتوقع أن يبرز نموذج AI المصدر المفتوح في المنافسة مع مجموعة واسعة من التطبيقات والابتكارات الجماعية للمطورين وتعزيز التطبيق الأوسع لتكنولوجيا الذكاء الاصطناعي.