مع مدى سرعة انتقال الأشياء في Devai Space ، اختصار لمجتمع المطورين يقومون ببناء البرامج بمساعدة نماذج اللغة الكبيرة (LLMS) ، قد يكون من الصعب معرفة أي نموذج يجب استخدامه.
بدأنا هذا المستودع بناءً على تجاربنا كجزء من مجتمع متابعة. لا تتردد في اقتراح تحسينات ومساعدتنا في الحفاظ على ما يصل إلى تاريخ فتح طلب سحب!
هناك الكثير من LLMS. لقد قررنا التركيز على الأشخاص الذين نرى الأشخاص يستخدمونه الآن:

يمكنك العثور على CSV يتضمن كل هذه النماذج والمعلومات عنها هنا.
الخيار الأول الذي تقوم به عادةً هو ما إذا كنت ستستخدم نموذجًا مفتوحًا أو نموذجًا تجاريًا :
إذا قررت استخدام LLM مفتوح المصدر ، فإن قرارك التالي هو ما إذا كنت تريد إعداد النموذج على جهازك المحلي أو على مزود النموذج المستضاف:
نحافظ على دليل حول كيفية نشر رمز مفتوح المصدر LLM لفريقك هنا.
إذا قررت استخدام LLM تجاري ، فستحصل عادةً على مفاتيح API واللعب مع عدة منها للمقارنة. يمكن أن تكون كل من جودة الاقتراحات وتكلفة الاستخدام معايير مهمة.
هذه قائمة بـ LLMs مفتوحة المصدر التي يستخدمها المطورون أثناء الترميز ، والتي تم طلبها تقريبًا من الأكثر شعبية إلى الأقل شعبية ، اعتبارًا من أكتوبر 2023.
Code Llama هي LLM المدربة بواسطة META لتوليد ومناقشة التعليمات البرمجية. إنه مبني على قمة Llama 2. على الرغم من أنه أسفل WizardCoder و Phind-Codellama على المتصدرين في Models Big Code ، إلا أنه النموذج الأساسي لكليهما. كما أنه يأتي في مجموعة متنوعة من الأحجام: 7B ، 13B ، و 34B ، مما يجعل من الشائع استخدامه على الآلات المحلية وكذلك مع مقدمي الخدمات المستضافة. في هذه المرحلة ، هو النموذج الأساسي الأكثر شهرة للمصادر للترميز ويقود الجهد المفتوح المصدر لإنشاء LLMs قادرة على الترميز.
Creator: Meta
Date released: August 24th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 34B
WizardCoder هو LLM بنيت على رأس LLAMA من قبل فريق WizardLM. يتم تكييف طريقة EVOL-instruct لمهام الترميز لإنشاء مجموعة بيانات تدريب ، والتي يتم استخدامها لضبط الرمز LLAMA. إنه يأتي في نفس الأحجام مثل Code Llama: 7b ، 13b ، و 34b. ونتيجة لذلك ، فهي الأكثر شعبية LLM تعليمات مفتوحة المصدر حتى الآن.
Creator: WizardLM
Date released: August 26th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 7B, 13B, 34B
Phind-Codellama هي LLM التي تم بناؤها على قمة Code Llama بواسطة Phind. تم استخدام مجموعة بيانات خاصة من حوالي 80 ألف مشاكل البرمجة عالية الجودة والحلول لضبط الكود Llama. ثم تم ضبط هذا النموذج الذي تم ضبطه بشكل جيد على الرموز الإضافية 1.5B. إنه يؤدي حاليًا على لوحة المتصدرين في Big Code Models. ومع ذلك ، فهو متوفر فقط كنموذج معلمة 34B ، لذلك يتطلب استخدام المزيد من الذاكرة المتاحة.
Creator: Phind
Date released: August 28th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 34B
MISTRAL هو معلمة 7B LLM التي تم تدريبها بواسطة Mistal AI. إنه النموذج الذي تم إصداره مؤخرًا في هذه القائمة ، حيث انخفض في نهاية سبتمبر. يقول Mistal AI إنه "يقترب من أداء Codellama 7B على التعليمات البرمجية ، بينما يظل جيدًا في المهام الإنجليزية". على الرغم من كونهم متاحين فقط في الحجم الصغير ، فإن الناس متحمسون جدًا له في الأسبوعين الأولين بعد الإصدار. بدأت أول LLMs المضبوطة التي تستخدمها كقاعدةهم في الظهور الآن ، ومن المحتمل أن نرى المزيد من المضي قدمًا.
Creator: Mistral AI
Date released: September 27th, 2023
License: Apache 2.0
Base model: Mistral
Parameters: 7B
Starcoder هو معلمة 15B معلمة تم تدريبها بواسطة BigCode ، والتي كانت قبل وقته عندما تم إصداره في مايو. تم تدريبه على 80+ لغة برمجة من المكدس (v1.2) مع استبعاد طلبات إلغاء الاشتراك. إنه ليس نموذج تعليمات وأوامر مثل "كتابة وظيفة تحسب الجذر التربيعي" لا تعمل بشكل جيد. ومع ذلك ، باستخدام موجه مساعد التكنولوجيا ، يمكنك جعلها أكثر فائدة.
Creator: BigCode
Date released: May 4th, 2023
License: OpenRAIL-M
Base model: StarCoder
Parameters: 15B
Deepseek Coder هو LLM المدرب بواسطة Deepseek AI على 2 تريليون رموز. مع مجموعة بيانات مكونة من أكثر من 80 لغة برمجة ، فهي أحدث طراز في هذه القائمة وتم الإبلاغ عن تسجيلها مرتفعًا جدًا على معايير مختلفة متعلقة بالترميز.
Creator: DeepSeek AI
Date released: November 3rd, 2023
License: DeepSeek License Agreement
Base model: DeepSeek Coder
Parameters: 1.3B, 6.7B, 33B
LLAMA 2 هو LLM مدربة بواسطة META على 2 تريليون رمز. إنه الأكثر شعبية Open Source LLM بشكل عام ، لذلك يستخدمها بعض المطورين ، على الرغم من أنها ليست جيدة مثل العديد من النماذج أعلاه في إجراء تعديلات التعليمات البرمجية. إنه أمر مهم أيضًا لأن Code Llama ، LLM الأكثر شعبية للترميز ، مبني فوقه ، والذي بدوره هو أساس WizardCoder و Phind-Codellama.
Creator: Meta
Date released: July 18th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 70B
هذه قائمة بـ LLMs التجارية التي يستخدمها المطورون أثناء الترميز ، والتي تم طلبها تقريبًا من الأكثر شعبية إلى الأقل شعبية ، اعتبارًا من أكتوبر 2023.
يعتبر GPT-4 من Openai بشكل عام أفضل LLM لاستخدامه أثناء الترميز. إنه مفيد تمامًا عند توليد ومناقشة التعليمات البرمجية. ومع ذلك ، فإنك تتطلب منك إرسال الكود الخاص بك إلى Openai عبر API الخاصة بهم ويمكن أن تكون مكلفة للغاية. ومع ذلك ، فهو LLM الأكثر شعبية للترميز بشكل عام ويستخدمها غالبية المطورين أثناء الترميز في هذه المرحلة. تم منح جميع مستخدمي API Openai الذين قاموا بدفع ناجح قدره دولار واحد أو أكثر قبل 6 يوليو 2023 الوصول إلى GPT-4 ، ويخططون لفتح الوصول إلى جميع المطورين قريبًا.
GPT-4 Turbo من Openai أرخص وأسرع من GPT-4. لديها قطع المعرفة في أبريل 2023 ولديه نافذة سياق 128K. إنه في معاينة حاليًا ، اعتبارًا من نوفمبر 2023 ، ولكن يمكن لأي شخص لديه حساب API Openai والوصول الحالي GPT-4 استخدامه.
GPT-3.5 Turbo من Openai أرخص وأسرع من GPT-4 ؛ ومع ذلك ، فإن اقتراحاتها ليست مفيدة تقريبا. كما يتطلب منك إرسال الكود الخاص بك إلى Openai عبر واجهة برمجة التطبيقات الخاصة بهم. هذا هو ثاني أكثر LLM شعبية للترميز بشكل عام حتى الآن. يمكن لجميع المطورين استخدامه الآن بعد الاشتراك في حساب Openai.
Claude 2 هو LLM المدربين من قبل الإنسان ، والذي قام بتحسين مهارات الترميز بشكل كبير مقارنة بالنسخة الأولى من كلود. إنه يتفوق بشكل خاص ، بالنسبة إلى LLMs الأخرى ، عندما تقدم الكثير من السياق. يتطلب منك إرسال الكود الخاص بك إلى الأنثروبور عبر واجهة برمجة التطبيقات الخاصة بهم. يجب أن تتقدم للوصول إلى كلود 2 في هذه المرحلة.
Palm 2 هو LLM المدربة بواسطة Google. لتجربته ، يجب عليك إرسال الكود الخاص بك إلى Google عبر Palm API بعد الحصول على مفتاح API عبر Makersuite ، وكلاهما في المعاينة العامة حاليًا.
إذا رأيت نموذجًا مفقودًا أو ترغب في مشاركة رأي ما ، فنحن نرحب بكم لفتح العلاقات العامة أو مشكلة! نأمل في الحفاظ على فهرس محدد ومحدث من نماذج اللغة الأكثر فائدة للترميز.
إذا أعجبك هذا المنشور المدونة وترغب في قراءة المزيد عن Devai - مجتمع بناء الأشخاص بمساعدة LLMS - في المستقبل ، انضم إلى النشرة الإخبارية الشهرية هنا.