随着在Devai领域的发展速度,在大型语言模型(LLMS)的帮助下,开发人员社区建立软件的速记,找出要使用哪种型号可能会很具有挑战性。
作为继续社区的一部分,我们根据我们的经验开始了这个存储库。请随时提出改进,并通过打开拉动请求来帮助我们保持最新状态!
有很多LLM。我们决定专注于我们现在正在使用的人:

您可以在此处找到包括所有这些模型及其信息的CSV。
您通常做出的首选是您要使用开源或商业模型:
如果您决定使用开源LLM,您的下一个决定是在本地计算机上还是在托管模型提供商上设置模型:
我们在此处为您的团队部署开源代码LLM的指南。
如果您决定使用商业LLM,通常会获取API键并与其中的多个播放进行比较。建议的质量和使用成本都可以是重要的标准。
这是开发人员在编码时使用的开源LLM的列表,该列表大致从最受欢迎至最少流行的订购,截至2023年10月。
Code Llama是由META培训的LLM,用于生成和讨论代码。它建立在Llama 2的顶部。尽管它在Big Code Models排行榜上低于WizardCoder和Phind-Codellama,但它还是两者的基础模型。它还具有多种尺寸:7B,13B和34B,这使得它在本地机器以及托管提供商中都很受欢迎。在这一点上,它是用于编码的最著名的开源基础模型,并且正在领导开源工作,以创建能够编码的LLM。
Creator: Meta
Date released: August 24th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 34B
WizardCoder是Wizardlm团队以Code Llama为顶部的LLM。 EVOL教学方法适用于编码任务来创建培训数据集,该数据集用于微调代码Llama。它的大小与代码骆驼的大小相同:7b,13b和34b。结果,到目前为止,它是最受欢迎的开源指令调整的LLM。
Creator: WizardLM
Date released: August 26th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 7B, 13B, 34B
Phind-Codellama是由Phind的Code Llama建立的LLM。 〜80k高质量编程问题和解决方案的专有数据集用于微调代码骆驼。然后,在1.5B的其他令牌上进一步微调了微调模型。目前,它领导着大型代码模型排行榜。但是,它仅作为34B参数模型可用,因此需要使用更多可用的内存。
Creator: Phind
Date released: August 28th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 34B
Mistral是由Mistal AI训练的7B参数LLM。它是该列表上最近发布的模型,该模型已于9月底下降。 MISTAL AI说,它“在代码上接近Codellama 7B的性能,同时保持良好的英语任务”。尽管只有一个小尺寸可用,但在发布后的前几周,人们对此感到非常兴奋。现在,将其用作其基础的第一个微调的LLM现在开始出现,我们很可能会看到更多。
Creator: Mistral AI
Date released: September 27th, 2023
License: Apache 2.0
Base model: Mistral
Parameters: 7B
Starcoder是由BigCode训练的15B参数LLM,它在5月发布时就领先于其时代。它接受了从堆栈(v1.2)的80多种编程语言进行培训,并不包括退出请求。它不是指令模型,命令诸如“编写计算平方根的函数”之类的命令不能很好地工作。但是,通过使用技术助理提示,您可以使其更有帮助。
Creator: BigCode
Date released: May 4th, 2023
License: OpenRAIL-M
Base model: StarCoder
Parameters: 15B
DeepSeek Codor是一家LLM,由DeepSeek AI培训了2万亿个令牌。通过由80多种编程语言组成的数据集,它是该列表上的最新模型,据报道,在各种与编码相关的基准测试中得分很高。
Creator: DeepSeek AI
Date released: November 3rd, 2023
License: DeepSeek License Agreement
Base model: DeepSeek Coder
Parameters: 1.3B, 6.7B, 33B
Llama 2是由Meta对2万亿代币进行训练的LLM。它是总体上最受欢迎的开源LLM,因此有些开发人员使用它,尽管它在制作代码编辑方面的模型不如上述许多模型。这也很重要,因为Code Llama是最受欢迎的编码LLM,它是在其顶部建立的,这反过来又是WizardCoder和Phind-Codellama的基础。
Creator: Meta
Date released: July 18th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 70B
这是开发人员在编码时使用的商业LLM的列表,截至2023年10月,大致从最受欢迎至最受欢迎的订购。
通常认为来自OpenAI的GPT-4是编码时使用的最佳LLM。在生成和讨论代码时,这非常有帮助。但是,它要求您通过其API将代码发送到OpenAI,并且可能非常昂贵。但是,它是整体编码的最受欢迎的LLM,并且大多数开发人员在此时进行编码。所有在2023年7月6日之前成功支付1美元或以上的OpenAI API用户都可以访问GPT-4,并计划尽快访问所有开发人员。
来自OpenAI的GPT-4涡轮增压速度比GPT-4便宜,更快。它具有2023年4月的知识截止,并具有128K上下文窗口。截至2023年11月,它目前正在预览中,但是任何拥有OpenAI API帐户和现有GPT-4访问权限的人都可以使用它。
来自Openai的GPT-3.5 Turbo比GPT-4便宜,更快。但是,它的建议并没有那么有用。它还要求您通过其API将代码发送到OpenAI。迄今为止,这是第二个最受欢迎的LLM编码。注册OpenAI帐户后,所有开发人员现在都可以使用它。
Claude 2是一款受拟人训练的LLM,与Claude的第一个版本相比,它具有大大提高的编码技巧。当您提供大量上下文时,它尤其相对于其他LLM的表现。它要求您通过其API将代码发送到人类。此时,您必须申请访问Claude 2。
Palm 2是由Google培训的LLM。要尝试一下,您必须在通过MakerSuite获得API密钥后通过Palm API将代码发送给Google,这两者都在公共预览中。
如果您看到丢失的模型或想分享意见,我们欢迎您打开PR或问题!我们希望能够维护最有用的编码语言模型的社区驱动和最新索引。
如果您喜欢这篇博客文章,并且想在LLMS的帮助下阅读有关Devai的更多信息 - 将来,请在此处加入我们的每月新闻通讯。