隨著在Devai領域的發展速度,在大型語言模型(LLMS)的幫助下,開發人員社區建立軟件的速記,找出要使用哪種型號可能會很具有挑戰性。
作為繼續社區的一部分,我們根據我們的經驗開始了這個存儲庫。請隨時提出改進,並通過打開拉動請求來幫助我們保持最新狀態!
有很多LLM。我們決定專注於我們現在正在使用的人:

您可以在此處找到包括所有這些模型及其信息的CSV。
您通常做出的首選是您要使用開源或商業模型:
如果您決定使用開源LLM,您的下一個決定是在本地計算機上還是在託管模型提供商上設置模型:
我們在此處為您的團隊部署開源代碼LLM的指南。
如果您決定使用商業LLM,通常會獲取API鍵並與其中的多個播放進行比較。建議的質量和使用成本都可以是重要的標準。
這是開發人員在編碼時使用的開源LLM的列表,該列表大致從最受歡迎至最少流行的訂購,截至2023年10月。
Code Llama是由META培訓的LLM,用於生成和討論代碼。它建立在Llama 2的頂部。儘管它在Big Code Models排行榜上低於WizardCoder和Phind-Codellama,但它還是兩者的基礎模型。它還具有多種尺寸:7B,13B和34B,這使得它在本地機器以及託管提供商中都很受歡迎。在這一點上,它是用於編碼的最著名的開源基礎模型,並且正在領導開源工作,以創建能夠編碼的LLM。
Creator: Meta
Date released: August 24th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 34B
WizardCoder是Wizardlm團隊以Code Llama為頂部的LLM。 EVOL教學方法適用於編碼任務來創建培訓數據集,該數據集用於微調代碼Llama。它的大小與代碼駱駝的大小相同:7b,13b和34b。結果,到目前為止,它是最受歡迎的開源指令調整的LLM。
Creator: WizardLM
Date released: August 26th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 7B, 13B, 34B
Phind-Codellama是由Phind的Code Llama建立的LLM。 〜80k高質量編程問題和解決方案的專有數據集用於微調代碼駱駝。然後,在1.5B的其他令牌上進一步微調了微調模型。目前,它領導著大型代碼模型排行榜。但是,它僅作為34B參數模型可用,因此需要使用更多可用的內存。
Creator: Phind
Date released: August 28th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 34B
Mistral是由Mistal AI訓練的7B參數LLM。它是該列表上最近發布的模型,該模型已於9月底下降。 MISTAL AI說,它“在代碼上接近Codellama 7B的性能,同時保持良好的英語任務”。儘管只有一個小尺寸可用,但在發布後的前幾週,人們對此感到非常興奮。現在,將其用作其基礎的第一個微調的LLM現在開始出現,我們很可能會看到更多。
Creator: Mistral AI
Date released: September 27th, 2023
License: Apache 2.0
Base model: Mistral
Parameters: 7B
Starcoder是由BigCode訓練的15B參數LLM,它在5月發佈時就領先於其時代。它接受了從堆棧(v1.2)的80多種編程語言進行培訓,並不包括退出請求。它不是指令模型,命令諸如“編寫計算平方根的函數”之類的命令不能很好地工作。但是,通過使用技術助理提示,您可以使其更有幫助。
Creator: BigCode
Date released: May 4th, 2023
License: OpenRAIL-M
Base model: StarCoder
Parameters: 15B
DeepSeek Codor是一家LLM,由DeepSeek AI培訓了2萬億個令牌。通過由80多種編程語言組成的數據集,它是該列表上的最新模型,據報導,在各種與編碼相關的基準測試中得分很高。
Creator: DeepSeek AI
Date released: November 3rd, 2023
License: DeepSeek License Agreement
Base model: DeepSeek Coder
Parameters: 1.3B, 6.7B, 33B
Llama 2是由Meta對2萬億代幣進行訓練的LLM。它是總體上最受歡迎的開源LLM,因此有些開發人員使用它,儘管它在製作代碼編輯方面的模型不如上述許多模型。這也很重要,因為Code Llama是最受歡迎的編碼LLM,它是在其頂部建立的,這反過來又是WizardCoder和Phind-Codellama的基礎。
Creator: Meta
Date released: July 18th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 70B
這是開發人員在編碼時使用的商業LLM的列表,截至2023年10月,大致從最受歡迎至最受歡迎的訂購。
通常認為來自OpenAI的GPT-4是編碼時使用的最佳LLM。在生成和討論代碼時,這非常有幫助。但是,它要求您通過其API將代碼發送到OpenAI,並且可能非常昂貴。但是,它是整體編碼的最受歡迎的LLM,並且大多數開發人員在此時進行編碼。所有在2023年7月6日之前成功支付1美元或以上的OpenAI API用戶都可以訪問GPT-4,併計劃盡快訪問所有開發人員。
來自OpenAI的GPT-4渦輪增壓速度比GPT-4便宜,更快。它具有2023年4月的知識截止,並具有128K上下文窗口。截至2023年11月,它目前正在預覽中,但是任何擁有OpenAI API帳戶和現有GPT-4訪問權限的人都可以使用它。
來自Openai的GPT-3.5 Turbo比GPT-4便宜,更快。但是,它的建議並沒有那麼有用。它還要求您通過其API將代碼發送到OpenAI。迄今為止,這是第二個最受歡迎的LLM編碼。註冊OpenAI帳戶後,所有開發人員現在都可以使用它。
Claude 2是一款受擬人訓練的LLM,與Claude的第一個版本相比,它具有大大提高的編碼技巧。當您提供大量上下文時,它尤其相對於其他LLM的表現。它要求您通過其API將代碼發送到人類。此時,您必須申請訪問Claude 2。
Palm 2是由Google培訓的LLM。要嘗試一下,您必須在通過MakerSuite獲得API密鑰後通過Palm API將代碼發送給Google,這兩者都在公共預覽中。
如果您看到丟失的模型或想分享意見,我們歡迎您打開PR或問題!我們希望能夠維護最有用的編碼語言模型的社區驅動和最新索引。
如果您喜歡這篇博客文章,並且想在LLMS的幫助下閱讀有關Devai的更多信息 - 將來,請在此處加入我們的每月新聞通訊。