С тем, как быстро все движется в пространстве Деваи, сокращена для сообщества разработчиков, создающих программное обеспечение с помощью крупных языковых моделей (LLMS), может быть сложно выяснить, какую модель использовать.
Мы начали этот репозиторий на основе нашего опыта в рамках продолжительного сообщества. Не стесняйтесь предлагать улучшения и помогать нам держать их в курсе, открыв запрос на тягу!
Есть много LLM. Мы решили сосредоточиться на тех, которые мы видим сейчас, использующие люди:

Вы можете найти CSV, который включает все эти модели и информацию о них здесь.
Первый выбор, который вы обычно делаете, это то, собираетесь ли вы использовать открытый источник или коммерческую модель:
Если вы решите использовать LLM с открытым исходным кодом , ваше следующее решение состоит в том, следует ли настроить модель на вашей локальной машине или на хостинном поставщике моделей:
Мы поддерживаем руководство о том, как развернуть код с открытым исходным кодом для вашей команды здесь.
Если вы решите использовать коммерческий LLM, вы обычно получите клавиши API и поиграете с несколькими из них для сравнения. Как качество предложений, так и стоимость использования могут быть важными критериями.
Это список LLM с открытым исходным кодом , который разработчики используют во время кодирования, примерно заказанный от наиболее популярной до наименьшей популярности по состоянию на октябрь 2023 года.
Code Llama - это LLM, обученный Meta для создания и обсуждения кода. Он построен на вершине Llama 2. Несмотря на то, что он находится ниже WizardCoder и Phind-Codellama в таблице лидеров моделей Big Code, это базовая модель для них обоих. Он также бывает разных размеров: 7B, 13B и 34B, что делает его популярным для использования как на местных машинах, так и с провайдерами. На этом этапе это самая известная базовая модель с открытым исходным кодом для кодирования и руководит усилием открытого исходного кода для создания кодирования, способных LLMS.
Creator: Meta
Date released: August 24th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 34B
WizardCoder - это LLM, построенный на вершине кода Llama командой Wizardlm. Метод evol-instructs адаптирован для задач кодирования для создания обучающего набора данных, который используется для кода тонкой настройки Llama. Он поставляется в тех же размерах, что и Code Llama: 7b, 13b и 34b. В результате это самый популярный LLM с открытым исходным кодом.
Creator: WizardLM
Date released: August 26th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 7B, 13B, 34B
Phind-Codellama-это LLM, построенный на вершине кода Llama от Phind. Собственная набор данных высококачественного программирования ~ 80K-задач и решений использовался для точной настройки кода Llama. Эта тонкая модель была затем настройкой на 1,5B дополнительные токены. В настоящее время он ведет в таблицу лидеров моделей Big Code. Тем не менее, он доступен только в виде модели параметров 34B, поэтому требуется более доступная память.
Creator: Phind
Date released: August 28th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 34B
Mistral - это параметр 7B LLM, обученный Mistal AI. Это самая недавно выпущенная модель в этом списке, которая упала в конце сентября. Mistal AI говорит, что он «подходит к Codellama 7b производительности по коду, оставаясь хорошими в английских задачах». Несмотря на то, что они были доступны только в одном маленьком размере, люди очень взволнованы этим в первые пару недель после выпуска. Первые тонко настроенные LLM, которые используют его в качестве их базы, теперь начинают появляться, и мы, вероятно, увидим больше.
Creator: Mistral AI
Date released: September 27th, 2023
License: Apache 2.0
Base model: Mistral
Parameters: 7B
StarCoder - это параметр 15B LLM, обученный BigCode, который опередил свое время, когда он был выпущен в мае. Он был обучен 80+ языкам программирования из стека (v1.2) с исключенными запросами на отказ. Это не модель инструкций, и такие команды, как «написать функцию, которая вычисляет квадратный корень», не работают хорошо. Однако, используя подсказку Tech Assistant, вы можете сделать его более полезным.
Creator: BigCode
Date released: May 4th, 2023
License: OpenRAIL-M
Base model: StarCoder
Parameters: 15B
DeepSeek Coder - это LLM, обученный DeepSeek AI на 2 триллиона токена. С набором данных, состоящим из более чем 80 языков программирования, это самая новая модель в этом списке и, как сообщается, оценивается довольно высокий по различным контрольным показателям, связанным с кодированием.
Creator: DeepSeek AI
Date released: November 3rd, 2023
License: DeepSeek License Agreement
Base model: DeepSeek Coder
Parameters: 1.3B, 6.7B, 33B
Llama 2 - это LLM, обученный Meta на 2 триллиона токена. Это самый популярный LLM с открытым исходным кодом в целом, поэтому некоторые разработчики используют его, несмотря на то, что он не так хорош, как многие модели, выше при изготовлении кода. Это также важно, потому что код Llama, самый популярный LLM для кодирования, построен сверху, который, в свою очередь, является основой для WizardCoder и Phind-Codellama.
Creator: Meta
Date released: July 18th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 70B
Это список коммерческих LLM, которые разработчики используют во время кодирования, примерно заказанный от наиболее популярной до наименьшей популярности, по состоянию на октябрь 2023 года.
GPT-4 от OpenAI, как правило, считается лучшим LLM для использования во время кодирования. Это довольно полезно при генерации и обсуждении кода. Тем не менее, это требует, чтобы вы отправили ваш код в Openai через их API и могут быть довольно дорогими. Тем не менее, это самый популярный LLM для кодирования в целом, и большинство разработчиков используют его во время кодирования на данный момент. Все пользователи API OpenAI, которые совершили успешный оплату в размере 1 доллара или более до 6 июля 2023 года, получили доступ к GPT-4, и они планируют открыть доступ ко всем разработчикам в ближайшее время.
GPT-4 Turbo от OpenAI дешевле и быстрее, чем GPT-4. У него есть обрезка знаний в апреле 2023 года и имеет окно контекста 128K. В настоящее время он находится в предварительном просмотре, по состоянию на ноябрь 2023 года, но любой, у кого есть аккаунт API OpenAI и существующий доступ GPT-4, может использовать его.
GPT-3.5 Turbo от Openai дешевле и быстрее, чем GPT-4; Однако его предложения не так полезны. Это также требует, чтобы вы отправили свой код в Openai через их API. Это второй по популярности LLM для кодирования в целом. Все разработчики могут использовать его сейчас после регистрации на аккаунт OpenAI.
Claude 2 - это LLM, обученный антропным, который значительно улучшил навыки кодирования по сравнению с первой версией Claude. Это особенно превосходно, по сравнению с другими LLM, когда вы предоставляете много контекста. Это требует, чтобы вы отправили свой код в антроп через их API. Вы должны подать заявку, чтобы получить доступ к Claude 2 на этом этапе.
Palm 2 - это LLM, обученный Google. Чтобы попробовать это, вы должны отправить свой код в Google через Palm API после получения ключа API через Makersuite, оба из которых в настоящее время находятся на публичном предварительном просмотре.
Если вы видите, что модель отсутствует или хотите поделиться мнением, мы приветствуем вас, чтобы открыть PR или проблему! Мы надеемся поддерживать ориентированный на сообщество и актуальный индекс наиболее полезных языковых моделей для кодирования.
Если вам понравился этот пост в блоге и вы хотите узнать больше о Devai - сообществе Folks Building Software с помощью LLMS - в будущем присоединяйтесь к нашему ежемесячному информационному бюллетеню здесь.