Avec la rapidité avec laquelle les choses se déplacent dans l'espace Devai, un raccourci pour la communauté des développeurs qui construisent des logiciels à l'aide de modèles de grande langue (LLM), il peut être difficile de déterminer le modèle à utiliser.
Nous avons commencé ce référentiel en fonction de nos expériences dans le cadre de la communauté continue. N'hésitez pas à suggérer des améliorations et à nous aider à le garder à jour en ouvrant une demande de traction!
Il y a beaucoup de LLMS. Nous avons décidé de nous concentrer sur ceux que nous voyons des gens utiliser maintenant:

Vous pouvez trouver un CSV qui comprend tous ces modèles et informations à leur sujet ici.
Le premier choix que vous faites généralement est de savoir si vous allez utiliser un modèle d'ouverture ou un modèle commercial :
Si vous décidez d'utiliser un LLM open-source , votre prochaine décision est de configurer le modèle sur votre machine locale ou sur un fournisseur de modèle hébergé:
Nous maintenons un guide sur la façon de déployer un code open source LLM pour votre équipe ici.
Si vous décidez d'utiliser un LLM commercial , vous obtiendrez généralement des clés d'API et jouez avec plusieurs d'entre eux pour comparaison. La qualité des suggestions et le coût d'utilisation peuvent être des critères importants.
Il s'agit d'une liste des LLM open source que les développeurs utilisent lors du codage, à peu près commandés du plus populaire au moins populaire, en octobre 2023.
Code Llama est un LLM formé par Meta pour générer et discuter du code. Il est construit au-dessus de Llama 2. Même s'il est en dessous de Wizardcoder et Phind-Codellama sur le classement des modèles Big Code, c'est le modèle de base pour les deux. Il est également disponible dans une variété de tailles: 7b, 13b et 34b, ce qui le rend populaire à utiliser sur les machines locales ainsi que avec les fournisseurs hébergés. À ce stade, il s'agit du modèle de base open source le plus connu pour le codage et dirige l'effort open-source pour créer des LLM capables de codage.
Creator: Meta
Date released: August 24th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 34B
WizardCoder est un LLM construit au sommet de Code Llama par l'équipe Wizardlm. La méthode EVOL-Instruct est adaptée pour le codage des tâches afin de créer un ensemble de données de formation, qui est utilisé pour affiner le code de code. Il est disponible dans les mêmes tailles que Code Llama: 7b, 13b et 34b. En conséquence, il s'agit du LLM à réglage de l'instruction open-source le plus populaire jusqu'à présent.
Creator: WizardLM
Date released: August 26th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 7B, 13B, 34B
Phind-Codellama est un LLM construit au sommet de Code Llama par Phind. Un ensemble de données propriétaire de environ 80 000 problèmes de programmation et de solutions de haute qualité a été utilisé pour affiner le code de code. Ce modèle affiné a ensuite été affiné sur des jetons supplémentaires de 1,5b. Il mène actuellement dans le classement des modèles Big Code. Cependant, il n'est disponible que comme modèle de paramètres 34b, il faut donc utiliser plus de mémoire disponible.
Creator: Phind
Date released: August 28th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 34B
Mistral est un paramètre 7B LLM formé par Mistal Ai. Il s'agit du dernier modèle publié sur cette liste, ayant abandonné fin septembre. Mistal AI dit qu'il «aborde les performances de Codellama 7b sur le code, tout en restant bien dans les tâches anglaises». Bien qu'ils soient disponibles uniquement dans la petite taille, les gens en sont très excités dans les deux premières semaines après la sortie. Les premiers LLM à réglage fin qui l'utilisent comme base commencent maintenant à émerger, et nous verrons probablement plus à l'avenir.
Creator: Mistral AI
Date released: September 27th, 2023
License: Apache 2.0
Base model: Mistral
Parameters: 7B
Starcoder est un paramètre 15B LLM formé par BigCode, qui était en avance sur son temps lors de sa sortie en mai. Il a été formé sur plus de 80 langages de programmation de la pile (v1.2) avec des demandes d'opt-out exclues. Ce n'est pas un modèle d'instructions et des commandes comme "Écrivez une fonction qui calcule la racine carrée" ne fonctionne pas bien. Cependant, en utilisant l'invite de l'assistant technologique, vous pouvez le rendre plus utile.
Creator: BigCode
Date released: May 4th, 2023
License: OpenRAIL-M
Base model: StarCoder
Parameters: 15B
Deepseek Coder est un LLM formé par Deepseek AI sur 2 billions de jetons. Avec un ensemble de données composé de plus de 80 langages de programmation, c'est le nouveau modèle de cette liste et aurait marqué assez élevé sur diverses références liées au codage.
Creator: DeepSeek AI
Date released: November 3rd, 2023
License: DeepSeek License Agreement
Base model: DeepSeek Coder
Parameters: 1.3B, 6.7B, 33B
Llama 2 est un LLM formé par Meta sur 2 billions de jetons. C'est le LLM open source le plus populaire dans son ensemble, donc certains développeurs l'utilisent, bien qu'il ne soit pas aussi bon que de nombreux modèles ci-dessus pour faire des modifications de code. Il est également important car Code Llama, le LLM le plus populaire pour le codage, est construit au-dessus de celui-ci, qui à son tour est le fondement de WizardCoder et Phind-Codellama.
Creator: Meta
Date released: July 18th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 70B
Il s'agit d'une liste des LLM commerciaux que les développeurs utilisent lors du codage, à peu près commandés du plus populaire au moins populaire, en octobre 2023.
GPT-4 d'OpenAI est généralement considéré comme le meilleur LLM à utiliser lors du codage. Il est très utile lors de la génération et de la discussion du code. Cependant, cela vous oblige à envoyer votre code à OpenAI via leur API et peut être assez cher. Néanmoins, c'est le LLM le plus populaire pour le codage global et la majorité des développeurs l'utilisent tout en codant à ce stade. Tous les utilisateurs d'API OpenAI qui ont réussi un paiement de 1 $ ou plus avant le 6 juillet 2023 ont eu accès à GPT-4, et ils prévoient d'ouvrir l'accès à tous les développeurs bientôt.
GPT-4 Turbo d'Openai est moins cher et plus rapide que GPT-4. Il a un coupure de connaissances d'avril 2023 et a une fenêtre de contexte de 128K. Il est actuellement en avant-première, en novembre 2023, mais toute personne disposant d'un compte API OpenAI et d'un accès GPT-4 existant peut l'utiliser.
GPT-3.5 Turbo d'Openai est moins cher et plus rapide que GPT-4; Cependant, ses suggestions ne sont pas aussi utiles. Cela vous oblige également à envoyer votre code à OpenAI via leur API. Il s'agit du deuxième LLM le plus populaire pour le codage global jusqu'à présent. Tous les développeurs peuvent l'utiliser maintenant après s'être inscrit à un compte OpenAI.
Claude 2 est un LLM formé par Anthropic, qui a considérablement amélioré les compétences de codage par rapport à la première version de Claude. Il excelle surtout, par rapport à d'autres LLM, lorsque vous fournissez beaucoup de contexte. Cela vous oblige à envoyer votre code à Anthropic via leur API. Vous devez postuler pour accéder à Claude 2 à ce stade.
Palm 2 est un LLM formé par Google. Pour l'essayer, vous devez envoyer votre code à Google via l'API PALM après avoir obtenu une clé API via Makersuite, qui sont actuellement en avant-première.
Si vous voyez un modèle manquant ou que vous souhaitez partager une opinion, nous vous invitons à ouvrir un PR ou un problème! Nous espérons maintenir un indice communautaire et à jour des modèles de langage les plus utiles pour le codage.
Si vous avez aimé ce billet de blog et que vous souhaitez en savoir plus sur Devai - la communauté des gens qui construisent des logiciels à l'aide de LLMS - à l'avenir, rejoignez notre newsletter mensuelle ici.