what llm to use Download - what llm to use o Código Fonte Download

what llm to use

Outro código-fonte

1.0.0

Baixar

Qual LLM usar? Uma perspectiva do espaço Devai

Com o quão rápido as coisas estão se movendo no espaço Devai, uma abreviação para a comunidade de desenvolvedores que construíram software com a ajuda de grandes modelos de idiomas (LLMS), pode ser um desafio descobrir qual modelo usar.

Iniciamos esse repositório com base em nossas experiências como parte da comunidade Continuação. Sinta-se à vontade para sugerir melhorias e nos ajudar a mantê-lo atualizado ao abrir uma solicitação de tração!

Que LLMS existem?

Existem muitos LLMs. Decidimos nos concentrar nos que vemos as pessoas usando agora:

LLMS Gráfico

Você pode encontrar um CSV que inclua todos esses modelos e informações sobre eles aqui.

Quais LLMs estão sendo usados durante a codificação?

Como as pessoas decidem?

A primeira escolha que você normalmente faz é se você vai usar um modelo de código aberto ou comercial :

Você geralmente seleciona um LLM de código aberto quando deseja manter seu código em seu ambiente, tem memória disponível suficiente, deseja manter seus custos baixos ou deseja gerenciar e otimizar tudo de ponta a ponta.
Você geralmente seleciona um LLM comercial quando deseja o melhor modelo, prefere uma configuração fácil e confiável, não tem muita memória disponível, não se importe com o seu código deixando seu ambiente ou não é impedido por preocupações com custos.

Se você decidir usar um LLM de código aberto , sua próxima decisão é configurar o modelo em sua máquina local ou em um provedor de modelos hospedados:

Você geralmente opta por usar um LLM de código aberto em sua máquina local quando tiver memória disponível suficiente, deseja uso gratuito ou deseja usar o modelo sem precisar de uma conexão com a Internet.
Você geralmente opta por usar um LLM de código aberto em um provedor hospedado quando deseja o melhor modelo de código aberto, não tem muita memória disponível em sua máquina local ou deseja que o modelo sirva várias pessoas.

Mantemos um guia sobre como implantar um código de código aberto LLM para sua equipe aqui.

Se você decidir usar um LLM comercial , normalmente obterá teclas de API e brincar com vários delas para comparação. Tanto a qualidade das sugestões quanto o custo de uso podem ser critérios importantes.

Código aberto

Esta é uma lista dos LLMs de código aberto que os desenvolvedores estão usando durante a codificação, encomendados aproximadamente do mais popular e menos popular, em outubro de 2023.

1. Código llama

O Code Llama é um LLM treinado pela Meta para gerar e discutir código. Ele é construído sobre o LLAMA 2. Embora esteja abaixo do WizardCoder e Phind-Codellama no big code Models Liderond Ranking, é o modelo básico para os dois. Ele também vem em vários tamanhos: 7b, 13b e 34b, o que torna popular para usar em máquinas locais e também com fornecedores hospedados. Neste ponto, é o modelo básico de código aberto mais conhecido para codificar e está liderando o esforço de código aberto para criar LLMs capazes de codificar.

Detalhes

 Creator: Meta
Date released: August 24th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 34B

2. WizardCoder

O WizardCoder é um LLM construído sobre o Code Llama pela equipe Wizardlm. O método Evol-Instruct está adaptado para as tarefas de codificação para criar um conjunto de dados de treinamento, usado para ajustar a llama de código. Ele vem nos mesmos tamanhos que o Code Llama: 7b, 13b e 34b. Como resultado, é o LLM de instrução de código aberto mais popular até agora.

Detalhes

 Creator: WizardLM
Date released: August 26th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 7B, 13B, 34B

3. Phind-Codellama

Phind-Codellama é um LLM construído sobre o Code Llama por Phind. Um conjunto de dados proprietário de ~ 80k de problemas de programação e soluções de alta qualidade foi usado para ajustar o código de código. Esse modelo de ajuste fino foi ainda mais ajustado em 1,5b tokens adicionais. Atualmente, ele lidera o Big Code Models LeaderBond. No entanto, ele está disponível apenas como um modelo de parâmetros de 34b, portanto, requer mais memória disponível a ser usada.

Detalhes

 Creator: Phind
Date released: August 28th, 2023
License: Llama 2 Community
Base model: Code Llama
Parameters: 34B

4. Mistral

Mistral é um parâmetro 7b LLM treinado por Mistal AI. É o modelo mais recentemente lançado nesta lista, tendo caído no final de setembro. A IA Mistal diz que "aborda o desempenho do Codellama 7B no código, mantendo -se bem em tarefas em inglês". Apesar de estar disponível apenas em um pequeno tamanho, as pessoas estão bastante empolgadas com isso nas primeiras duas semanas após o lançamento. Os primeiros LLMs ajustados que o usam como base estão começando a surgir, e é provável que vejamos mais daqui para frente.

Detalhes

 Creator: Mistral AI
Date released: September 27th, 2023
License: Apache 2.0
Base model: Mistral
Parameters: 7B

5. Starcoder

O StarCoder é um parâmetro 15b LLM treinado pelo BigCode, que estava à frente de seu tempo quando foi lançado em maio. Foi treinado em mais de 80 linguagens de programação da pilha (v1.2) com solicitações de opção excluídas. Não é um modelo de instrução e comandos como "Escreva uma função que calcule a raiz quadrada" não funciona bem. No entanto, ao usar o prompt de assistente de tecnologia, você pode torná -lo mais útil.

Detalhes

 Creator: BigCode
Date released: May 4th, 2023
License: OpenRAIL-M
Base model: StarCoder
Parameters: 15B

6. Deepseek Coder

O Deepseek Coder é um LLM treinado pela Deepseek AI em 2 trilhões de tokens. Com um conjunto de dados composto por mais de 80 linguagens de programação, é o modelo mais recente desta lista e foi relatado que obteve uma pontuação bastante alta em vários benchmarks relacionados à codificação.

Detalhes

 Creator: DeepSeek AI
Date released: November 3rd, 2023
License: DeepSeek License Agreement
Base model: DeepSeek Coder
Parameters: 1.3B, 6.7B, 33B

7. llama2

Llama 2 é um LLM treinado por meta em 2 trilhões de tokens. É o LLM de código aberto mais popular em geral; portanto, alguns desenvolvedores o usam, apesar de não ser tão bom quanto muitos dos modelos acima em fazer edições de código. Também é importante porque o Code Llama, o LLM mais popular para codificação, é construído sobre ele, que por sua vez é a base para WizardCoder e Phind-Codellama.

Detalhes

 Creator: Meta
Date released: July 18th, 2023
License: Llama 2 Community
Base model: Llama 2
Parameters: 7B, 13B, 70B

Comercial

Esta é uma lista dos LLMs comerciais que os desenvolvedores estão usando durante a codificação, encomendados aproximadamente do mais popular e menos popular, em outubro de 2023.

1. GPT-4

O GPT-4 do OpenAI é geralmente considerado o melhor LLM a ser usado durante a codificação. É bastante útil ao gerar e discutir o código. No entanto, exige que você envie seu código para o OpenAI por meio da API e pode ser bastante caro. No entanto, é o LLM mais popular para codificar em geral e a maioria dos desenvolvedores o usa enquanto codifica neste momento. Todos os usuários da API OpenAI que fizeram um pagamento bem-sucedido de US $ 1 ou mais antes de 6 de julho de 2023 tiveram acesso ao GPT-4 e planejam abrir o acesso a todos os desenvolvedores em breve.

2. GPT-4 Turbo

O GPT-4 Turbo do Openai é mais barato e mais rápido que o GPT-4. Possui corte de conhecimento de abril de 2023 e tem uma janela de contexto de 128k. Atualmente, ele está em pré-visualização, em novembro de 2023, mas qualquer pessoa com uma conta da API OpenAI e acesso GPT-4 existente pode usá-lo.

3. GPT-3.5 Turbo

O GPT-3.5 Turbo do OpenAI é mais barato e mais rápido que o GPT-4; No entanto, suas sugestões não são tão úteis. Também exige que você envie seu código para o OpenAI por meio da API. É o segundo LLM mais popular para codificar em geral até agora. Todos os desenvolvedores podem usá -lo agora depois de se inscrever para uma conta OpenAI.

4. Claude 2

Claude 2 é um LLM treinado pela Anthrópica, que melhorou bastante as habilidades de codificação em comparação com a primeira versão de Claude. Ele se destaca especialmente, em relação a outros LLMs, quando você fornece muito contexto. Requer que você envie seu código para a ANTROPA através da API. Você deve se inscrever para obter acesso ao Claude 2 neste momento.

5. Palm 2

Palm 2 é um LLM treinado pelo Google. Para experimentá -lo, você deve enviar seu código para o Google através da API PALM após obter uma chave da API via Makersuite, ambos atualmente em visualização pública.

Contribuindo

Se você vê um modelo ausente ou deseja compartilhar uma opinião, recebemos você para abrir um PR ou um problema! Esperamos manter um índice orientado à comunidade e atualizado dos modelos de idiomas mais úteis para codificar.

Se você gostou desta postagem do blog e deseja ler mais sobre Devai - a comunidade de pessoas que construíram software com a ajuda do LLMS - no futuro, junte -se ao nosso boletim mensal aqui.

Expandir

Informações adicionais