DeepSeek lançou recentemente seu novo modelo de código aberto DeepSeek-Coder-V2, que supera o GPT-4-Turbo em termos de código e capacidades matemáticas e melhora significativamente o suporte multilíngue e o comprimento do processamento de contexto. Ele adota uma arquitetura Mix of Experts (MoE) e é especificamente otimizado para geração de código e recursos de raciocínio matemático. Seu desempenho está entre os melhores do mundo e oferece duas opções de escala de parâmetros 236B e parâmetros 16B para atender a diferentes necessidades de aplicação. Todos os códigos, artigos e modelos são de código aberto e podem ser usados comercialmente gratuitamente, sem aplicativo.
Página inicial do webmaster (ChinaZ.com) Notícias em 18 de junho: DeepSeek anunciou recentemente o lançamento de um modelo de código aberto chamado DeepSeek-Coder-V2, que supera o GPT-4-Turbo em termos de código e capacidades matemáticas e foi significativamente expandido em. suporte multilíngue e comprimento de processamento de contexto. Com base na estrutura do modelo do DeepSeek-V2, o DeepSeek-Coder-V2 adota uma arquitetura Mix of Experts (MoE) projetada especificamente para aprimorar as capacidades de código e raciocínio matemático.
O desempenho do DeepSeek-Coder-V2 está entre os melhores do mundo, e sua geração de código e capacidades aritméticas matemáticas são particularmente notáveis. Este modelo e seus códigos e documentos relacionados são todos de código aberto e estão disponíveis para uso comercial gratuito sem aplicativo. O modelo está disponível em dois tamanhos: parâmetros 236B e parâmetros 16B para atender a diferentes necessidades de aplicação.

Em termos de suporte multilíngue, as linguagens de programação que o DeepSeek-Coder-V2 pode suportar foram ampliadas de 86 para 338, adaptando-se às mais diversas necessidades de desenvolvimento. Ao mesmo tempo, o comprimento do contexto suportado foi expandido de 16K para 128K, permitindo lidar com conteúdos de entrada mais longos. DeepSeek-Coder-V2 também fornece serviços de API, suporta contexto de 32K e o preço é o mesmo do DeepSeek-V2.
Em testes de benchmark padrão, o DeepSeek-Coder-V2 supera alguns modelos de código fechado em geração de código, conclusão de código, reparo de código e raciocínio matemático. Os usuários podem baixar diferentes versões do modelo DeepSeek-Coder-V2, incluindo versão básica e versão de instrução, bem como versões com diferentes escalas de parâmetros.
DeepSeek também fornece uma plataforma de experiência online e links GitHub, bem como relatórios técnicos, para facilitar aos usuários uma melhor compreensão e uso do DeepSeek-Coder-V2. O lançamento deste modelo não só traz códigos poderosos e capacidades de processamento matemático para a comunidade de código aberto, mas também ajuda a promover o desenvolvimento e a aplicação de tecnologias relacionadas.
Endereço do projeto: https://top.aibase.com/tool/deepseek-coder-v2
Experiência online: https://chat.deepseek.com/sign_in
O lançamento de código aberto do DeepSeek-Coder-V2 fornece aos desenvolvedores ferramentas poderosas e marca um avanço significativo na tecnologia de modelos grandes de código aberto. Seu uso comercial gratuito e plataforma de experiência on-line conveniente promoverão ainda mais a popularização e aplicação da tecnologia de inteligência artificial, e vale a pena aguardar com expectativa seu desenvolvimento e aplicação futuros.