Deepseek-V3-0324 Lançado silenciosamente: a atualização discreta no círculo tecnológico-artigo da AI

Autor：Eve Cole Data da Última Atualização：2025-05-22 01:50:02

2025 Binance Direct

Em 24 de março de 2025, a Deepseek, uma instituição de pesquisa de inteligência artificial chinesa, divulgou a versão mais recente de seu principal modelo de linguagem-Deepseek-V3-0324 na plataforma de face Hugging sem qualquer visualização. Essa atualização "discreta e forte" rapidamente provocou discussões acaloradas na comunidade de tecnologia, e muitos desenvolvedores e entusiastas da IA compartilharam sua experiência e expectativas iniciais. A seguir, é apresentado um relatório aprofundado compilado com base no feedback da comunidade de tecnologia.

1. Lançamento misterioso: os 68,5 bilhões de parâmetros gigantescos revelados em silêncio

Deepseek mantém um estilo consistente de discreta discreta. De acordo com a comunidade de tecnologia, o novo modelo foi silenciosamente ao vivo em abraçar o rosto no início da manhã de 24 de março, sem nenhum anúncio oficial ou coletiva de imprensa. A nova versão atingiu 68,5 bilhões de parâmetros, enquanto o documento técnico Deepseek-V3 divulgado em dezembro do ano passado é de 67,1 bilhões de parâmetros. Essa diferença provocou especulações sobre possíveis ajustes arquitetônicos. Embora o funcionário não tenha divulgado parâmetros técnicos detalhados, esse "ataque repentino" é suficiente para excitar a comunidade.

Várias mensagens confirmaram que o DeepSeek notificou apenas a atualização por meio de uma mensagem de grupo, indicando que o modelo foi de origem aberta para abraçar o rosto para download gratuito por todos. O relatório também apontou que as plataformas de terceiros rapidamente forneceram suporte à API, demonstrando a rápida resposta da comunidade a novos modelos.

2. Performance Leap: Melhoria significativa nos recursos de matemática e programação

O destaque central desta atualização é a melhoria significativa no desempenho. Embora a empresa o posicionasse como uma "atualização da versão pequena", os testes preliminares mostraram melhorias significativas nos recursos matemáticos e no design do front-end. Vários revisores técnicos relataram que os recursos de programação do modelo foram bastante aprimorados, perto do nível de Claude 3.5. Alguns revisores compartilharam imagens de amostra geradas pelo V3-0324, dizendo que o efeito inicial foi "muito bom".

Além disso, o feedback inicial também sugere que, além de melhorias nas tarefas técnicas, o novo modelo pode fornecer uma experiência de conversação mais humanizada. No entanto, como os dados de referência não foram divulgados pelas autoridades, essas avaliações preliminares precisam de mais verificação.

3. Novo atitude de código aberto: a comunidade respondeu com entusiasmo sob o protocolo do MIT

Ao contrário das versões anteriores, o DeepSeek-V3-0324 adota um protocolo de código aberto mais relaxado do MIT, uma mudança que é amplamente considerada como um desenvolvimento positivo. Os comentaristas de tecnologia apontaram que, além de um aprimoramento significativo nos recursos de programação, o modelo também adota um protocolo de código aberto mais aberto. O modelo está agora disponível na plataforma de código aberto com um volume de parâmetros de 68,5 bilhões, refletindo a atitude cada vez mais aberta de Deepseek em relação à comunidade de código aberto.

A resposta calorosa da seção de comentários de rosto abraçada verifica essa observação. As vantagens duplas da melhoria de código aberto e desempenho tornam o DeepSeek-V3-0324 considerado um potencial trocador da indústria e pode desafiar o status de modelos de código fechado, como o OpenAI GPT-4O ou o antropal Claude 3,5 sonetos.

4. Experiência do usuário: mudança perfeita do site oficial para API

A plataforma OpenRouter abriu a interface da API

Deepseek também otimizou a experiência do usuário nesta atualização. De acordo com relatórios técnicos, os usuários precisam apenas desativar a função de "pensamento profundo" no site oficial para usar diretamente a versão V3-0324, enquanto a interface da API e os métodos de uso permanecem inalterados. Esse design de comutação contínuo reduz o limite para uso e foi bem recebido pela comunidade.

O relatório também apontou que as plataformas de terceiros forneceram acesso à API, demonstrando a rápida adaptabilidade do ecossistema.

5. Perspectivas futuras: Prelúdio para R2?

Embora marcado como uma "atualização da versão pequena", o impacto desta atualização está muito além das expectativas. Muitos na comunidade tecnológica especulam se isso abre o caminho para os próximos Deepseek-R2. Anteriormente, o modelo R1 da Deepseek competia com o modelo O1 do OpenAI em raciocínio lógico e tarefas matemáticas, e a liberação da V3-0324 era considerada a base técnica para o acúmulo de modelos de inferência de próxima geração. Embora o Deepseek não tenha confirmado a data de lançamento específica para o R2, as expectativas da comunidade estão claramente esquentando.

6. Resumo: o forte aumento de discreto

O lançamento do Deepseek-V3-0324 continua o estilo usual da empresa: lançamentos discretos e excelente desempenho. Desde a escala de 68,5 bilhões de parâmetros, até a melhoria significativa nos recursos matemáticos e de programação, até a estratégia de código aberto do protocolo MIT, esse modelo injetou, sem dúvida, uma nova vitalidade no campo da IA. Como um revisor técnico descreveu: "A superfície é discreta, mas na verdade é tão poderosa quanto um tigre". Mesmo antes dos detalhes técnicos serem totalmente divulgados, desenvolvedores e pesquisadores estavam ansiosos para entrar no teste para tentar explorar todo o potencial desse "besta silenciosa".

Com mais resultados de revisão divulgados, se Deepseek-V3-0324 pode realmente abalar a paisagem de IA existente continua sendo um foco de atenção nas próximas semanas. Certamente, a Deepseek está se movendo constantemente na competição global de IA de maneira única.