O modelo grande KwaiYii, o nome chinês do KwaiYii é modelo grande Kuaiyi, é um grande modelo de previsão Kuaishou que iniciou recentemente os testes internos. Os usuários que desejam experimentá-lo antecipadamente podem solicitar qualificações de teste interno. experimente mais conteúdo.
A equipe Kuaishou AI continuará a iterar o grande modelo "Ruyi". Por um lado, continuará a otimizar o desempenho do modelo e a desenvolver capacidades multimodais. Por outro lado, também promoverá a implementação de mais C-side. e cenários de negócios do lado B. O grande modelo "KwaiYii" desenvolvido pela própria Kuaishou foi revelado, ficando em primeiro lugar no CMMLU chinês.
KwaiYii é uma série de modelos de linguagem de grande escala (LLM) desenvolvidos de forma independente pela equipe Kuaishou AI a partir do zero. Atualmente inclui modelos de vários tamanhos de parâmetros e abrange modelos pré-treinados (KwaiYii -Base), modelo de diálogo (KwaiYii-Chat). . Aqui apresentamos o modelo da série em escala 13B KwaiYii-13B. Suas principais características incluem.
O modelo pré-treinado KwaiYii-13B-Base possui excelentes capacidades de base técnica geral e alcançou o efeito de última geração sob o mesmo tamanho de modelo na maioria dos benchmarks chineses/ingleses confiáveis. Por exemplo, o modelo pré-treinado KwaiYii-13B-Base está atualmente no nível líder do mesmo tamanho de modelo em MMLU, CMMLU, C-Eval, HumanEval e outros benchmarks.
O modelo de diálogo KwaiYii-13B-Chat possui excelentes capacidades de compreensão e geração de linguagem, suportando uma ampla gama de tarefas como criação de conteúdo, consulta de informações, lógica matemática, escrita de código, conversas multi-rodadas, etc. O 13B-Chat excede os modelos convencionais de código aberto e está próximo do mesmo nível do ChatGPT (3.5) na criação de conteúdo, consulta de informações e resolução de problemas matemáticos.