Marcus Hutter, líder no campo da inteligência artificial geral, e Xuan Xiaohua, fundador da Tecnologia de Computação de Huayuan, em uma entrevista, discutiu em profundidade as tendências de desenvolvimento e os possíveis impactos de grandes modelos de idiomas. Eles apontaram que o modelo de idioma grande deve realizar 50% das tarefas de trabalho humano no futuro, e essa previsão desencadeou um pensamento generalizado no setor sobre os futuros cenários de trabalho. No entanto, eles também enfatizaram que a realização desse objetivo enfrenta muitos desafios, incluindo controle de custos, melhoria dos recursos de raciocínio e a precisão da rotulagem de dados.
Ao discutir o controle de custos de grandes modelos, Hutter e Xuan Xiaohua apontaram que, embora os grandes modelos de linguagem tenham feito progresso tecnológico significativo, seus altos custos de treinamento e operacional ainda são os principais fatores que restringem seu uso generalizado. Para reduzir os custos, eles recomendam o desenvolvimento sustentável otimizando algoritmos, aumentando a eficiência de hardware e explorando métodos de treinamento mais econômicos. Além disso, eles também mencionaram que melhorar os recursos de raciocínio é a chave para garantir que o grande modelo funcione com eficiência em aplicações práticas.
A precisão da anotação de dados também é um desafio que não pode ser ignorado no desenvolvimento de grandes modelos. Hutter e Xuan Xiaohua enfatizaram que a anotação de dados de alta qualidade é a base do treinamento de modelos, mas nas operações reais, a precisão e a consistência da anotação de dados geralmente são difíceis de garantir. Para resolver esse problema, eles sugerem uma combinação de ferramentas de anotação automatizada e auditorias manuais para melhorar a qualidade e a eficiência da anotação de dados.
Em termos das tendências de desenvolvimento dos modelos de código aberto e de código fechado, Hutter e Xuan Xiaohua acreditam que os modelos de código aberto e os modelos de fonte fechada têm suas próprias vantagens. O modelo de código aberto é transparente e escalável, que pode atrair mais desenvolvedores e pesquisadores para participar e promover a rápida iteração da tecnologia; Eles prevêem que, no futuro, os modelos de código aberto e de código fechado se desenvolverão em paralelo em diferentes campos, cada um desempenhando seus papéis únicos.
Além disso, Hutter e Xuan Xiaohua também enfatizaram o potencial de aplicação de modelos grandes em campos verticais. Eles acreditam que a aplicação de grandes modelos em áreas específicas, como assistência médica, finanças e educação, trará mudanças revolucionárias. Ao desenvolver personalizados para as necessidades de indústrias específicas, os grandes modelos podem fornecer soluções mais precisas e eficientes, promovendo assim a transformação digital nessas indústrias.
No geral, as discussões de Hutter e Xuan Xiaohua fornecem informações profundas sobre o desenvolvimento do grande modelo. Apesar de muitos desafios, as perspectivas futuras de aplicativos de grandes modelos de idiomas ainda são amplas. Com o avanço contínuo da tecnologia e a redução gradual dos custos, espera-se que os grandes modelos obtenham seu enorme potencial em mais campos e tenham impactos de longo alcance na sociedade humana.