Marcus Hutter, líder en el campo de la inteligencia artificial general, y Xuan Xiaohua, fundador de la tecnología informática de Huayuan, en una entrevista, discutieron en profundidad las tendencias de desarrollo y los impactos potenciales de los grandes modelos de idiomas. Señalaron que se espera que el modelo de lenguaje grande realice el 50% de las tareas de trabajo humano en el futuro, y esta predicción ha provocado un pensamiento generalizado en la industria sobre escenarios de trabajo futuros. Sin embargo, también enfatizaron que la realización de este objetivo enfrenta muchos desafíos, incluido el control de costos, la mejora de las capacidades de razonamiento y la precisión del etiquetado de datos.
Al discutir el control de costos de los modelos grandes, Hutter y Xuan Xiaohua señalaron que, aunque los modelos de idiomas grandes han hecho un progreso tecnológico significativo, sus altos costos de capacitación y operación siguen siendo los principales factores que restringen su uso generalizado. Para reducir los costos, recomiendan el desarrollo sostenible optimizando los algoritmos, aumentando la eficiencia del hardware y explorando más métodos de capacitación económica. Además, también mencionaron que mejorar las capacidades de razonamiento es la clave para garantizar que el modelo grande funcione de manera eficiente en aplicaciones prácticas.
La precisión de la anotación de datos también es un desafío que no se puede ignorar en el desarrollo de grandes modelos. Hutter y Xuan Xiaohua enfatizaron que la anotación de datos de alta calidad es la base del entrenamiento de modelos, pero en las operaciones reales, la precisión y consistencia de la anotación de datos a menudo son difíciles de garantizar. Para resolver este problema, sugieren una combinación de herramientas de anotación automatizadas y auditorías manuales para mejorar la calidad y la eficiencia de la anotación de datos.
En términos de las tendencias de desarrollo de los modelos de código abierto y de código cerrado, Hutter y Xuan Xiaohua creen que los modelos de código abierto y los modelos de código cerrado tienen sus propias ventajas. El modelo de código abierto es transparente y escalable, lo que puede atraer a más desarrolladores e investigadores para participar y promover la rápida iteración de la tecnología; Predicen que en el futuro, los modelos de código abierto y de código cerrado se desarrollarán en paralelo en diferentes campos, cada uno desempeñando sus roles únicos.
Además, Hutter y Xuan Xiaohua también enfatizaron el potencial de aplicación de grandes modelos en campos verticales. Creen que la aplicación de grandes modelos en campos específicos como la atención médica, las finanzas y la educación provocará cambios revolucionarios. Mediante la experiencia personalizada de las necesidades de industrias específicas, los modelos grandes pueden proporcionar soluciones más precisas y eficientes, promoviendo así la transformación digital en estas industrias.
En general, las discusiones de Hutter y Xuan Xiaohua proporcionan profundas ideas sobre el desarrollo del gran modelo. A pesar de muchos desafíos, las perspectivas de aplicaciones futuras de los grandes modelos de idiomas siguen siendo amplios. Con el avance continuo de la tecnología y la reducción gradual de los costos, se espera que los grandes modelos se den cuenta de su gran potencial en más campos y tengan impactos de largo alcance en la sociedad humana.