Le développement rapide de l’IA générative, en particulier de la série de modèles GPT, a ouvert de nouvelles possibilités dans de nombreux domaines. De l’amélioration significative des résultats aux examens du barreau à son application dans le domaine des affaires, GPT-4 a démontré ses puissantes capacités. Cependant, certains experts de l'industrie ont remis en question la capacité de compréhension et la fiabilité de l'IA générative actuelle, estimant que sa capacité de raisonnement et sa compréhension du monde sont encore insuffisantes et que le développement futur est encore confronté à de nombreux défis. L'éditeur de Downcodes vous amènera à explorer en profondeur l'orientation future du développement de l'IA générative, ainsi que les opportunités et les défis auxquels est confrontée l'industrie nationale de l'IA générative.
Où est l’orientation future du développement de l’IA générative ?
Il est indéniable que le GPT-4 actuel a été considérablement amélioré dans de nombreuses capacités. Par rapport au GPT-3.5, les performances du GPT-4 dans des domaines professionnels complexes ont été considérablement améliorées et sa capacité de raisonnement logique est également plus forte lors de l'examen de qualification du barreau américain, le score du GPT-4 peut atteindre les 10 % supérieurs, mais le GPT-4. 3,5 ne peut atteindre que le niveau inférieur de 10 %.

Source de l'image : IA ouverte
L'amélioration substantielle des capacités permet également à Chat GPT d'ouvrir davantage de scénarios d'utilisation. À l'heure actuelle, Open AI propose officiellement plusieurs scénarios d'application majeurs, tels que l'ajout de l'IA à Duolingo pour discuter quotidiennement avec les utilisateurs afin d'accélérer l'apprentissage des langues des utilisateurs ; Morgan Stanley utilise GPT-4 pour gérer sa base de connaissances afin d'aider les employés à accéder rapidement au le contenu que vous souhaitez.
Cependant, de nombreux grands noms ont des doutes sur les capacités actuelles de GPT. Stuart Russell a souligné dans son discours que Chat GPT et GPT-4 ne comprennent pas le monde et ne « répondent » pas non plus aux questions. Le grand modèle de langage actuel n'est qu'une pièce du puzzle et ce qui manque actuellement dans ce puzzle. à quoi cela ressemblera finalement, ceux-ci sont incertains. De nombreuses lacunes en termes de capacités déterminent également qu’il reste encore un long chemin à parcourir pour développer l’intelligence artificielle générale. En raison de divers doutes sur les capacités de GPT-4, Stuart Russell modifiait également le PPT lors du discours de Sam Altman.

Source de l'image : Conférence de sagesse
Yang Likun, lauréat du prix Turing, l'un des « trois grands du Deep Learning » et scientifique en chef de l'intelligence artificielle chez Meta, partage également le même point de vue que Stuart Russell. Il estime que le modèle autorégressif actuel du GPT manque de planification, ce qui entraîne un manque de planification. sa capacité de raisonnement n'est actuellement pas possible. Si un grand modèle de langage basé sur la probabilité est généré, il est essentiellement impossible de résoudre le problème des erreurs. Lorsque le texte saisi augmente, la probabilité d'erreurs augmentera également de façon exponentielle.
En fait, les accusations des deux grands contre GPT ne sont pas déraisonnables. Parce que l'algorithme RLHF utilisé par Chat GPT repose lui-même sur la perception humaine, il permet au modèle de juger de la qualité de ses propres réponses et de s'entraîner à donner progressivement des réponses de meilleure qualité. Si vous souhaitez améliorer la capacité de raisonnement du modèle, vous devez compléter un grand nombre de paramètres dans la base de données et itérer en permanence l'algorithme.

Source : Valeurs mobilières du Sud-Ouest
Cependant, l’existence de divers risques empêche également de nombreuses entreprises d’IA générative de s’y essayer facilement. Si l’IA générative peut atteindre la même capacité de raisonnement d’histoire et la même capacité de création d’émotions de personnage qu’un écrivain de roman, cela rendra-t-il l’IA générative complètement hors du contrôle humain ? Même si cela provoque une panique mondiale, cela se heurtera-t-il également à une forte supervision de la part des gouvernements locaux, rendant vains les investissements antérieurs dans l’IA générative ?
Concernant l’orientation future du développement de l’IA générative, la réponse de Yang Likun est un modèle mondial. Ce modèle mondial n'est pas seulement un modèle qui imite le cerveau humain au niveau neuronal, mais aussi un modèle mondial qui s'adapte complètement aux partitions du cerveau humain en termes de modules cognitifs. La plus grande différence entre lui et le grand modèle de langage est qu'il peut le faire. avoir des capacités de planification et de prévision (modèle mondial) et des capacités de calcul des coûts (module de coûts).
Avec l'aide du modèle mondial, nous pouvons mieux comprendre le monde et prédire et planifier l'avenir grâce au module de comptabilité analytique, combiné à une demande simple (l'avenir doit être planifié selon la logique qui permet d'économiser le plus de coûts d'action), cela peut éliminer tous les poisons potentiels et les conséquences inutiles.

Source de l'image : Conférence de sagesse
Mais le problème réside dans les paramètres, les algorithmes, les coûts, etc. du modèle mondial lors de la formation. Yang Likun a simplement donné quelques idées stratégiques. Par exemple, utiliser des modèles auto-supervisés pour former et établir des modèles de pensée à plusieurs niveaux, etc., mais Yang Likun n'a pas été en mesure de donner un plan complet sur la façon de le mettre en œuvre.
D’autres participants n’ont pas partagé leur point de vue sur l’orientation future du développement de l’IA générative. Par conséquent, l’IA générative ultérieure maintiendra toujours une situation dans laquelle chaque entreprise « fait ce qu’elle veut », et l’IA générative unifiée à l’échelle mondiale ne pourra rester qu’au stade du laboratoire.
03. Prédiction de l'IA générative nationale
Le professeur Huang Tiejun, président de l'Institut de recherche Zhiyuan, a déclaré dans une interview avec les médias après la réunion que le problème actuel avec les grands modèles nationaux d'IA générative est que l'industrie est en surchauffe, mais les données de formation sont trop petites et les dizaines de milliards des modèles viennent tout juste d’émerger. Bien qu'il existe certaines capacités techniques parmi eux, en raison d'efforts répétitifs, alors que les ressources de l'industrie sont de plus en plus dispersées, il existe encore un certain écart entre leur niveau d'intelligence et les grands modèles d'IA générative étrangers.
Comme l'a dit le professeur Huang Tiejun, prenons comme exemple le grand modèle « Tongyi Qianwen » appartenant à Alibaba, car les données utilisées pour former ce grand modèle sont un grand nombre de conversations chinoises et de conversations extraites de Taobao, Alipay, Tmall et d'autres industries d'Alibaba. . La quantité de données de pré-entraînement pour les données texte, ainsi que les données texte provenant d'autres sources, est d'environ 200 milliards de mots, ce qui équivaut à 14 To de données texte.
Le volume de données de formation de Chat GPT est d'environ 4,5 milliards de mots, ce qui équivaut à 300 Go de données texte. Les données de formation sont relativement petites, de sorte que le « Tongyi Qianwen » d'Alibaba manque également de capacités multimodales. En termes de texte, les deux sont loin derrière GPT-4.
Selon les données du « Rapport d'évaluation complet des capacités des grands modèles linguistiques 2023 » publié par le centre de recherche InfoQ, Chat GPT est actuellement en tête des autres fabricants nationaux de grands modèles avec un score global de 77,13 %.

Source : « Rapport d'évaluation complète des capacités du grand modèle linguistique 2023 »
Dans le même temps, le professeur Huang Tiejun a également souligné que les grands modèles d'aujourd'hui sont un produit intermédiaire de l'itération technologique. Avec le développement ultérieur de l'industrie nationale des grands modèles, le nombre raisonnable d'écosystèmes de grands modèles qui peuvent survivre à l'avenir est d'environ trois. .
Comme l'a dit le professeur Huang Tiejun, Ma Huateng a souligné lors d'une réunion de haut niveau au sein de Tencent que les dividendes du marché C-end disparaîtront au cours des dix prochaines années. Tout l'espoir réside dans le marché ToB et dans le second semestre. de l'Internet appartient à l'Internet industriel. L'Ali Business Research Institute a déjà souligné que les dix prochaines années seraient une opportunité en or pour la transformation des entreprises traditionnelles.
Cependant, du point de vue du marché ToB, en prenant comme référence le marché SaaS qui se développe depuis de nombreuses années, si un grand modèle veut véritablement ouvrir le marché ToB, son noyau doit être d'apporter la valeur de « réduction des coûts et "augmentation de l'efficacité" pour les clients, en particulier dans l'ère actuelle d'incertitude. Cela est particulièrement vrai lorsque quelques industries restent encore à l'écart des grands modèles. Principalement basés sur les industries manufacturières traditionnelles, les problèmes courants rencontrés actuellement par les petites et moyennes industries manufacturières traditionnelles sont la réduction des commandes, l'industrie se bat dans des guerres de prix et les cycles de collecte des paiements en aval sont devenus plus longs. Les industries ont actuellement du mal à subvenir à leurs besoins. Afin d'éviter des coûts d'essais et d'erreurs élevés, de nombreuses petites et moyennes entreprises manufacturières n'osent naturellement pas essayer facilement l'utilisation de grands modèles.
Et à en juger par l’histoire du développement de l’industrie SaaS, l’industrie SaaS nationale a connu un pic de croissance en 2015 après avoir connu 10 années de calme depuis début 2004. Depuis le début de l'épidémie en 2020, l'épidémie a accéléré la transformation numérique des entreprises et le marché national du SaaS est entré dans une période de croissance critique. Mais même ainsi, l’écosystème actuel de l’industrie SaaS nationale n’est pas encore complet et le marché n’est pas encore mature.
Source de l'image : Flash Cloud
Évidemment, l’ouverture du marché TOB aux grands modèles ne se fait pas du jour au lendemain, mais est un processus extrêmement lent. De plus, les coûts induits par les algorithmes, la puissance de calcul et les données lors de l'itération du modèle, y compris le lancement ultérieur de diverses fonctions, obligent les grandes entreprises modèles à investir en permanence des sommes importantes.
La commercialisation prend du temps, les investissements en capital sont élevés et il est difficile de réaliser des bénéfices à court terme. À l'avenir, les entreprises qui manquent de liquidités n'auront d'autre choix que de fermer leurs propres grands modèles face à la pression financière. , et les ressources de l'industrie deviendront encore plus difficiles à concentrer sur les fabricants de modèles à grosse tête.
À en juger par l'expérience de nombreux secteurs tels que les services de covoiturage en ligne et la livraison de nourriture, après de nombreuses années de troubles dans un secteur émergent, seules trois entreprises environ peuvent réellement se développer à l'avenir, et de nombreuses autres entreprises ont été submergées dans l'histoire. longue rivière.
Dans l’ensemble, l’IA générative se trouve dans une phase de développement rapide, avec à la fois des opportunités et des défis. À l’avenir, les modèles mondiaux pourraient devenir une direction de développement importante, mais leur mise en œuvre se heurte encore à de nombreux problèmes techniques et commerciaux. L’industrie nationale de l’IA générative doit également résoudre des problèmes tels que l’échelle des données et la commercialisation afin de se démarquer dans une concurrence féroce. L'éditeur de Downcodes continuera à prêter attention aux tendances dans ce domaine et à proposer un contenu plus passionnant aux lecteurs.