Tencent libère un nouveau brevet pour la formation d'un modèle grand langage pour améliorer la généralisation et la précision du modèle - Articles AI

Auteur：Eve Cole Date de mise à jour：2025-02-14 18:16:01

Avec le développement rapide de la technologie de l'intelligence artificielle, les grandes entreprises ont augmenté leur investissement en R&D et promu l'innovation technologique. Récemment, Tencent Technology (Shenzhen) Co., Ltd. a fait des progrès significatifs dans la formation de modèles de gros langues et a demandé et publié des brevets pertinents.

Récemment, Tencent Technology (Shenzhen) Co., Ltd. a annoncé un brevet sur la méthode de formation et l'équipement connexe de modèles de grande langue sur l'application Tianyancha. Le nom de ce brevet est "les méthodes de formation, les appareils, l'équipement informatique et les supports de stockage pour les modèles de grandes langues", et vise à améliorer la capacité d'apprentissage et la précision des modèles de grande langue grâce à des méthodes de formation innovantes.

Dans le processus de formation des modèles de grandes langues, les méthodes traditionnelles reposent souvent sur un seul résumé de texte, ce qui peut conduire à une sur-ajustement du modèle et à affecter la précision et la diversité du contenu généré. Cependant, la nouvelle approche de Tencent présente deux sources d'informations différentes: le premier texte abstrait et le deuxième texte abstrait. La quantité d'informations dans ces deux textes abstraites est différente, et le premier texte abstrait contient des déclarations correctes et fausses, formant la base de l'apprentissage comparatif.

Cette méthode d'apprentissage de contraste permet au modèle d'apprendre dans différents résumés du même texte. Cette méthode innovante améliore non seulement la capacité de généralisation du modèle et lui permet de mieux fonctionner lorsqu'il est confronté à des données inconnues, mais améliore également la précision du modèle et réduit la probabilité de générer un mauvais contenu.

Avec l'avancement continu de la technologie de l'intelligence artificielle, la portée de l'application des modèles de gros langues est devenue de plus en plus répandue, et un énorme potentiel a été montré dans des domaines tels que le traitement du langage naturel au service client intelligent à la création de contenu. L’annonce du brevet de Tencent marque une autre percée technologique dans le domaine de la formation de modèle de langage en grand et devrait fournir de nouvelles orientations pour les futures recherches et applications.

On peut prévoir que le développement ultérieur de cette technologie favorisera le progrès continu des applications intelligentes et aidera tous les horizons à mieux utiliser la commodité apportée par l'intelligence artificielle dans la transformation numérique.

En bref, l'avancement de la technologie de l'intelligence artificielle améliore non seulement l'efficacité des applications existantes, mais jette également une base solide pour le développement futur.