Недавно Tencent Technology (Shenzhen) Co., Ltd. подала заявку на патент под названием «Методы обучения, устройства, компьютерное оборудование и носители для хранения для больших языковых моделей». Этот патент предоставляет более обучаемую информацию для модели во время обучения модели большого языка, введя первый абстрактный текст и второй абстрактный текст.

Согласно описанию патента, первый абстрактный текст и второй абстрактный текст содержат различные объемы информации, а первый абстрактный текст также содержит правильные операторы и неправильные операторы. Сравнивая и изучая эти два разных тезиса одного и того же текста и различая правильные утверждения и неправильные утверждения в них, мы можем эффективно избежать возможных проблем, таких как переизбытка модели и неточная генерация, вызванная единственным сводным текстом.

Инновация этого метода заключается в том, что он улучшает производительность обобщения модели и эффективно повышает точность модели. Внедряя разнообразный абстрактный текстовый контент, метод обучения Tencent принес более эффективные и точные улучшения в процесс обучения крупных языковых моделей.
Этот прогресс не только отражает техническую силу Tencent в области искусственного интеллекта, но и закладывает прочную основу для применения и разработки крупных языковых моделей в будущем.