騰訊申請“大語言模型訓練方法”專利，提升模型泛化能力與準確性- AI文章

作者：Eve Cole 更新時間：2025-02-14 17:16:01

近日，騰訊科技（深圳）有限公司申請了一項名為“大語言模型的訓練方法、裝置、計算機設備及存儲介質”的專利。這項專利通過引入第一摘要文本和第二摘要文本，在大語言模型的訓練過程中為模型提供更多可學習的信息。

根據專利描述，第一摘要文本和第二摘要文本所包含的信息量不同，其中第一摘要文本中還包含了正確語句和錯誤語句。通過對同一文本的這兩個不同摘要進行對比學習，並區分學習其中的正確語句與錯誤語句，能夠有效避免摘要文本單一可能導致的模型過擬合和生成不准確等問題。

腾讯 (2)

該方法的創新之處在於提升了模型的泛化性能，並有效提高了模型的準確性。通過引入多樣化的摘要文本內容，騰訊的這一訓練方法為大語言模型的訓練過程帶來了更高效、更精準的提升。

這一進展不僅體現了騰訊在人工智能領域的技術實力，也為未來大語言模型的應用和發展奠定了堅實的基礎。