เมื่อเร็วๆ นี้ Tencent ได้เปิดตัว Xingmai Network 2.0 ซึ่งเป็นการอัพเกรดที่ช่วยปรับปรุงประสิทธิภาพการฝึกอบรมโมเดลปัญญาประดิษฐ์ขนาดใหญ่อย่างมีนัยสำคัญ มีความก้าวหน้าอย่างก้าวกระโดดในด้านขนาดเครือข่าย ประสิทธิภาพของฮาร์ดแวร์ โปรโตคอลการสื่อสาร และการวินิจฉัยข้อผิดพลาด ซึ่งวางรากฐานที่มั่นคงสำหรับการฝึกโมเดล AI ในสเกลที่ใหญ่ขึ้นในอนาคต การอัพเกรดนี้ไม่เพียงแต่รองรับการ์ดเครือข่าย 100,000 การ์ดในคลัสเตอร์เดียว แต่ยังเพิ่มความจุสวิตช์และความเร็วของโมดูลออปติคัลซิลิคอนเป็นสองเท่าในแง่ของฮาร์ดแวร์ นอกจากนี้ ยังมาพร้อมกับการ์ดเครือข่ายพลังประมวลผลที่พัฒนาขึ้นเอง และแบนด์วิธการสื่อสารก็เข้าถึงอุตสาหกรรมได้ -ระดับชั้นนำ สิ่งที่น่าสังเกตมากกว่านั้นก็คือ การใช้โปรโตคอล TiTa2.0 ใหม่และไลบรารีการสื่อสารแบบรวม TCCL2.0 ได้เพิ่มประสิทธิภาพการสื่อสารขึ้น 60% และประสิทธิภาพการฝึกโมเดลขนาดใหญ่ขึ้น 20%
เป็นที่เข้าใจกันว่าในแง่ของขนาดเครือข่าย Xingmai Network 2.0 รองรับคลัสเตอร์เดียวที่มีการ์ด 100,000 ใบ ซึ่งให้การสนับสนุนโครงสร้างพื้นฐานที่แข็งแกร่งสำหรับการฝึกอบรม AI ขนาดใหญ่ ส่วนขยายนี้วางรากฐานสำหรับการฝึกโมเดล AI ในสเกลที่ใหญ่ขึ้นในอนาคต

ในแง่ของการอัพเกรดฮาร์ดแวร์ ความจุของสวิตช์ที่ Tencent พัฒนาขึ้นเองได้เพิ่มขึ้นจาก 25.6T เป็น 51.2T ซึ่งเพิ่มความจุเป็นสองเท่า ในเวลาเดียวกัน อัตราของโมดูลออปติคอลซิลิคอนที่พัฒนาตนเองได้รับการอัพเกรดจาก 200G เป็น 400G และอัตราก็เพิ่มขึ้นสองเท่าเช่นกัน เวอร์ชันใหม่ยังมาพร้อมกับการ์ดเครือข่ายพลังประมวลผลที่พัฒนาขึ้นเอง ซึ่งทำให้แบนด์วิธการสื่อสารของเครื่องทั้งหมดอยู่ที่ 3.2T ซึ่งครองอันดับหนึ่งในอุตสาหกรรม การอัพเกรดฮาร์ดแวร์เหล่านี้ถือเป็นรากฐานที่มั่นคงสำหรับการปรับปรุงประสิทธิภาพเครือข่ายที่สำคัญ
ในแง่ของโปรโตคอลการสื่อสาร Tencent ได้เปิดตัวโปรโตคอล TiTa2.0 ใหม่ และตำแหน่งการติดตั้งได้ย้ายจากสวิตช์ไปยังการ์ดเครือข่าย ในเวลาเดียวกัน อัลกอริธึมความแออัดยังได้รับการอัปเกรดเป็นอัลกอริธึมควบคุมความแออัดที่ใช้งานอยู่อีกด้วย การเพิ่มประสิทธิภาพเหล่านี้เพิ่มประสิทธิภาพการสื่อสาร 30% และประสิทธิภาพการฝึกโมเดลขนาดใหญ่ 10%
นอกจากนี้ Tencent ยังได้เปิดตัวไลบรารีการสื่อสารรวมประสิทธิภาพสูง TCCL2.0 ใหม่อีกด้วย ไลบรารีนี้ใช้เทคโนโลยีการสื่อสารแบบขนานที่ต่างกันแบบ NVLINK+NET เพื่อให้เกิดการส่งข้อมูลแบบขนาน เมื่อใช้ร่วมกับอัลกอริธึมการปรับตัวของ Auto-Tune Network Expert ระบบจะสามารถปรับพารามิเตอร์ต่างๆ ได้โดยอัตโนมัติตามความแตกต่างในรุ่น ขนาดเครือข่าย อัลกอริธึมของโมเดล ฯลฯ การอัปเกรดนี้ปรับปรุงประสิทธิภาพการสื่อสารอีก 30% และเพิ่มประสิทธิภาพการฝึกโมเดลขนาดใหญ่อีก 10%
เป็นที่น่าสังเกตว่าการซ้อนทับของเอฟเฟกต์การอัพเกรดของ TiTa และ TCCL ได้เพิ่มประสิทธิภาพการสื่อสารของเครือข่าย Xingmai ขึ้นทั้งหมด 60% และประสิทธิภาพการฝึกโมเดลขนาดใหญ่โดยรวมเพิ่มขึ้น 20% การปรับปรุงประสิทธิภาพที่สำคัญนี้จะช่วยเร่งกระบวนการฝึกอบรมโมเดล AI ได้อย่างมาก และช่วยให้นักวิจัยและนักพัฒนามีสภาพแวดล้อมการทำงานที่มีประสิทธิภาพมากขึ้น
การอัปเกรด Xingmai Network 2.0 แสดงให้เห็นถึงความเป็นผู้นำของ Tencent ในด้านเทคโนโลยีเครือข่ายในหลาย ๆ ด้าน การปรับปรุงประสิทธิภาพที่สำคัญจะส่งผลเชิงบวกต่อการพัฒนาด้านปัญญาประดิษฐ์ ตลอดจนส่งเสริมการฝึกอบรมและการพัฒนาในระดับที่ใหญ่ขึ้นและอีกมากมาย แอปพลิเคชันโมเดล AI ที่ซับซ้อน นี่เป็นก้าวสำคัญสำหรับ Tencent ในการสร้างโครงสร้างพื้นฐาน AI ที่มีประสิทธิภาพสูง