Downcodes小編帶你了解全球最強AI訓練集群Colossus! NVIDIA與xAI強強聯手,打造出由10萬顆NVIDIA Hopper GPU組成的超級電腦集群,其強大的算力將用於訓練xAI的Grok系列大型語言模型,並為X Premium用戶提供聊天機器人服務。這項合作標誌著AI領域技術發展的新高度,也預示著未來AI應用的無限可能。 Colossus的上線,無疑將推動AI技術在各領域的突破性進展,值得我們期待。
今天,NVIDIA(英偉達) 宣布,與xAI 合作打造的Colossus 超級電腦集群正式上線,這可是全球最強AI訓練集群Colossus,整整由10萬顆NVIDIA Hopper GPU 組成。

這個龐然大物之所以能達到這樣的規模,得益於NVIDIA Spectrum-X 乙太網路平台的支援。這個平台專門為多租戶、超大規模的AI 工廠設計,能夠透過標準乙太網路實現遠端直接記憶體訪問,提供卓越的性能。
Colossus 主要用於訓練xAI 的Grok 系列大型語言模型,同時也為X Premium 用戶提供聊天機器人服務。更令人興奮的是,xAI 正在計劃將Colossus 的規模翻倍,屆時將達到20萬顆NVIDIA Hopper GPU。
NVIDIA 的高級副總裁Gilad Shainer 表示,AI 已成為各行各業的關鍵需求,因此對效能、安全性、可擴展性和成本效率的要求也在不斷提升。而Spectrum-X 平台的出現,則為像xAI 這樣的創新者提供了更快的資料處理、分析和執行能力,從而加速AI 解決方案的開發、部署和上市時間。
伊隆・馬斯克也對此表示讚賞,他稱Colossus 為世界上最強大的訓練系統,稱讚了xAI 團隊、NVIDIA 以及他們的眾多合作夥伴的努力。值得一提的是,Colossus 的建造過程相當高效,僅用了122天就完成,而一般情況下,類似規模的系統可能需要數月甚至數年的時間才能完成。從第一台機架進入到訓練開始,整個過程只花了19天。
在這個超級電腦的支援下,Spectrum-X 平台可以提供高達400Gbps 的頻寬,顯著提高資料傳輸速率,降低延遲。這個特性對那些需要快速資料處理和即時分析的企業至關重要。此外,Spectrum-X 也經過最佳化,專門支援AI 應用,使資料路由和管理更為智能,進而提升整體系統效能。
Colossus 架構的設計旨在高效擴展,以應對現代應用產生的海量資料。同時,Spectrum-X 也專注於永續發展,力求在維持高效能的同時,減少資料中心的能源消耗,幫助組織降低碳足跡。
Colossus的成功上線,展現了科技巨頭在AI領域的持續投入與創新能力,也為未來AI技術的發展方向提供了新的參考。相信在不久的將來,我們將看到更多基於Colossus的突破性應用,推動AI技術更好地服務人類社會。期待xAI和NVIDIA帶來更多驚喜!