Hewlett Packard Enterprise(NYSE: HPE)在2024年的ISC High Performance大會上宣布與英特爾合作,將HPE第二台百萬兆級超級電腦Aurora交付給美國能源部的阿貢國家實驗室。Aurora只利用87%系統資源便可以達到1.012 Exaflops的運算能力,被超級電腦排行榜TOP500譽為全球第二快的超級電腦。HPE是全球超級電腦領導品牌,而Aurora不僅是HPE第二台百萬兆級系統,也是全球最大型、具備AI能力的系統。此外,Aurora僅使用系統89%便達到 10.6 Exaflops的運算能力,在HPL混合精度(MxP)基準測試中名列第一。
「我們很榮幸能夠在百萬兆級運算領域再次締造重要里程碑。Aurora的強大運算力將有助於實現突破性的科學發現,並解決世界上最棘手的問題,」HPE資深副總裁暨HPC與AI基礎架構解決方案總經理Trish Damkroger表示。「能與美國能源部、阿貢國家實驗室和英特爾緊密合作,並成功開發如此巨大規模和運算能力的系統,我們深感自豪。除了運用三方的創新工程技術以及跨團隊合作外,最重要的成功關鍵在於,我們擁有共同的價值觀,也就是提供頂尖科技以推動科學發展並造福人類。」
百萬兆級運算系統每秒可處理百萬兆次運算,這種規模的運算能力能幫助人類解決最複雜的問題。Aurora使用HPE Cray EX超級電腦所建造而成,專為支援百萬兆級的規模和運算等級而設計。此系統搭載了與乙太網路相容的開放式超級運算互連技術HPE Slingshot,成為這項技術在單一系統上最大規模的部署。此互連技術將Aurora的75,000個運算節點、2,400個儲存與服務網路端點以及5,600個交換器連接在一起,以提高效能並提供大規模的AI運算能力。透過在10,624台運算刀鋒(Blade)伺服器、21,248個 Intel® Xeon® CPU Max系列處理器和 63,744個Intel® Data Center GPU Max系列之間進行高速網路連接,Aurora堪稱全球最大GPU叢集之一。
Aurora一開始便被設計為具備AI能力的系統,因此研究人員能夠在Aurora上使用生成式AI模型來加速科學探索的進程。研究人員已在Aurora上運行的AI研究包括,透過大腦映射更有效理解人類大腦中的800億個神經元、藉由深度學習加強研究高能粒子物理,以及使用機器學習技術加速藥物設計和發現等等。
「Aurora是獨一無二的超級電腦,我們預期它將成為研究人員的革命性工具,」阿貢國家實驗室副主任暨傑出院士Rick Stevens 表示。「在美國實現第二台百萬兆級系統是極其重要的里程碑,對於全球各地推展開放科學計畫有極大助益。」
Aurora百萬兆級超級電腦是HPE、英特爾、美國能源部和阿貢國家實驗室等政府單位與民營企業密切合作的成果。這些組織透過共同投資與開發,創造出推動科學發展所需的突破性工程技術。Aurora早期科學計劃(Aurora Early Science Program)的工作成果證明公私部門的合作對科學發展至關重要。在系統最佳化和壓力測試過程中,研究人員已成功在該系統上運行各種編程模型、語言和應用程式。
「Aurora超級電腦的目的是支援高效能運算(HPC)和AI領域的研究和科學社群,」英特爾副總裁暨資料中心與AI解決方案總經理Ogi Brkic表示。「透過與阿貢國家實驗室和HPE的持續合作,我們在早期科學領域取得了令人振奮的成果。隨著我們持續優化系統效能以加速科學發展並邁向下一個里程碑,我們期待看到更多精彩成果。」
Aurora在所有節點中僅使用了9,234個節點便達到百萬兆級的運算能力。Aurora是設置於阿貢領導運算設施(ALCF)的開放式科學系統,隸屬於美國能源部科學辦公室的用戶設施。
影片:HPE Neil MacDonald介紹百萬兆級超級電腦—Aurora