研究人員啟用全球最快的 AI 超級電腦以滿足運算需求
六千個 NVIDIA A100 GPU 提供高達 4 exaflops 的混合精度運算效能
協助 NERSC 推進科學發展
如此強大的運算力將協助拼湊出宇宙的 3D 立體樣貌、探索綠色能源的次原子交互作用和更多更先進的研究領域。
美國國家能源研究科學運算中心 (NERSC) 今天正式啟用的 Perlmutter 超級電腦,將為超過 7,000 名研究人員提供近 4 exaflops 的人工智慧 (AI) 運算效能。
這使得 Perlmutter 超級電腦在 16 位元和 32 位元混合精度的 AI 數學運算上,成為全球運算速度最快的系統,而這個效能表現還不包括今年稍晚將在勞倫斯柏克萊國家實驗室 (Lawrence Berkeley National Lab;LBNL) 中設置的第二期超級電腦系統。
目前已有二十多個應用將率先發揮 Perlmutter 超級電腦中 6,144 個 NVIDIA A100 Tensor Core GPU 的強大運算實力。這是當今全球搭載 A100 的系統中最龐大的一個,旨在推動天體物理學、氣候科學等領域的發展。
宇宙的 3D 立體地圖
在其中一項研究中,Perlmutter 超級電腦將協助拼湊出迄今規模最大、3D 立體的可見宇宙地圖。它將處理來自暗能量巡天光譜儀 (Dark Energy Spectroscopic Instrument;DESI) 的資料,這是一台宇宙照相機,可以在一次曝光中捕捉到多達五千個星系的影像。
研究人員需要透過 Perlmutter 超級電腦中的 GPU 運算速度來處理一個晚上數十次的曝光資料,以便知道隔天晚上該把 DESI 指向何處。過去使用舊有系統準備發表一年份的資料時,要花費數週或數個月的時間,不過 Perlmutter 超級電腦能夠幫助他們在短短數日內完成這項任務。
NERSC 的資料架構師 Rollin Thomas 正為研究人員使用 Perlmutter 超級電腦準備程式碼,他表示:「我們非常開心可以透過 GPU以 20 倍的作業速度準備這些資料。」
Perlmutter 的堅持不懈得到了回報
DESI 的地圖讓人們可以認識暗能量,也就是宇宙加速膨脹背後的神秘物理學。人們是透過 2011 年諾貝爾獎得主 Saul Perlmutter 的研究,才揭開暗能量的神秘面紗,他是柏克萊實驗室中至今仍十分活躍的天體物理學家,他將會啟用這部以他命名的全新超級電腦。
Rollin Thomas 曾和 Saul Perlmutter 在獲得諾貝爾獎之後的研究專案中合作,他表示:「對我來說,Saul 是個很好的典範,說明了只要有永不滿足的好奇心和一直保持樂觀就能實現目標。」
一部融合 AI 與高效能運算的超級電腦
類似的精神為許多將在 NERSC 全新超級電腦上運行的研究專案提供了動力。舉例來說,材料科學領域的研究致力於探索原子的交互作用,為開發出更好的電池及生物燃料指明方向。
傳統的超級電腦幾乎無法處理用 Quantum Espresso 等程式,在幾奈秒內生成幾個原子的模擬所需的數學運算,但是結合極為精準的模擬與機器學習,科學家可以在更長的時間內研究更多的原子。
NERSC 應用程式效能專家 Brandon Cook 表示:「過去無法對像電池介面這樣的大型系統進行完整的原子模擬作業,但現在科學家們計畫用 Perlmutter 超級電腦來完成這件事。」而 Cook 正協助研究人員啟動此類研究專案。
這就是 A100 中 Tensor Core 的獨到之處,它們既能加速用於模擬的雙精度浮點數學運算,又能加速深度學習所需的混合精度運算。
NERSC 使用 NVIDIA V100 GPU 進行的 BerkeleyGW 研究,在去年 11 月入圍了 Gordon Bell Prize 的決賽,對 NERSC 的表現給予肯定。在 NERSC 率領該專案並掌管應用程式效能的 Jack Deslippe 表示:「A100 的強大運算能力有望進一步提升我們的研究水準。」
軟體協助 Perlmutter 超級電腦展現實力
Jack Deslippe 表示,軟體也是 Perlmutter 超級電腦的重要元素,並指出該系統使用的 NVIDIA HPC SDK 支援 OpenMP 和其它熱門的程式設計模型。
此外,在 GPU 上運行的資料科學開源碼 RAPIDS,將協助加快 NERSC 內人數不斷上升的 Python 工程師團隊處理工作的速度。它在分析 NERSC 旗下 Cori 超級電腦上的所有網路流量研究案中證明了自己的價值,將之前在 CPU 上執行分析工作的速度加快了近 600 倍。
Rollin Thomas 表示:「這讓我們確信,RAPIDS 將在藉由資料加速科學開發領域發揮重要的作用。」
克服新冠肺炎疫情的挑戰
即使新冠肺炎疫情持續蔓延,Perlmutter 超級電腦仍按計畫上線。不過團隊不得不重新思考一些關鍵步驟,像是如何為在家工作的研究人員舉辦黑客松 (hackathon) 活動,為系統 exascale 等級的應用程式編寫程式碼。
同時,慧與科技 (Hewlett Packard Enterprise) 的工程師協助了第一階段的系統組裝,與 NERSC 的工作人員合作設施升級以容納新系統。Rollin Thomas 表示:「我們非常感謝這些人在疫情下的特殊管制期間,還來現場協助我們設置這套系統。」
NVIDIA 創辦人暨執行長黃仁勳在這場虛擬的啟動儀式上,祝賀柏克萊實驗室的工作人員運用 Perlmutter 超級電腦推動科學發展的計畫。黃仁勳表示:「Perlmutter 超級電腦融合 AI 與高效能運算的能力,將讓材料科學、量子物理、氣候預測和生物研究等廣泛領域都有突破性的進展。」
正是 AI 超級電腦派上用場的時候
今日的虛擬剪綵儀式寫下一個極為真實的里程碑。
NERSC 資料與分析服務小組的代理負責人 Wahid Bhimji 表示:「美國能源部不斷試圖將 AI 用於科學領域,把概念驗證用在粒子物理學、材料科學和生物能源等領域的生產案例上。人們一直在探索愈來愈大的神經網路模型,也想要獲得更強大的資源, Perlmutter 超級電腦搭配 A100 GPU、全快閃記憶體檔案系統及串流媒體資料功能,正好滿足了這種對 AI 的需求。」
想要在 Perlmutter 超級電腦上處理研究專案的研究人員,皆可以提交使用申請書
發表迴響