NVIDIA助力 全球最快AI超級電腦啓用

Perlmutter是全球搭載NVIDIA A100的系統中最龐大的超級電腦。(圖/業者提供)

如此強大的運算力將協助拼湊出宇宙的 3D 立體樣貌、探索綠色能源的次原子交互作用和更多更先進的研究領域。美國國家能源研究科學運算中心 (NERSC) 今天正式啓用的 Perlmutter 超級電腦,將爲超過 7,000 名研究人員提供近 4 exaflops 的人工智慧 (AI) 運算效能

這使得 Perlmutter 超級電腦在 16 位元和 32 位元混合精度的 AI 數學運算上,成爲全球運算速度最快的系統,而這個效能表現還不包括今年稍晚將在勞倫斯柏克萊國家實驗室 (Lawrence Berkeley National Lab;LBNL) 中設置的第二期超級電腦系統。

目前已有二十多個應用將率先發揮 Perlmutter 超級電腦中 6,144 個 NVIDIA A100 Tensor Core GPU 的強大運算實力。這是當今全球搭載 A100 的系統中最龐大的一個,旨在推動天體物理學氣候科學等領域的發展。

在其中一項研究中,Perlmutter 超級電腦將協助拼湊出迄今規模最大、3D 立體的可見宇宙地圖。它將處理來自暗能量巡天光譜儀 (Dark Energy Spectroscopic Instrument;DESI) 的資料,這是一臺宇宙照相機,可以在一次曝光中捕捉到多達五千個星系影像

研究人員需要透過 Perlmutter 超級電腦中的 GPU 運算速度來處理一個晚上數十次的曝光資料,以便知道隔天晚上該把 DESI 指向何處。過去使用舊有系統準備發表一年份的資料時,要花費數週或數個月的時間,不過 Perlmutter 超級電腦能夠幫助他們在短短數日內完成這項任務。

NERSC 的資料架構師 Rollin Thomas 正爲研究人員使用 Perlmutter 超級電腦準備程式碼,他表示,我們非常開心可以透過 GPU以 20 倍的作業速度準備這些資料。

DESI 的地圖讓人們可以認識暗能量,也就是宇宙加速膨脹背後的神秘物理學。人們是透過 2011 年諾貝爾獎得主 Saul Perlmutter 的研究,才揭開暗能量的神秘面紗,他是柏克萊實驗室中至今仍十分活躍的天體物理學家,他將會啓用這部以他命名的全新超級電腦。

Rollin Thomas 曾和 Saul Perlmutter 在獲得諾貝爾獎之後的研究專案合作,他表示,對我來說,Saul 是個很好的典範,說明了只要有永不滿足的好奇心和一直保持樂觀就能實現目標

類似的精神爲許多將在 NERSC 全新超級電腦上運行的研究專案提供了動力。舉例來說,材料科學領域的研究致力於探索原子的交互作用,爲開發出更好的電池生物燃料指明方向

傳統的超級電腦幾乎無法處理用 Quantum Espresso 等程式,在幾奈秒內生成幾個原子的模擬所需的數學運算,但是結合極爲精準的模擬與機器學習,科學家可以在更長的時間內研究更多的原子。

NERSC 應用程式效能專家 Brandon Cook 表示,過去無法對像電池介面這樣的大型系統進行完整的原子模擬作業,但現在科學家們計劃用 Perlmutter 超級電腦來完成這件事。而 Cook 正協助研究人員啓動此類研究專案。

這就是 A100 中 Tensor Core 的獨到之處,它們既能加速用於模擬的雙精度浮點數學運算,又能加速深度學習所需的混合精度運算。

NERSC 使用 NVIDIA V100 GPU 進行的 BerkeleyGW 研究,在去年 11 月入圍了 Gordon Bell Prize 的決賽,對 NERSC 的表現給予肯定。在 NERSC 率領該專案並掌管應用程式效能的 Jack Deslippe 表示,A100 的強大運算能力有望進一步提升我們的研究水準

Jack Deslippe 表示,軟體也是 Perlmutter 超級電腦的重要元素,並指出該系統使用的 NVIDIA HPC SDK 支援 OpenMP 和其它熱門程式設計模型

此外,在 GPU 上運行的資料科學開源碼 RAPIDS,將協助加快 NERSC 內人數不斷上升的 Python 工程師團隊處理工作的速度。它在分析 NERSC 旗下 Cori 超級電腦上的所有網路流量研究案中證明了自己的價值,將之前在 CPU 上執行分析工作的速度加快了近 600 倍。

Rollin Thomas 表示,這讓我們確信,RAPIDS 將在藉由資料加速科學開發領域發揮重要的作用。

即使新冠肺炎疫情持續蔓延,Perlmutter 超級電腦仍按計劃上線。不過團隊不得不重新思考一些關鍵步驟,像是如何爲在家工作的研究人員舉辦黑客鬆 (hackathon) 活動,爲系統 exascale 等級的應用程式編寫程式碼。

同時,慧與科技 (Hewlett Packard Enterprise) 的工程師協助了第一階段的系統組裝,與 NERSC 的工作人員合作設施升級以容納新系統。Rollin Thomas 表示,我們非常感謝這些人在疫情下的特殊管制期間,還來現場協助我們設置這套系統。

NVIDIA 創辦人執行長黃仁勳在這場虛擬的啓動儀式上,祝賀柏克萊實驗室的工作人員運用 Perlmutter 超級電腦推動科學發展的計劃。黃仁勳表示,Perlmutter 超級電腦融合 AI 與高效能運算的能力,將讓材料科學、量子物理、氣候預測和生物研究等廣泛領域都有突破性的進展。

NERSC 資料與分析服務小組的代理負責人 Wahid Bhimji 表示,美國能源部不斷試圖將 AI 用於科學領域,把概念驗證用在粒子物理學、材料科學和生物能源等領域的生產案例上。人們一直在探索愈來愈大的神經網路模型,也想要獲得更強大的資源, Perlmutter 超級電腦搭配 A100 GPU、全快閃記憶體檔案系統及串流媒體資料功能,正好滿足了這種對 AI 的需求。