超級計算機:從零起步贏得速度、應用“雙優勢”

高性能超級計算機,是世界發達國家爭搶的重要“制高點”,對國家安全、經濟和社會發展,具有舉足輕重的支持作用。因此加快發展超級計算機,推廣超級計算機應用,對於我國科學研究、推動科技創新和促進經濟社會高質量發展意義重大。

40多年來,我國超級計算機經歷了從無到有、從跟跑到局部領先、從關鍵核心技術引進到實現自主可控的艱難發展歷程。

勇於突破封鎖,我國超算技術不再受制於人

“多年來,中、美、日等國在超級計算機領域競爭,實際就是科技實力與綜合國力的競爭。”中國科學院計算技術研究所研究員張雲泉說,我國幾代超算人前赴後繼,創造出了不起的“奇蹟”。截至目前,天河二號、“神威太湖之光”等國產超級計算機,在國際超級計算機大賽上,共拿下10個世界第一。

在國家超級計算無錫中心主任楊廣文的記憶中,上世紀70年代,首臺超級計算機問世後,國際上對超級計算機的需求猛增。發達國家在重點產業領域,利用超級計算機取得了多方面的突破。當時,美國、日本等國在一些關鍵核心技術上,對中國全面封鎖。

那時,我國由於沒有高性能的計算機,部分石油礦藏數據和資料不得不用飛機送去國外處理,不僅費用昂貴,而且受制於人。

當時,我國曾向某發達國家提出進口一臺性能不算很高的超級計算機,對方卻回覆:必須要爲這臺機器建一個六面不透光的“安全區”,能進入“安全區”的只能是巴黎統籌組織的工作人員。

1978年,黨的十一屆三中全會召開,拉開了改革開放的序幕。也就是在這一年,我國正式啓動巨型計算機研製工作。

“爲什麼要研製自己的巨型計算機?因爲中國要搞四個現代化,不能沒有巨型計算機!”楊廣文告訴科技日報記者,超級計算機由大量的計算節點組成,每個計算節點由一些CPU(中央處理器)組成,計算節點由高速互聯網絡連接起來。除此之外,整個系統還包括大規模存儲系統、系統軟件、應用軟件和冷卻系統等。因此短時間內,我國要想在超級計算機核心技術上取得重大突破、跑在世界前列,不是一件容易事。

然而,我國的科研人員並未被眼前的困難嚇倒。當時,他們腦子裡只有一個念頭:早日造出中國人自己的巨型計算機,技術上不再受制於人。

從1978年到1983年,這5年裡,承擔此項任務的研發團隊,沒日沒夜的頑強拼搏,解決了無數個基礎理論、技術和製造工藝問題,攻克了數以百計的關鍵技術難關,創造性地提出了“雙向量陣列”結構並完成整體設計,比原計劃提前一年成功研製出“銀河-Ⅰ”巨型計算機。

1983年12月26日,我國第一臺億次巨型計算機“銀河-Ⅰ”正式通過國家技術鑑定,系統達到並超過了預定的性能指標,機器整體穩定可靠,且經費只用了原計劃的1/5。

這標誌着中國成爲世界上少數幾個能夠獨立設計和研製億次巨型計算機的國家。

面向國家需求,實現真正安全自主可控

“從2002年之後,經過15年的高速發展,中國超算實現了安全、自主、可控。”楊廣文說

近10年來,我國從基於自主可控超級計算機系統的軟件與應用、服務於國家特殊需要和高新技術產業發展考慮,重新佈局了超級計算機的研製工作。

“十三五”國家重點研發計劃設立了“高性能計算”重點專項,在高性能計算機研製、系統軟件及應用等方面給予佈局支持。其中,研製“神威・太湖之光”就是國家重點組織開展的一項重大科研任務

2013年4月22日,江蘇省人民政府正式提出在無錫市建設10億億次超級計算中心,得到科技部的支持;2014年3月5日,科技部同意“高效能計算機及應用服務環境(二期)”重大項目立項;2015年12月31日,“神威・太湖之光”超級計算機研製完成。

用相關專家的話來說,隨着“神威・太湖之光”超級計算機和“申威26010”處理器等標誌性成果的出現,打破了長期以來國產超級計算機平臺無“芯”可用的局面,奠定了安全、自主、可控的國產平臺技術基礎。

記者瞭解到,“神威・太湖之光”超級計算機由40個運算機櫃和8個網絡機櫃組成。每臺運算機櫃包含4個由32塊運算插件組成的超節點,每塊插件由4個運算節點板組成,一個運算節點板又包含兩塊“申威26010”高性能處理器。

“一臺機櫃就有1024塊處理器,‘神威・太湖之光’共有40960塊處理器。”楊廣文說。

值得一提的是,“神威・太湖之光”也是我國第一臺全部採用國產處理器構建的超級計算機。截至目前,其以每秒9.3億億次的浮點運算速度,連續4次在全球超級計算機比賽中奪冠。其中,2016年11月,“神威・太湖之光”以較大的運算速度優勢再次奪得世界超算冠軍,基於該超級計算機運行的高性能計算應用項目獲得國際高性能計算應用領域最高獎――“戈登貝爾”獎,成爲我國高性能計算應用發展的一個里程碑式的成就。

“讓基於自主可控超級計算機系統的軟件與應用登上國際巔峰,做強國產軟件,這是我們超算人的追求與夢想。”國家超級計算無錫中心研發中心主任甘霖說。

比拼應用水平,讓大機器發揮出大作用

“超級計算機爲解決工程和科學中的重大難題而生。”國家超級計算無錫中心副主任付昊桓說,衡量超級計算機的價值,不能只看運算速度,還要看應用水平。

“比拼誰的超級計算機‘跑’得更快,這種競賽曾一度在中、美、日、韓等國之間進行。不過,現在大家比的是,超級計算機能被用在什麼領域,這成爲如今競爭的關鍵點。”楊廣文說。

那麼,該如何讓大機器發揮出大威力?

在楊廣文看來,國家超級計算無錫中心主要的職責就是運維,運維的目的就是用好這臺超級計算機。

近7年來,國家超級計算無錫中心的科研團隊不負衆望,將理論與實踐相結合,通過開展跨學科、跨單位的廣泛交叉合作,使基於“神威・太湖之光”系統的並行應用成果頻出。其中,利用“神威・太湖之光”超級計算機每秒10億億次的超強計算力,研發出的有關氣候模擬、地震模擬、工業仿真、生物醫藥等領域的一系列國產應用軟件,助力我國基礎研究和工程創新,展示了國產超級計算機硬件與軟件相結合的巨大潛力。

2017年11月17日,在美國丹佛舉行的全球超級計算大會上,由中國科研團隊完成的“非線性地震模擬”再獲“戈登貝爾”獎。利用“神威・太湖之光”的強大計算能力,該團隊成功地設計實現了高可擴展性的非線性地震模擬工具。該工具首次實現了對唐山大地震發生過程的高分辨率精確模擬,使得科學家可以更好地理解唐山大地震所造成的影響,並對未來地震預防預測等具有重要的借鑑意義。

此外,楊廣文表示,超級計算機還能爲人工智能領域的深度學習服務。“現在,許多IT公司的技術負責人找到我們,主要因爲我們開發了大量基於深度學習算法的並行軟件,研發了一個深度學習平臺swCaffe。目前,我們已開展的、基於超級計算機的深度學習應用,包括圍棋、語音識別、醫學圖像識別、遙感圖像分類、地震波餘震特徵識別、大規模冷凍電鏡生物大分子模型高精度重構等。”楊廣文說。

楊廣文告訴記者,目前國家超級計算無錫中心“神威・太湖之光”系統運行穩定,用戶數量不斷增加,機器利用率已超過50%,已完成200多項百萬核大型問題的求解任務,涉及航空航天、先進製造、生物醫藥、新材料、新能源等重點領域,有效地支持了國家科學研究與產業創新。

這些重要的應用成果在國內外引起了巨大反響,這證明“神威・太湖之光”能夠支持具有戰略需求的挑戰性應用,並向世界展示了中國超級計算機的國際地位和重要影響力。

值得一提的是,近年來,國家超級計算無錫中心高度重視人才引進與培育。目前,該中心擁有國內外特聘專家30餘人,專業涉及計算機軟硬件開發、氣象氣候、生物基因、海洋物理、力學、大數據、雲計算等。此外,該中心每年還承擔清華大學在讀博士生、碩士生的培養任務。

楊廣文表示,未來我國科研團隊將繼續圍繞提升國家科技創新能力,以“神威・太湖之光”超級計算機爲基礎, 進一步解決氣候、環境、生命、材料和製造等領域的重大科學問題,研究高性能計算的核心技術、提升高性能計算的應用水平、培養高性能計算人才,爲我國基礎研究及產業發展提供強有力的支撐。