英特爾透過oneAPI與Intel Server GPU實踐XPU願景

英特爾首款針對資料中心的獨立圖形處理單元,基於Xe-LP微架構的Intel Server GPU登場,針對高密度、低延遲Android雲端遊戲媒體串流設計。圖/英特爾提供

英特爾宣佈歷時多年的關鍵里程碑,使用一致軟體體驗提供混合式架構。將於12月推出Intel oneAPI開發工具包完成版(gold release of Intel oneAPI Toolkits),透過結合英特爾硬體與軟體的設計方式,於軟體堆疊架構當中提供嶄新能力。英特爾首款針對資料中心的獨立圖形處理單元,基於Xe-LP微架構的Intel Server GPU亦同步登場,特別針對高密度、低延遲Android雲端遊戲與媒體串流所設計。

英特爾架構長、資深副總裁暨架構、繪圖與軟體總經理Raja Koduri表示,這是英特爾頗具企圖心的oneAPI與XPU旅程的重要時刻,藉由完成版oneAPI開發工具包的推出,英特爾從熟悉的CPU設計開發程式庫,延伸開發者體驗並導入我們的向量-矩陣-空間體系架構。我們更發表首款使用Xe-LP架構的資料中心GPU,鎖定快速成長的雲端遊戲與媒體串流市場

隨着全球進入數十億智慧型裝置與資料量爆炸性飛漲的世代,焦點逐漸從單一處理器本身,移往橫跨CPU、GPU、FPGA以及其它加速器的混合式架構。英特爾將這些統合、描繪成「XPU」願景。藉由Intel Server GPU的推出,讓英特爾於XPU世代提供進一步的延伸。

運算世代亦需要全方位的軟體堆疊架構。開發者能夠存取英特爾的oneAPI開發工具包,橫跨Intel XPU具備通用、開放,與基於標準程式設計模型;其可發揮硬體的效能潛力,同時降低軟體開發與維護支出,並可減少佈署加速運算於專屬、特定廠商解決方案的風險。

關於Intel oneAPI開發工具包完成版:於SuperComputing 2019首次發表,oneAPI產業倡議是針對統一與簡化跨架構程式設計模型的無畏願景,提供不受限於獨有技術(proprietary lock-in)的堅定效能,更開啓整合舊有程式碼的可能性。透過oneAPI,開發者能夠針對他們欲解決的特定問題,選擇最佳的架構,無需爲下一世代架構與平臺而重新編寫軟體。

Intel oneAPI開發工具包利用先進硬體能力與指令的所有優勢,諸如CPU的Intel AVX-512與Intel DL Boost,以及XPU所提供的獨特功能。奠基於長遠且經過市場證明的英特爾開發者工具,Intel oneAPI開發工具包在延續現有的程式碼前提之下,提供相似的開發語言與標準。

英特爾發表的oneAPI開發工具包完成版將於12月發佈,於本機電腦或Intel DevCloud使用均免費,包含英特爾技術諮詢工程師全球支援的商業版本也隨之提供。英特爾將立即轉換Intel Parallel Studio XE與Intel System Studio工具套件至對應的oneAPI產品

除此之外,開發者可以透過Intel DevCloud於多種英特爾架構測試程式碼與工作負載,該雲端開發平臺正擴展加入新款Intel Xe Graphics硬體。英特爾Iris Xe MAX Graphics即日起供公開存取使用,特定開發者亦可使用英特爾Xe-HP。

oneAPI已得到業界的支援,包含近期來自Microsoft Azure與TensorFlow的背書,具備領先地位的研究機構、公司及大學同樣支持oneAPI。

除此之外,美國伊利諾大學貝克曼高等科技研究所(The University of Illinois Beckman Institute for Advanced Science and Technology)宣佈建立新的oneAPI卓越中心(center of excellence,CoE),使用oneAPI程式設計模型,延伸生命科學應用程式奈米級分子動力學(NAMD)至額外的運算環境。NAMD用以模擬大型生物分子系統,幫助應對諸如COVID-19的現實世界挑戰。oneAPI卓越中心與瑞典斯德哥爾摩大學(SeRC)一同致力於GROMACS分子動力學模擬程式,德國海德堡大學則專注於提供其它供應商GPU的oneAPI支援。

關於新款Intel Server GPU:藉由首款針對資料中心的獨立GPU,英特爾更進一步擴展可強化雲端遊戲與媒體體驗的平臺創新豐富套件。結合Intel Xeon Scalable處理器、開放原始碼與授權軟體要素、新款Intel Server GPU,以較低整體擁有成本(TCO)的方式,針對Android雲端遊戲與即時OTT(Over-The-Top)影像串流的高密度媒體轉碼/編碼,提供高密度、低延遲解決方案。

Intel Server GPU基於Xe-LP微架構,爲英特爾最具能源效率的繪圖架構,提供低功耗、獨立SoC(System-on-Chip) 設計,具備128bit管線與板載8GB獨立低功耗DDR4(LPDDR4)記憶體

藉由搭配使用Intel Server GPU與Intel Xeon Scalable處理器,服務供應商能夠將繪圖容量規模獨立於伺服器數量之外,單一系統即可支援大量的串流數量與訂閱戶,並依舊達成低總擁有成本。H3C的3/4長度、全高PCIe Gen3 x16 擴充卡結合4個Intel Server GPU封裝,取決於特定遊戲與伺服器組態的不同,能夠同時支援超過100個Android雲端遊戲使用者,於典型的雙卡系統最高同時支援160個使用者。開發者能夠得益於當今Media SDK的通用API,明年將整合進入oneAPI Video Processing Library。英特爾正與多個軟體與服務夥伴合作,包含GameStream、騰訊、Ubitus,將Intel Server GPU帶往市場。

騰訊先遊雲遊戲平臺副總經理方亮表示,英特爾是我們Android雲端遊戲解決方案的重要合作伙伴。Intel Xeon Scalable處理器與Intel Server GPU提供高密度、低延遲、低功耗、低總體擁有成本的解決方案。在每個雙卡伺服器,能夠爲我們最熱門的遊戲,例如「王者榮耀」、「傳說對決」,建立超過100個遊戲實例。

搭載Xe-LP的Intel Server GPU現正出貨中。隨着近日推出的Intel Iris Xe MAX Graphics,英特爾逐步增加推行Xe架構產品與軟體的力道,以GPU改善全球使用者的視覺運算體驗。

英特爾成功地從入門級至高效能運算(HPC)擴展GPU的核心策略之一,即爲實作單一程式碼基礎。爲朝向此願景前進,英特爾的軟體堆疊架構如今支援多個世代的繪圖產品,包含近期發表搭載Iris Xe 整合繪圖核心的第11代Intel Core處理器,以及Intel Iris Xe獨立式繪圖晶片。拓展程式碼基礎至廣泛使用Linux的資料中心產品,爲可擴展Xe架構策略的關鍵性下一步。英特爾最佳化Linux驅動程式,致力於作業系統之間的程式碼覆用,更注重提升Linux 3D效能,如今提供3個經過完整驗證,並整合可發行的堆疊架構。

英特爾揭示創設Flipfast專案,藉以提升Linux遊戲體驗。Flipfast堆疊架構允許使用者於虛擬機(VM)執行圖形應用程式時保有原生GPU效能,主機全面整合主機與虛擬機之間的zero-copy分享。Flipfast堆疊驅動程式增加遊戲效能,其技術直接套用於資料中心遊戲串流應用程式。

英特爾發表Intel Implicit SPMD Program Compiler程式編譯器(ISPC),將執行於oneAPI的Level Zero之上,提供oneAPI平臺設備量身打造的低階、直接接觸介面,爲整體硬體抽象層。由oneAPI所支援的ISPC爲C程式設計語言的變體,賦予單一程式、多重資料的設計方式,並用來加速英特爾CPU的Intel OSPRay光線追蹤引擎。英特爾正將Xe支援性加入至ISPC,以便無縫加速諸如OSPRay的Intel oneAPI 渲染工具元件。

英特爾於2020年11月12日至13日舉行線上oneAPI開發者高峰會創新者、研究者與開發者將展示40項使用oneAPI的合作與專案。主題範圍從運算COVID-19舊藥新用測試、到預測農作物收成。本週開幕的SuperComputing 2020,英特爾與產業領袖以及研究機構透過主題演講、技術會議、爐邊對話、展示以及其它活動,持續宣傳oneAPI與oneAPI工具。

Intel oneAPI和繪圖軟體堆疊架構更新,以及Intel Server GPU的初登場,代表着英特爾朝向XPU架構旅程的歷史性步伐。這些發展提供英特爾科技六大創新支柱(Intels six pillars)更具意義的經驗基礎,並以oneAPI開放標準的單一可擴展軟體抽象層,讓異質架構成爲可能。